JP2016523397A - 情報認識のための方法及びシステム - Google Patents

情報認識のための方法及びシステム Download PDF

Info

Publication number
JP2016523397A
JP2016523397A JP2016516260A JP2016516260A JP2016523397A JP 2016523397 A JP2016523397 A JP 2016523397A JP 2016516260 A JP2016516260 A JP 2016516260A JP 2016516260 A JP2016516260 A JP 2016516260A JP 2016523397 A JP2016523397 A JP 2016523397A
Authority
JP
Japan
Prior art keywords
zone
card
character
character zone
image frame
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2016516260A
Other languages
English (en)
Other versions
JP6255486B2 (ja
Inventor
リー・ヤン
チェン・グオ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alipay com Co Ltd
Original Assignee
Alipay com Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alipay com Co Ltd filed Critical Alipay com Co Ltd
Publication of JP2016523397A publication Critical patent/JP2016523397A/ja
Application granted granted Critical
Publication of JP6255486B2 publication Critical patent/JP6255486B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/60Type of objects
    • G06V20/62Text, e.g. of license plates, overlay texts or captions on TV images
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/73Deblurring; Sharpening
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/1444Selective acquisition, locating or processing of specific regions, e.g. highlighted text, fiducial marks or predetermined fields
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Character Input (AREA)
  • Character Discrimination (AREA)
  • Image Analysis (AREA)

Abstract

【解決手段】本出願の実施形態は、情報認識のための方法、情報認識のためのシステム、及び情報認識のためのコンピュータプログラム製品に関する。情報認識のための方法が提供される。この方法は、複数のフレームを含むカード画像フレームシーケンス内の各フレームに対してカードゾーンを位置特定し、各カードゾーン内において情報ゾーンを位置特定し、各情報ゾーンを少なくとも1つの文字ゾーンに分割し、カード画像フレームシーケンス内の全てのフレームにわたって同じ領域に対応している文字ゾーンをぼけ修正し、ぼけ修正された文字ゾーンに基づいて、文字列情報を認識することを備える。【選択図】図1B

Description

[関連出願の相互参照]
本出願は、あらゆる目的のために、参照によって本明細書に組み込まれる、2013年6月3日に出願され、発明の名称を「INFORMATION RECOGNITION METHOD,EQUIPMENT AND SYSTEM(情報認識の方法、機器、及びシステム)」とする中国特許出願第201310216611.5号に基づく優先権を主張する。
本出願は、情報認識のための方法及びシステムに関する。
インターネットの発展に伴って、オンライン決済、携帯電話を利用した決済、及びその他のエクスプレス決済が、益々広まっている。通常、クレジットカードのユーザは、そのカード情報を直接入力する。入力速度を上げるために、ユーザは、ときには、画像取り込み機器を使用してクレジットカード情報及び補助情報を取得する。
今日市場に出ているアプリケーションの多くは、シングルフレーム画像を収集し、そのシングルフレーム画像を処理して目的領域を取得し、次いで、これらの取得された目的領域に対して画像処理及び光学式文字認識を実施することができる。収集されたクレジットカード画像は、例えば、画像取り込み機器の受光素子の限界及び環境からの影響ゆえに、被写体ぼけやノイズなどの問題を有する。システムにとって、取り込まれた画像の品質の悪さを回避することは困難であり、したがって、その画像内においてカードゾーンの位置を定めることも困難である。場合によっては、カード上の一部の文字ゾーンが明瞭である一方で、カード上のその他の文字ゾーンはぼやけていることがある。条件の違いを区別することなく均一に処理を行う現行のシングルフレーム処理方法が用いられる場合は、正しく認識される文字がある一方で、容易に認識されずひいては認識に失敗する文字がある。
本発明の様々な実施形態が、以下の詳細な説明及び添付の図面で開示される。
ここで説明される図面は、本出願の理解を深めることを意図しており、本出願の一部を構成する。本出願の代表的な実施形態及びその説明は、本出願の説明を意図しており、本出願を不適切に制限することはない。
カードゾーンの一例を示す図である。
情報認識のためのプロセスの一実施形態を示すフローチャートである。
文字ゾーンをぼけ修正するためのプロセスの一実施形態を示すフローチャートである。
文字ゾーンの明瞭度を計算するためのプロセスの一実施形態を示すフローチャートである。
情報認識のためのデバイスの一実施形態を示す構造ブロック図である。
ぼけ修正モジュールの一実施形態を示す構造ブロック図である。
明瞭度計算モジュールの一実施形態を示す構造ブロック図である。
情報認識のためのシステムの一実施形態を示す構造ブロック図である。
情報認識のためのプログラムドコンピュータシステムの一実施形態を示す機能図である。
本発明は、プロセス、装置、システム、合成物、コンピュータ読み取り可能ストレージ媒体に実装されたコンピュータプログラム製品、並びに/又は接続先のメモリに記憶された命令及び/若しくは接続先のメモリによって提供される命令を実行するように構成されたプロセッサ等のプロセッサなどの、数々の形態で実現可能である。本明細書では、これらの実現形態、又は本発明がとりえるその他のあらゆる形態を、技術と称することができる。総じて、開示されるプロセスの各ステップの順番は、本発明の範囲内で変更可能である。別途明記されない限り、タスクを実施するように構成されるものとして説明されるプロセッサ又はメモリなどのコンポーネントは、所定時にタスクを実施するように一時的に構成された汎用コンポーネントとして、又はタスクを実施するように製造された特殊コンポーネントとして実装可能である。本明細書で使用される「プロセッサ」という用語は、コンピュータプログラム命令などのデータを処理するように構成された1つ以上のデバイス、回路、並びに/又は処理コアを言う。
本発明の原理を例示す添付の図面とともに、以下で、本発明の1つ以上の実施形態の詳細な説明が提供される。本発明は、このような実施形態に関連付けて説明されるが、いずれの実施形態にも限定されない。本発明の範囲は、特許請求の範囲によってのみ限定され、本発明は、数々の代替形態、変更形態、及び均等物を包含している。以下の説明では、本発明の完全な理解を与えるために、数々の具体的詳細が明記されている。これらの詳細は、例示を目的として提供されるものであり、本発明は、これらの詳細の一部又は全部を伴わずとも、特許請求の範囲にしたがって実施可能である。明瞭を期するために、本発明に関連した技術分野で知られる技術要素は、本発明が不必要に不明瞭にされないように、詳細な説明を省略されている。
原シングルフレーム画像処理プロセスをマルチフレーム画像シーケンスに導入するための方法が提供される。ポータブル端末上のカメラなどの画像取り込みデバイスによって、情報収集元となるクレジットカード又はIDカードなどの標準的なカードに対してビデオストリームサンプリング又はマルチ画像サンプリングが実施される。次いで、画像取り込みデバイスは、サンプリングされたビデオストリームの複数のフレーム又は複数の画像のなかの文字ゾーンに対して個別にぼけ修正を実施し、複数のフレームのなかから認識に適さない文字ゾーンをフィルタリングによって排除し、認識に適した文字ゾーンを保存し合体させて上記カードのための文字列情報認識結果を得る。一部の実施形態では、カード情報は、ポータブル端末のアプリケーションインターフェースに迅速に且つ便利に且つ正確に入力される。
図1Aは、カードゾーンの一例を示す図である。カードゾーンは、画像における矩形領域を指す。画像は、アプリケーションウィンドウの中に見ることができる。矩形領域の四辺は、カードの四辺に対応している。一部の実施形態では、技術は、複数のフレームを使用してフィルタリングを行って明瞭な文字を取得し、次いで、認識を実施して文字列情報を取得する。例えば、例えばフレームiなどの第1のフレームにおける或る文字ゾーン内の或る文字が明瞭でない、すなわちピンぼけしている場合は、そのフレームiにおけるその文字をスキップし、例えばフレームi+1などの次のフレームにおける同じ文字ゾーン内の文字を、もしその文字が明瞭であれば使用することができる。
図1Bは、情報認識のためのプロセスの一実施形態を示すフローチャートである。一部の実施形態では、プロセス100は、図7のサーバ又は情報認識機器720によって実行され、以下を含む。
一部の実施形態では、ポータブルコンピュータ、パームトップコンピュータ、又は携帯電話などのポータブル端末を通じてオンライン決済を行うにあたり、カード番号又は有効期限などのクレジットカード情報を入力するときに、ユーザは、ポータブル端末上のカメラなどの画像取り込みデバイスを通じてクレジットカード情報を認識及び入力する。
ある例では、ユーザは、画像取り込みデバイスを通じて(例えばビデオ取り込みアプリケーションの使用によって)クレジットカードのビデオストリームを取り込む、又は画像取り込みデバイスによって(例えば複数の写真を撮ることによって)クレジットカードの複数のシングルフレーム画像を取り込む。別の例では、ユーザは、画像取り込みデバイスによって、クレジットカードの複数のシングルフレーム画像及びビデオストリームの両方を取り込む。
一部の実施形態では、ユーザは、取り込んだ複数のシングルフレーム画像及び/又はビデオストリームを画像取り込みデバイス又はポータブル端末のキャッシュに保存し、サーバは、このキャッシュから、後ほど画像解析を実施するために画像フレームシーケンスを取得する。
操作110において、サーバは、カード画像フレームシーケンス内の各フレームに対してカードゾーンの位置特定を行う。
一部の実施形態では、画像フレームシーケンスは、複数の取り込み画像からのシングルフレーム画像の集合に相当する(例えば複数の写真)、又は画像フレームシーケンスは、キャッシュ内の連続したビデオストリーム(例えばビデオストリームの一部分)から選択されている。一部の実施形態では、画像フレームシーケンスは、既定の数の連続フレームを含む、又は画像フレームシーケンスは、所定の数のフレームから一定間隔で選択された既定の数の非連続フレームに相当する。一例として、非連続フレームは、3つに1つのフレームに相当する。一部の実施形態では、画像フレームシーケンス内のフレームの数は、具体的な実行形態に応じて異なる。例えば、画像フレームシーケンス内のフレームの数は、10を超えない。別の例では、画像フレームシーケンス内のフレームの数は、3又は5である。
一部の実施形態では、カードゾーンは、任意の既知の位置特定技術に基づいて、各フレーム内において位置特定される。既知の位置特定技術の例として、統計調査に基づく物体検出や、テンプレート整合に基づく物体検出などが挙げられる。一部の実施形態では、カードゾーンは、所定の形状、所定のサイズ、カード面に固有な特徴、又はこれらの任意の組み合わせに基づいて、画像フレームシーケンス内の各フレーム内において位置特定される。
例えば、クレジットカードは、国際基準に基づいて作成される。クレジットカードは、標準のサイズ及び形状を有し、カード番号及び有効期限などの文字情報は、カード上において比較的決まった位置を有する。また、文字情報には、特定の形式がある。したがって、カードゾーンは、これらの文字の位置に基づいて、画像フレーム内において位置特定することができる。一部の実施形態では、サーバは、先ずカードゾーンを位置特定し、次いで数字ゾーンを位置特定する。
一部の実施形態では、カードゾーンの位置解析を実施しつつ、目測によって現フレームが十分に鮮明でないと評価される場合、すなわちカードゾーンの位置が特定できない場合、サーバは、現フレームを破棄し、キャッシュから次のフレームを取得し、取得された次のフレームに対して解析を実施する。例えば、ブレナ勾配を使用してフレームの鮮明度が計算され、この計算されたフレーム鮮明度は閾値と比較することができ、もし、計算されたフレーム鮮明度が閾値を上回る場合は、フレームは、十分に鮮明であると判断される。
サーバは、上記の実施形態で説明された手法だけでなく、当該分野で既知である手法又は今後開発される手法を含む任意の適切な手法を使用して、画像フレーム内においてカードゾーンを位置特定することができる。
操作120において、サーバは、各カードゾーン内に位置する少なくとも1つの情報ゾーンを位置特定する。
一部の実施形態では、サーバは、カード内における情報ゾーンの既定の位置、情報ゾーンの既定のサイズ、情報ゾーンの既定の形状、又はこれらを任意に組み合わせた特性に基づいて、位置特定されたカードゾーン内において情報ゾーンを位置特定する。情報ゾーンとして、例えば、カード番号ゾーン、有効期限ゾーン、カード名義人ゾーン、セキュリティコードゾーン、カード上に見られるその他の任意のタイプの情報、又はこれらの任意の組み合わせが挙げられる。
一例として、上記のように、クレジットカードは、国際基準にしたがって作成される。例えば、カード番号や有効期限などの情報ゾーンの相対位置は、カード面上で決まっており、これらの情報ゾーンは、特定の形状を有する。87mm×55mmのカードを一例として使用すると、カードの左上隅が原点とされ、カードの長さがX軸であり、カードの高さがY軸である。通常、数字は、長さが68mmで高さが5mmの領域における10mm×30mm付近に見られる。したがって、サーバは、上記のこれらの特性に基づいて、カードゾーン画像内において情報ゾーンを位置特定する。
サーバは、上記の実施形態で説明された手法だけでなく、当該分野で既知である手法又は今後開発される手法を含む任意の適切な手法を使用して、カードゾーン内において情報ゾーンを位置特定することができる。
操作130において、サーバは、各情報ゾーンを個々の文字ゾーンに分割する。
一部の実施形態では、サーバは、位置特定された情報ゾーンを、情報ゾーン内における文字の間隔、文字の数、文字のサイズ、又はこれらを任意に組み合わせた特性に基づいて、少なくとも1つの文字ゾーンに分割する。例えば、文字ゾーンは、1つの数字又は文字を含む。
一部の実施形態では、サーバは、上記の実施形態で説明された手法だけでなく、当該分野で既知である手法又は今後開発される手法を含む任意の適切な手法を使用して、情報ゾーンを少なくとも1つの文字ゾーンに分割する。例えば、サーバは、当該分野でよく知られた閾値区分方法を利用し、情報ゾーンに前景・背景区分、閾値化、並びに分類子パターン分類を施して、情報ゾーンを少なくとも1つの文字ゾーンに分割する。
一例として、情報ゾーンを分割するために、サーバは、先ず、その情報ゾーンの勾配画像を取得し、事前に分割された勾配画像をグレースケール値が蓄積している水平線上に投影し、水平線上における領域又は文字ゾーンの明瞭な区切りを識別する。
操作140において、サーバは、カード画像フレームシーケンス内の全てのフレームにわたって同じ領域に対応している文字ゾーンをぼけ修正する。
一部の実施形態では、分割動作において、画像フレームシーケンス内の各フレームにおける情報ゾーンが、少なくとも1つの文字ゾーンに分割される。各フレームには同数の文字ゾーンが含まれるので、各フレームにおいて同じ位置又はシーケンス番号を有する文字ゾーンは、対応文字ゾーンとして定義される。シーケンス番号は、特定の位置にある文字ゾーンに固定シリアル番号を与えるものであり、このシリアル番号は、フレームシーケンス内において変わることはない。例えば、各フレームにおける第1の文字ゾーンが一対応文字ゾーンであり、各フレームにおける第2の文字ゾーンが一対応文字ゾーンであり、各フレームにおける第3の文字ゾーンが一対応文字ゾーンであり、以下同様に続く。
一部の実施形態では、サーバは、全てのフレームの対応文字ゾーンの画像を同一ベクトルデータ構造に保存する。カード面上の或る情報ゾーンがN個の文字を有し、フレームシーケンス内のフレーム数がMであると想定する。この例では、データ構造内のベクトル数がNに相当し、ベクトルの次元数がMに相当する。
一部の実施形態では、画像認識精度を上げるために、サーバは、画像フレームシーケンス内の全てのフレームにわたって対応している少なくとも1つの文字ゾーンをぼけ修正する。
例えば、サーバは、個々の対応文字ゾーンをぼけ修正するために、既知の手法であるか又は今後開発される手法であるかを問わず、任意のぼけ修正方法を使用することができる。ぼけ修正方法の例として、ウィーナフィルタやルーシー・リチャードソンアルゴリズムなどを使用した方法が挙げられる。
図2は、文字ゾーンをぼけ修正するためのプロセスの一実施形態を示すフローチャートである。一部の実施形態では、プロセス200は、図1Bの140を実現するものであり、以下を含む。
操作210において、画像フレームシーケンス内の全てのフレームに対応している文字ゾーンに関し、サーバは、各文字ゾーンの、その文字ゾーンがどれくらい明瞭である、鮮明である、及び/又は読みやすいと見なされるかを表す明瞭度を計算する。
一部の実施形態では、サーバは、全てのフレームにわたる文字ゾーンのうちの各文字ゾーンの明瞭度を算出する。実際、一部の実施形態では、サーバは、文字ゾーンの明瞭度を計算するために、画像鮮明度を計算するための任意の適切な方法を使用することができる。例えば、画像鮮明度は、ブレナ勾配を使用して計算することができる。
一部の実施形態では、サーバは、文字ゾーンの明瞭度を、その文字ゾーン内の画素のグレースケール値に基づいて計算する。図3は、文字ゾーンの明瞭度を計算するためのプロセスの一実施形態を示すフローチャートである。一部の実施形態では、プロセス300は、図2の210を実現するものであり、以下を含む。
通常、クレジットカード上の文字は、平坦ではなく型打ちされて隆起しているという特性を有する。文字の線は、通常、水平及び垂直の2方向である。文字に斜めの線が見られるのは比較的稀であり、水平線と垂直線とをつなぐコーナー角は比較的小半径である。これらの特性は、投影されたクレジットカード文字の画像が水平方向及び垂直方向に極めて著しい勾配特徴を有することを示している。勾配特徴は、水平方向又は垂直方向における画像内の変化率を表している。一例として、グレースケール値が(0.1,0.5,0.9)である隣り合う3つの画素からなる第1の画素群を、グレースケール値が(0.3,0.3,0.3)である隣り合う3つの画素からなる第2の画素群と比較すると、第1の画素群は、第2の画素群よりも大きい勾配特徴を有する。したがって、文字ゾーン明瞭度は、文字ゾーン内の画素のグレースケール値の水平勾配特徴及び垂直勾配特徴を使用して記述される。
操作310において、サーバは、文字ゾーン内の各画素の強度値を、その文字ゾーン内の各画素の水平勾配特徴及び垂直勾配特徴に基づいて取得する。
一例として、サーバは、所定の文字強度テスト演算子集合に基づいて、文字ゾーン内の各画素をスキャンし、該スキャンの結果に基づいて、各画素のグレースケール値の水平勾配特徴及び垂直勾配特徴を取得し、次いで、文字ゾーン内の全ての画素の強度値を取得する。
一部の実施形態では、文字強度テスト演算子集合は、T={a,b}として定義される。一部の実施形態では、パラメータaは、文字ゾーン内の水平勾配特徴を抽出及びスキャンするために使用されるパラメータであり、パラメータbは、文字ゾーン内の垂直勾配特徴を抽出及びスキャンするために使用されるパラメータであり、a及びbは、ともに、3×3行列である。行列内の各要素は、画像内の一画素に対応している。行列要素の配置の一例は、以下に示されるように、画像内における画素の配置に対応している。
Figure 2016523397
一部の実施形態では、スキャンプロセスにおいて、水平スキャンを行うためにパラメータaが使用され、垂直スキャンにパラメータbが使用され、水平スキャン値及び垂直スキャン値は、全ての画素の強度値を得るために合算される。例えば、水平スキャンを行っている間、行列a内の各要素が、対応する画素のグレースケール値で掛け合わされ、各要素とそれに対応する画素のグレースケール値との積が、合算される。結果として得られる和は、行列の中心位置にある要素に対応する画素の強度値に関係する。また、計算中に、画像の縁に位置する画素に遭遇すると、サーバは、計算を完成させるために画素の補完を行い、補完されたこれらの画素のグレースケール値はゼロに設定される。垂直スキャン処理は、水平スキャン処理と同様であり、簡潔を期するためにこれ以上論じられない。
テスト演算子集合Tは、一例に過ぎず、本発明を限定するものではなく、演算子集合Tのなかのパラメータa及びbも、その他の任意の適切な値であってよい。
一部の実施形態では、文字ゾーン内の画素の強度値は、上述された処理において効果的に記述される。強度値は、明瞭度を決定するために使用される。また、サーバは、文字ゾーンの明瞭度を反映するために、画素のグレースケール値の水平勾配特徴及び垂直勾配特徴を効果的に使用することができる。また、上述された処理に関わる演算子は比較的少なく、その結果、計算効率が向上される。
操作320において、サーバは、各文字ゾーンの明瞭度を強度値に基づいて決定する。
一部の実施形態では、各文字ゾーンに関し、サーバは、文字ゾーン内の全ての画素の強度値の平均をその文字ゾーンの明瞭度として算出する。
したがって、操作310及び320において、サーバは、各文字ゾーンの明瞭度を決定する。ここでは、でこぼこの及び/又は隆起した文字に関して明瞭度の基準が決定されるクレジットカードの例が使用されているが、明瞭度の基準及び方式は、でこぼこの及び/又は隆起した文字に限定されず、平坦な文字が存在する状況にも適用される。
図2に戻り、操作220において、サーバは、対応文字ゾーンの中から明瞭度が最も高い文字ゾーンを選択し、該明瞭度が最も高い文字ゾーンを候補文字ゾーンとして決定する。
一例では、サーバは、フレームシーケンス内の各フレームの文字ゾーンの明瞭度を個別に計算し、それによって、フレームシーケンス内の対応文字ゾーンの明瞭度の集合を取得する。この明瞭度の集合から、サーバは、明瞭度が最も高い文字ゾーンを候補文字ゾーンとして選択する。
操作230において、サーバは、候補文字ゾーンの明瞭度が既定の閾値よりも高いか否かを判断する。一部の実施形態では、既定の閾値は、経験的に決定される。
操作240において、候補文字ゾーンの明瞭度が既定の閾値よりも高い場合に、サーバは、その候補文字ゾーンを、後続の認識処理のための対応文字ゾーンの選択画像と見なす。
操作250において、候補文字ゾーンの明瞭度が既定の閾値以下である場合に、サーバは、次の画像フレームシーケンスを取得し、該次の画像フレームシーケンスを引き続き処理する。
一例として、キャッシュから別のフレームシーケンスが取得され、図1Bの情報認識プロセス100の実行によって再び情報認識が実施される。一部の実施形態では、この別のフレームシーケンスは、先立って処理されたフレームシーケンスと同数のフレームを有する。
この時点で、操作210〜250を通じて全ての文字ゾーンがぼけ修正されている。一部の実施形態では、ビデオストリームから複数のフレームが順次選択される、又は幾つかのフレームが一定間隔で選択される。一態様として、一部の実施形態では、隣り合うフレーム間における時間データの類似性の観点から、複数のシングルフレームが数フレーム間隔で選択され、これらのフレームは、重点フレームと呼ばれる。この手法は、連続して選択する場合よりもデータ計算量が少なくてすみ、計算効率を効果的に高めるとともに、システム全体のパフォーマンスを向上させることができる。
また、フレーム数の選択及び文字明瞭度閾値の選択に関しては、サーバは、基準としての閾値要件を文字明瞭度が満たしている全N文字ゾーンの選択画像をとり、情報認識システムの動作条件に基づいてフレーム数及び文字明瞭度閾値に重みを付けることによって、フレーム数及び文字明瞭度閾値を決定することができる。要するに、あるカード情報認識プロセスにおいて、サーバがM個のフレームを取得し、明瞭度閾値を超える明瞭度を有する全N文字ゾーンの選択画像を得たときに、サーバは、これ以上フレームを取得する必要はない。また、一部の実施形態では、サーバは、次のカード情報認識の際も、M個のフレームを選択する。一部の実施形態では、Mという数は、大きすぎてはならない。Mが大きすぎると、システム全体のパフォーマンスが低下し、ユーザの待機時間が長くなる。例えば、認識プロセスの際に、要件を満たすN文字ゾーンの選択画像が10フレーム以内で得られない場合、サーバは、次の認識プロセスでは、10フレーム以内で鮮明なN文字ゾーンを得るために、文字明瞭度閾値を適宜引き下げる。プロセスは、Mを10又は特定の数に限定することを意図しておらず、Mは、この数よりも大きくても又は10未満であってもよい。
図1Bに戻り、操作150において、サーバは、ぼけ修正された文字ゾーンに基づいて、文字列情報を認識する。
一部の実施形態では、サーバは、任意の既知の認識技術に基づいて、全文字ゾーンの選択画像内における対応文字を順次認識し、それによって、文字列情報を得る。例えば、サーバは、当該分野で一般的に利用されている閾値区分方法を利用し、前景・背景区分、閾値化、及び分類子パターン分類を通じて対応文字を認識する。文字列情報の認識の一例として、機械学習技術を使用し、0〜9の数字を認識するように識別エンジンを訓練し、次いで、識別エンジンを使用して各文字を認識することが挙げられる。
マルチフレーム画像処理結果に融合処理を施し、それによって、後続の認識処理に適した鮮明な文字ゾーン画像を得ることによって、カード情報認識正解率が上がるうえに、カード情報認識システム全体のパフォーマンスも向上し、その結果、ユーザの便宜が良くなる。融合処理の一例を、図3のプロセス300に見ることができる。
なお、上記の実施形態は、いずれもクレジットカードを例として使用していることに留意されたい。しかしながら、これらの方式は、クレジットカードに限定されず、IDカードや会員カードなどの、基準に適合する様々な標準的カードにも適用可能である。
一部の実施形態では、文字列情報が認識された後、操作160において、サーバは、文字列情報の正確さを検証する。
一部の実施形態では、認識された文字列情報は、カードのための所定のルールにしたがって検証される。一部の実施形態では、認識された文字列情報の正確さが立証された場合に、サーバは、後続処理を実施する。例えば、文字列情報が、確認のためにカード情報としてユーザに対して表示される。一部の実施形態では、認識された文字列情報の正確さが立証されなかった場合に、サーバは、次の画像フレームシーケンスを取得し、図1Bのプロセス100を使用して再び情報認識が実施される。
クレジットカードを例として使用し、認識された文字ゾーンがカード番号情報ゾーンである場合、サーバは、認識された文字列情報が、例えば国際基準におけるクレジットカード番号の一連の番号についての所定の桁数又は所定の配置などの所定のルールに適合するかどうかを検証する。
検証動作を通じて、プロセスは、カード情報認識の正解率、カード情報認識システム全体のパフォーマンス、及びユーザの便宜を向上させる。
図4は、情報認識のためのデバイスの一実施形態を示す構造ブロック図である。一部の実施形態では、デバイス400は、図1Bのプロセス100を実行するものであり、カード位置特定モジュール410と、情報位置特定モジュール420と、文字ゾーン分割モジュール430と、ぼけ修正モジュール440と、認識モジュール450とを含む。
一部の実施形態では、カード位置特定モジュール410は、カード画像フレームシーケンス内の各フレームに対してカードゾーンの位置特定を行う。一例として、カード位置特定モジュール410は、任意の既知の位置特定技術を使用して、各フレーム内においてカードゾーンを位置特定する。一部の実施形態では、カード位置特定モジュール410は、所定の形状、所定のサイズ、文字情報に固有な特徴、又はこれらを任意に組み合わせた特性に基づいて、画像フレーム内においてカードゾーンを位置特定する。
一部の実施形態では、情報位置特定モジュール420は、各カードゾーン内において情報ゾーンを個別に位置特定する。一部の実施形態では、情報位置特定モジュール420は、更に、カード内における情報ゾーンの既定の位置、情報ゾーンの既定のサイズ、情報ゾーンの既定の形状、又はこれらを任意に組み合わせた特性に基づいて、各カードゾーン内において情報ゾーンを位置特定する。例えば、情報ゾーンとして、カード番号ゾーン、有効期限ゾーン、カード名義人ゾーンなどが挙げられる。
一部の実施形態では、文字ゾーン分割モジュール430は、各情報ゾーンを個々の文字ゾーンに分割する。一部の実施形態では、文字分割モジュール430は、情報ゾーンを、文字の間隔、文字の数、文字のサイズ、又はこれらを任意に組み合わせた特性に基づいて、少なくとも1つの文字ゾーンに分割する。例えば、文字ゾーンは、数字又は文字を含む。
一部の実施形態では、ぼけ修正モジュール440は、画像フレームシーケンス内の全てのフレームにわたって対応している文字ゾーンをぼけ修正する。一部の実施形態では、ぼけ修正モジュール440は、既知であるか又は今後開発されるかを問わず、全ての対応文字ゾーンをぼけ修正する。
図5は、ぼけ修正モジュールの一実施形態を示す構造ブロック図である。一部の実施形態では、ぼけ修正モジュール500は、図4のぼけ修正モジュール440を実現したものであり、明瞭度計算モジュール510と、候補文字ゾーン選択モジュール520と、閾値決定モジュール530とを含む。
一部の実施形態では、明瞭度計算モジュール510は、画像フレームシーケンス内の全てのフレームにわたって対応している文字ゾーンのうちの各文字ゾーンの明瞭度を計算する。
図6は、明瞭度計算モジュールの一実施形態を示す構造ブロック図である。一部の実施形態では、明瞭度計算モジュール600は、図5の明瞭度計算モジュール510を実現したものであり、強度値計算モジュール610と、明瞭度決定モジュール620とを含む。
一部の実施形態では、強度値計算モジュール610は、文字ゾーン内の各画素の強度値を、その文字ゾーン内の各画素の水平勾配特徴及び垂直勾配特徴に基づいて計算する。
一部の実施形態では、明瞭度決定モジュール620は、各文字ゾーンの明瞭度を、その文字ゾーン内の各画素の強度値にしたがって決定する。
図5に戻り、一部の実施形態では、候補文字ゾーン選択モジュール520は、対応文字ゾーンのなかから明瞭度が最も高い文字ゾーンを選択し、この選択された文字ゾーンを候補文字ゾーンとする。
一部の実施形態では、候補文字ゾーンの明瞭度が既定の閾値よりも高い場合に、閾値決定モジュール530は、その候補文字ゾーンを、後続の認識処理のための対応文字ゾーンの選択画像と見なす。候補文字ゾーンの明瞭度が既定の閾値よりも低い場合に、閾値決定モジュール530は、次の画像フレームシーケンスを取得し、該次の画像フレームシーケンスを引き続き処理する。
図4に戻り、一部の実施形態では、認識モジュール450は、ぼけ修正された文字ゾーンに基づいて、文字列情報を認識する。
ここまでは、情報認識機器の概要構造が説明されてきた。マルチフレーム画像処理結果に融合処理を施し、それによって、後続の認識処理に適した鮮明な文字ゾーン画像を得ることによって、カード情報認識正解率及びカード情報認識システム全体のパフォーマンスが向上し、ユーザの便宜が良くなる。
一部の実施形態では、デバイス400は、ストレージモジュール460と、画像フレームシーケンス取得モジュール470とを含む。
一部の実施形態では、ストレージモジュール460は、カードを撮影したビデオストリーム又は複数のシングルフレーム画像をキャッシュに保存する。
一部の実施形態では、画像フレームシーケンス取得モジュール470は、キャッシュから画像フレームシーケンスを取得する。
一部の実施形態では、画像フレームシーケンス取得モジュール470は、画像フレームシーケンス内の個々のフレームを、キャッシュ内の連続ビデオストリームから特定のフレーム数間隔で選択する。
一部の実施形態では、デバイス400は、検証モジュール480を含む。
一部の実施形態では、検証モジュール480は、カード面上の文字列情報の正確さを検証する。一部の実施形態では、検証モジュール480は、文字列情報がカードのための所定のルールに適合するかどうかを検証する。文字列情報がカードのための所定のルールに適合する場合に、検証モジュール480は、その文字列情報を、ユーザによって確認されるカード情報として表示する。文字列情報がカードのための所定のルールに適合しない場合に、検証モジュール480は、次の画像フレームシーケンスを取得し、該次の画像フレームシーケンスを引き続き処理する。検証を通じて、カード情報認識の正解率、カード情報認識システム全体のパフォーマンス、及びユーザの便宜が向上される。
図7は、情報認識のためのシステムの一実施形態を示す構造ブロック図である。一部の実施形態では、システム700は、画像取り込み機器710と、情報認識機器720と、表示機器730とを含む。
一部の実施形態では、画像取り込み機器710は、カード画像フレームシーケンスを取得する。例えば、画像取り込み機器710は、内臓若しくは外付けのカメラ、又はポータブル端末に取り付けられたスキャナなどの、画像取得デバイスであってよい。この画像取り込み機器710は、カードのビデオストリームを撮影する又はカードの複数の画像サンプルを撮ることができ、それによって、複数のシングルフレーム画像を得る。このようにして、画像取り込み機器710は、カード画像フレームシーケンスを取得する。
一部の実施形態では、情報認識機器又はサーバ720は、カード画像フレームシーケンス内のカード面文字列情報を認識する。一部の実施形態では、情報認識機器720は、カードゾーン内のカード面文字列情報を認識し、画像取り込み機器710によって取り込まれたカード画像フレームシーケンス内のカードゾーンを認識する。一部の実施形態では、情報認識機器720は、図4のデバイス400に相当する。
一部の実施形態では、表示機器730は、情報認識機器720によって認識された文字列情報を表示する。一部の実施形態では、表示機器730は、情報認識機器720によって出力された文字列情報を受信し、この文字列情報を、確認のためにユーザに対して表示する。
一部の実施形態では、情報認識システム700は、画像取り込み機器710を使用してカード画像フレームシーケンスを取り込み、複数のフレームの文字ゾーン画像処理結果に融合処理を施し、合体された文字ゾーン画像を認識する。このようにして、情報認識システム700は、カード面文字列情報を抽出する。情報認識システム700は、マルチフレーム融合処理を実施するので、カード情報認識の正解率を高め、カード情報認識システム全体のパフォーマンスを向上させ、ユーザの便宜を良くすることができる。
図8は、情報認識のためのプログラムドコンピュータシステムの一実施形態を示す機能図である。図から明らかなように、情報認識には、その他のコンピュータシステムアーキテクチャ及び構成も使用可能である。後述のような様々なサブシステムを含むコンピュータシステム800は、少なくとも1つのマイクロプロセッササブシステム(プロセッサ又は中央演算処理装置(CPU)とも呼ばれる)802を含む。例えば、プロセッサ802は、シングルチッププロセッサによって又は複数のプロセッサによって実現可能である。一部の実施形態では、プロセッサ802は、コンピュータシステム800の動作を制御する汎用デジタルプロセッサである。メモリ810から取り出された命令を使用して、プロセッサ802は、入力データの受信及び操作と、出力デバイス(例えばディスプレイ818)へのデータの出力及び表示とを制御する。
プロセッサ802は、メモリ810に双方向に接続され、該メモリ810は、通常はランダムアクセスメモリ(RAM)である第1の一次ストレージと、通常は読み出し専用メモリ(ROM)である第2の一次ストレージとを含むことができる。当該分野で周知のように、一次ストレージは、汎用ストレージエリア及びスクラッチパッドメモリとして使用可能であり、入力データ及び処理済みデータを格納するためにも使用可能である。一次ストレージは、プログラミング命令及びデータを、プロセッサ802上で生じるプロセスのためのその他のデータ及び命令に加えて、データオブジェクト及びテキストオブジェクトの形態で格納することもできる。当該分野で周知のように、一次ストレージは、通常は、プロセッサ802がその機能(例えばプログラム命令)を実施するために使用する基本的な動作命令、プログラムコード、データ、及びオブジェクトを含む。例えば、メモリ810は、例えば、データアクセスが双方向又は単方向のいずれである必要があるかに応じ、後述の任意の適切なコンピュータ読み取り可能ストレージ媒体を含むことができる。例えば、プロセッサ802は、頻繁に必要とされるデータを直接に且つ非常に迅速に取り出して、直接に且つ非常に迅速にキャッシュメモリ(不図示)に格納することができる。
着脱式の大容量ストレージデバイス812は、コンピュータシステム800のための追加のデータストレージ容量を提供し、双方向(読み出し/書き込み)に又は単方向(読み出しのみ)にプロセッサ802に接続される。例えば、ストレージ812は、磁気テープ、フラッシュメモリ、PCカード、ポータブル大容量ストレージデバイス、ホログラフィックストレージデバイス、及びその他のストレージデバイスを含むこともできる。例えば、固定式の大容量ストレージ820が、追加のデータストレージ容量を提供することもできる。大容量ストレージ820として最も一般的な例は、ハードディスクドライブである。大容量ストレージ812、820は、一般に、プロセッサ802が通常は能動的に使用していない追加のプログラミング命令やデータなどを格納する。大容量ストレージ812、820内に保持される情報は、もし必要であれば、仮想メモリとしてメモリ810(例えばRAM)の一部に標準的に組み込み可能であることがわかる。
バス814は、プロセッサ802にストレージサブシステムへのアクセスに加えてその他のサブシステム及びデバイスへのアクセスを提供するためにも使用可能である。図に示されるように、これらには、ディスプレイモニタ818、ネットワークインターフェース816、キーボード804、及びポインティングデバイス806はもちろん、必要に応じて、補助入出力デバイスインターフェース、サウンドカード、スピーカ、及びその他のサブシステムがある。例えば、ポインティングデバイス806は、マウス、スタイラス、トラックボール、又はタブレットであってよく、グラフィカルユーザインターフェースとやり取りするのに有用である。
ネットワークインターフェース816は、図に示されるようなネットワーク接続を使用してプロセッサ802が別のコンピュータ、コンピュータネットワーク、又は電気通信ネットワークに接続されることを可能にする。例えば、ネットワークインターフェース816を通じて、プロセッサ802は、方法/プロセスのステップを実施する過程において別のネットワークから情報(例えばデータオブジェクト若しくはプログラム命令)を取り出す又は別のネットワークに情報を出力することができる。情報は、多くの場合、プロセッサで実行される一連の命令として表され、別のネットワークから取り出し可能である又は別のネットワークに出力可能である。コンピュータシステム800を外部ネットワークに接続するために、及びデータを標準プロトコルにしたがって転送するために、インターフェースカード又は類似のデバイスと、プロセッサ802によって実装される(例えばプロセッサ802上で実行される/実施される)適切なソフトウェアとが使用可能である。例えば、本明細書で開示される様々なプロセス実施形態は、プロセッサ802上で実行可能である、又は処理の一部を供給するリモートプロセッサと協働してインターネット、イントラネットネットワーク、若しくはローカルエリアネットワークなどのネットワークで実施可能である。プロセッサ802には、ネットワークインターフェース816を通じて追加の大容量ストレージデバイス(不図示)も接続可能である。
コンピュータシステム800と協働して、補助入出力デバイスインターフェース(不図示)が使用可能である。補助入出力デバイスインターフェースは、プロセッサ802が、マイク、タッチセンサ式ディスプレイ、トランスデューサカードリーダ、テープリーダ、音声又は手書き文字認識装置、生体認証リーダ、カメラ、ポータブル大容量ストレージデバイス、及びその他のコンピュータなどのその他のデバイスにデータを送信することを、又はより一般的にはこれらのその他のデバイスからデータを取り出すことを可能にする、汎用又は専用のインターフェースを含むことができる。
図8に示されたコンピュータシステムは、本明細書で開示される様々な実施形態との使用に適したコンピュータシステムの一例に過ぎない。このような使用に適したその他のコンピュータシステムは、含まれるサブシステムが更に多くてよい又は少なくてよい。また、バス814は、サブシステムをつなぐ働きをするあらゆる相互接続方式を例示するものである。異なる構成のサブシステムを有するその他のコンピュータアーキテクチャも利用可能である。
上述されたモジュールは、1つ以上の汎用プロセッサ上で実行されるソフトウェアコンポーネントとして、又はプログラマブルロジックデバイス及び/若しくは特定の機能を実施するように設計された特殊用途向け集積回路などのハードウェアとして、又はそれらの組み合わせとして実装可能である。一部の実施形態では、モジュールは、本発明の実施形態で説明される方法を(パソコン、サーバ、ネットワーク機器などの)計算装置に実行させるための幾つかの命令を含み尚且つ(光ディスク、フラッシュストレージデバイス、モバイルハードディスクなどの)不揮発性のストレージ媒体に記憶させることができるソフトウェア製品の形で具現化可能である。モジュールは、1つのデバイス上に実装されてよい、又は複数のデバイスに分散されてよい。モジュールの機能は、互いに統合されてよい、又は複数のサブユニットに更に分けられてよい。
本明細書で開示された実施形態に照らして説明される方法又はアルゴリズム的ステップは、ハードウェア、プロセッサによって実行されるソフトウェアモジュール、又はこれら両方の組み合わせを使用して実現可能である。ソフトウェアモジュールは、ランダムアクセスメモリ(RAM)、メモリ、読み出し専用メモリ(ROM)、電気的にプログラム可能なROM、電気的に消去可能でプログラム可能なROM、レジスタ、ハードドライブ、着脱式ディスク、CD−ROM、又は当該技術分野で知られるその他の任意の形態のストレージ媒体にインストール可能である。
以上の実施形態は、理解を明瞭にする目的で幾らか詳細に説明されてきたが、本発明は、提供された詳細に限定されない。本発明を実現するには、多くの代替的手法がある。開示された実施形態は、例示的なものであり、限定するものではない。
以上の実施形態は、理解を明瞭にする目的で幾らか詳細に説明されてきたが、本発明は、提供された詳細に限定されない。本発明を実現するには、多くの代替的手法がある。開示された実施形態は、例示的なものであり、限定するものではない。
適用例1:情報認識のための方法であって、
1つ以上のプロセッサを使用し、複数のフレームを含むカード画像フレームシーケンス内の各フレームに対してカードゾーンを位置特定し、
前記1つ以上のプロセッサを使用し、各カードゾーン内において情報ゾーンを位置特定し、
前記1つ以上のプロセッサを使用し、各情報ゾーンを少なくとも1つの文字ゾーンに分割し、
前記1つ以上のプロセッサを使用し、前記カード画像フレームシーケンス内の全てのフレームにわたって同じ領域に対応している文字ゾーンをぼけ修正し、
前記1つ以上のプロセッサを使用し、前記ぼけ修正された文字ゾーンに基づいて文字列情報を認識すること、
を備える方法。
適用例2:適用例1に記載の方法であって、
前記文字ゾーンをぼけ修正することは、
前記画像フレームシーケンス内の全てのフレームにわたって対応している各文字ゾーンに関し、前記各文字ゾーンの明瞭度を計算し、
前記対応文字ゾーンの中で明瞭度が最も高い文字ゾーンを、候補文字ゾーンとして選択することを備え、
前記候補文字ゾーンの明瞭度が既定の閾値以上である場合に、前記候補文字ゾーンを、後続の認識処理のための前記対応文字ゾーンの選択画像と見なし、
前記候補文字ゾーンの明瞭度が前記既定の閾値未満である場合に、認識のために次の画像フレームシーケンスを取得する、方法。
適用例3:適用例2に記載の方法であって、
各文字ゾーンの明瞭度を計算することは、
文字ゾーン内の各画素の強度値を、前記文字ゾーン内の各画素の水平勾配特徴及び垂直勾配特徴に基づいて取得し、
各文字ゾーンの明瞭度を、前記文字ゾーン内の前記画素の強度値に基づいて決定すること、
を備える、方法。
適用例4:適用例1に記載の方法であって、更に、
前記カード画像フレームシーケンス内の各フレームに対してカードゾーンを位置特定する前に、
カード面を撮影したビデオストリーム又は複数のシングルフレーム画像をキャッシュに保存し、
前記キャッシュから前記画像フレームシーケンスを取得すること、
を備える方法。
適用例5:適用例4に記載の方法であって、
前記キャッシュから前記画像フレームシーケンスを取得することは、
前記キャッシュ内の前記ビデオストリームから、前記画像フレームシーケンス内の個々のフレームを所定のフレーム数間隔で選択することを備える、方法。
適用例6:適用例1に記載の方法であって、更に、
文字列情報がカードのための所定のルールに適合するか否かを検証し、
前記文字列情報が前記所定のルールに適合する場合に、確認に使用するために前記文字列情報をカード情報としてユーザに対して表示し、
前記文字列情報が前記所定のルールに適合しない場合に、認識のために次の画像フレームシーケンスを取得すること、
を備える方法。
適用例7:適用例3に記載の方法であって、
前記各画素の強度値は、行列の各要素及び前記各要素のグレースケール値に関係する、方法。
適用例8:情報認識のためのシステムであって、
少なくとも1つのプロセッサであって、
複数のフレームを含むカード画像フレームシーケンス内の各フレームに対してカードゾーンを位置特定し、
各カードゾーン内において情報ゾーンを位置特定し、
各情報ゾーンを少なくとも1つの文字ゾーンに分割し、
前記カード画像フレームシーケンス内の全てのフレームにわたって同じ領域に対応している文字ゾーンをぼけ修正し、
前記ぼけ修正された文字ゾーンに基づいて文字列情報を認識するように構成されている少なくとも1つのプロセッサと、
前記少なくとも1つのプロセッサに接続され、前記少なくとも1つのプロセッサに命令を提供するように構成されているメモリと、
を備える、システム。
適用例9:適用例8に記載のシステムであって、
前記文字ゾーンをぼけ修正することは、
前記画像フレームシーケンス内の全てのフレームにわたって対応している各文字ゾーンに関し、前記各文字ゾーンの明瞭度を計算し、
前記対応文字ゾーンの中で明瞭度が最も高い文字ゾーンを、候補文字ゾーンとして選択することを備え、
前記候補文字ゾーンの明瞭度が既定の閾値以上である場合に、前記候補文字ゾーンを、後続の認識処理のための前記対応文字ゾーンの選択画像と見なし、
前記候補文字ゾーンの明瞭度が前記既定の閾値未満である場合に、認識のために次の画像フレームシーケンスを取得する、システム。
適用例10:適用例9に記載のシステムであって、
各文字ゾーンの明瞭度を計算することは、
文字ゾーン内の各画素の強度値を、前記文字ゾーン内の各画素の水平勾配特徴及び垂直勾配特徴に基づいて取得し、
各文字ゾーンの明瞭度を、前記文字ゾーン内の前記画素の強度値に基づいて決定すること、
を備える、システム。
適用例11:適用例8に記載のシステムであって、
前記カード画像フレームシーケンス内の各フレームに対してカードゾーンを位置特定することは、
前記カード画像フレームシーケンス内の各フレームにおいてカードゾーンを位置特定する前に、
カード面を撮影したビデオストリーム又は複数のシングルフレーム画像をキャッシュに保存し、
前記キャッシュから前記画像フレームシーケンスを取得すること、
を備える、システム。
適用例12:適用例11に記載のシステムであって、
前記キャッシュから前記画像フレームシーケンスを取得することは、
前記キャッシュ内の前記ビデオストリームから、前記画像フレームシーケンス内の個々のフレームを所定のフレーム数間隔で選択することを備える、システム。
適用例13:適用例8に記載のシステムであって、
前記少なくとも1つのプロセッサは、更に、
文字列情報がカードのための所定のルールに適合するか否かを検証し、
前記文字列情報が前記所定のルールに適合する場合に、確認に使用するために前記文字列情報をカード情報としてユーザに対して表示し、
前記文字列情報が前記所定のルールに適合しない場合に、認識のために次の画像フレームシーケンスを取得するように構成されている、システム。
適用例14:適用例10に記載のシステムであって、
前記各画素の強度値は、行列の各要素及び前記各要素のグレースケール値に関係する、システム。
適用例15:情報認識のためのシステムであって、
複数のフレームを含むカード画像フレームシーケンスを取得するために使用される画像取り込み機器と、
情報認識機器であって、
カード画像フレームシーケンス内の各フレームに対してカードゾーンを位置特定し、
各カードゾーン内において情報ゾーンを位置特定し、
各情報ゾーンを少なくとも1つの文字ゾーンに分割し、
前記カード画像フレームシーケンス内の全てのフレームにわたって同じ領域に対応している文字ゾーンをぼけ修正し、
前記ぼけ修正された文字ゾーンに基づいて文字列情報を認識するために使用される情報認識機器と、
前記認識された文字列情報を表示するために使用される表示機器と、
を備えるシステム。
適用例16:適用例15に記載のシステムであって、
前記文字ゾーンをぼけ修正することは、
前記画像フレームシーケンス内の全てのフレームにわたって対応している各文字ゾーンに関し、前記各文字ゾーンの明瞭度を計算し、
前記対応文字ゾーンの中で明瞭度が最も高い文字ゾーンを、候補文字ゾーンとして選択することを備え、
前記候補文字ゾーンの明瞭度が既定の閾値以上である場合に、前記候補文字ゾーンを、後続の認識処理のための前記対応文字ゾーンの選択画像と見なし、
前記候補文字ゾーンの明瞭度が前記既定の閾値未満である場合に、認識のために次の画像フレームシーケンスを取得する、システム。
適用例17:適用例16に記載のシステムであって、
各文字ゾーンの明瞭度を計算することは、
文字ゾーン内の各画素の強度値を、前記文字ゾーン内の各画素の水平勾配特徴及び垂直勾配特徴に基づいて取得し、
各文字ゾーンの明瞭度を、前記文字ゾーン内の前記画素の強度値に基づいて決定すること、
を備える、システム。
適用例18:適用例15に記載のシステムであって、
前記カード画像フレームシーケンス内の各フレームに対してカードゾーンを位置特定することは、
前記カード画像フレームシーケンス内の各フレームに対してカードゾーンの位置特定を行う前に、
カード面を撮影したビデオストリーム又は複数のシングルフレーム画像をキャッシュに保存し、
前記キャッシュから前記画像フレームシーケンスを取得すること、
を備える、システム。
適用例19:適用例18に記載のシステムであって、
前記キャッシュから前記画像フレームシーケンスを取得することは、
前記キャッシュ内の前記ビデオストリームから、前記画像フレームシーケンス内の個々のフレームを所定のフレーム数間隔で選択することを備える、システム。
適用例20:適用例15に記載のシステムであって、
前記情報認識機器は、更に、
文字列情報がカードのための所定のルールに適合するか否かを検証し、
前記文字列情報が前記所定のルールに適合する場合に、確認に使用するために前記文字列情報をカード情報としてユーザに対して表示し、
前記文字列情報が前記所定のルールに適合しない場合に、認識のために次の画像フレームシーケンスを取得するために使用される、システム。
適用例21:適用例17に記載のシステムであって、
前記各画素の強度値は、行列の各要素及び前記各要素のグレースケール値に関係する、システム。
適用例22:有体の非一時的なコンピュータ読み取り可能ストレージ媒体に盛り込まれた、情報認識のためのコンピュータプログラム製品であって、
複数のフレームを含むカード画像フレームシーケンス内の各フレームに対してカードゾーンを位置特定するためのコンピュータ命令と、
各カードゾーン内において情報ゾーンを位置特定するためのコンピュータ命令と、
各情報ゾーンを少なくとも1つの文字ゾーンに分割するためのコンピュータ命令と、
前記カード画像フレームシーケンス内の全てのフレームにわたって同じ領域に対応している文字ゾーンをぼけ修正するためのコンピュータ命令と、
前記ぼけ修正された文字ゾーンに基づいて文字列情報を認識するためのコンピュータ命令と、
を備えるコンピュータプログラム製品。

Claims (22)

  1. 情報認識のための方法であって、
    1つ以上のプロセッサを使用し、複数のフレームを含むカード画像フレームシーケンス内の各フレームに対してカードゾーンを位置特定し、
    前記1つ以上のプロセッサを使用し、各カードゾーン内において情報ゾーンを位置特定し、
    前記1つ以上のプロセッサを使用し、各情報ゾーンを少なくとも1つの文字ゾーンに分割し、
    前記1つ以上のプロセッサを使用し、前記カード画像フレームシーケンス内の全てのフレームにわたって同じ領域に対応している文字ゾーンをぼけ修正し、
    前記1つ以上のプロセッサを使用し、前記ぼけ修正された文字ゾーンに基づいて文字列情報を認識すること、
    を備える方法。
  2. 請求項1に記載の方法であって、
    前記文字ゾーンをぼけ修正することは、
    前記画像フレームシーケンス内の全てのフレームにわたって対応している各文字ゾーンに関し、前記各文字ゾーンの明瞭度を計算し、
    前記対応文字ゾーンの中で明瞭度が最も高い文字ゾーンを、候補文字ゾーンとして選択することを備え、
    前記候補文字ゾーンの明瞭度が既定の閾値以上である場合に、前記候補文字ゾーンを、後続の認識処理のための前記対応文字ゾーンの選択画像と見なし、
    前記候補文字ゾーンの明瞭度が前記既定の閾値未満である場合に、認識のために次の画像フレームシーケンスを取得する、方法。
  3. 請求項2に記載の方法であって、
    各文字ゾーンの明瞭度を計算することは、
    文字ゾーン内の各画素の強度値を、前記文字ゾーン内の各画素の水平勾配特徴及び垂直勾配特徴に基づいて取得し、
    各文字ゾーンの明瞭度を、前記文字ゾーン内の前記画素の強度値に基づいて決定すること、
    を備える、方法。
  4. 請求項1に記載の方法であって、更に、
    前記カード画像フレームシーケンス内の各フレームに対してカードゾーンを位置特定する前に、
    カード面を撮影したビデオストリーム又は複数のシングルフレーム画像をキャッシュに保存し、
    前記キャッシュから前記画像フレームシーケンスを取得すること、
    を備える方法。
  5. 請求項4に記載の方法であって、
    前記キャッシュから前記画像フレームシーケンスを取得することは、
    前記キャッシュ内の前記ビデオストリームから、前記画像フレームシーケンス内の個々のフレームを所定のフレーム数間隔で選択することを備える、方法。
  6. 請求項1に記載の方法であって、更に、
    文字列情報がカードのための所定のルールに適合するか否かを検証し、
    前記文字列情報が前記所定のルールに適合する場合に、確認に使用するために前記文字列情報をカード情報としてユーザに対して表示し、
    前記文字列情報が前記所定のルールに適合しない場合に、認識のために次の画像フレームシーケンスを取得すること、
    を備える方法。
  7. 請求項3に記載の方法であって、
    前記各画素の強度値は、行列の各要素及び前記各要素のグレースケール値に関係する、方法。
  8. 情報認識のためのシステムであって、
    少なくとも1つのプロセッサであって、
    複数のフレームを含むカード画像フレームシーケンス内の各フレームに対してカードゾーンを位置特定し、
    各カードゾーン内において情報ゾーンを位置特定し、
    各情報ゾーンを少なくとも1つの文字ゾーンに分割し、
    前記カード画像フレームシーケンス内の全てのフレームにわたって同じ領域に対応している文字ゾーンをぼけ修正し、
    前記ぼけ修正された文字ゾーンに基づいて文字列情報を認識するように構成されている少なくとも1つのプロセッサと、
    前記少なくとも1つのプロセッサに接続され、前記少なくとも1つのプロセッサに命令を提供するように構成されているメモリと、
    を備える、システム。
  9. 請求項8に記載のシステムであって、
    前記文字ゾーンをぼけ修正することは、
    前記画像フレームシーケンス内の全てのフレームにわたって対応している各文字ゾーンに関し、前記各文字ゾーンの明瞭度を計算し、
    前記対応文字ゾーンの中で明瞭度が最も高い文字ゾーンを、候補文字ゾーンとして選択することを備え、
    前記候補文字ゾーンの明瞭度が既定の閾値以上である場合に、前記候補文字ゾーンを、後続の認識処理のための前記対応文字ゾーンの選択画像と見なし、
    前記候補文字ゾーンの明瞭度が前記既定の閾値未満である場合に、認識のために次の画像フレームシーケンスを取得する、システム。
  10. 請求項9に記載のシステムであって、
    各文字ゾーンの明瞭度を計算することは、
    文字ゾーン内の各画素の強度値を、前記文字ゾーン内の各画素の水平勾配特徴及び垂直勾配特徴に基づいて取得し、
    各文字ゾーンの明瞭度を、前記文字ゾーン内の前記画素の強度値に基づいて決定すること、
    を備える、システム。
  11. 請求項8に記載のシステムであって、
    前記カード画像フレームシーケンス内の各フレームに対してカードゾーンを位置特定することは、
    前記カード画像フレームシーケンス内の各フレームにおいてカードゾーンを位置特定する前に、
    カード面を撮影したビデオストリーム又は複数のシングルフレーム画像をキャッシュに保存し、
    前記キャッシュから前記画像フレームシーケンスを取得すること、
    を備える、システム。
  12. 請求項11に記載のシステムであって、
    前記キャッシュから前記画像フレームシーケンスを取得することは、
    前記キャッシュ内の前記ビデオストリームから、前記画像フレームシーケンス内の個々のフレームを所定のフレーム数間隔で選択することを備える、システム。
  13. 請求項8に記載のシステムであって、
    前記少なくとも1つのプロセッサは、更に、
    文字列情報がカードのための所定のルールに適合するか否かを検証し、
    前記文字列情報が前記所定のルールに適合する場合に、確認に使用するために前記文字列情報をカード情報としてユーザに対して表示し、
    前記文字列情報が前記所定のルールに適合しない場合に、認識のために次の画像フレームシーケンスを取得するように構成されている、システム。
  14. 請求項10に記載のシステムであって、
    前記各画素の強度値は、行列の各要素及び前記各要素のグレースケール値に関係する、システム。
  15. 情報認識のためのシステムであって、
    複数のフレームを含むカード画像フレームシーケンスを取得するために使用される画像取り込み機器と、
    情報認識機器であって、
    カード画像フレームシーケンス内の各フレームに対してカードゾーンを位置特定し、
    各カードゾーン内において情報ゾーンを位置特定し、
    各情報ゾーンを少なくとも1つの文字ゾーンに分割し、
    前記カード画像フレームシーケンス内の全てのフレームにわたって同じ領域に対応している文字ゾーンをぼけ修正し、
    前記ぼけ修正された文字ゾーンに基づいて文字列情報を認識するために使用される情報認識機器と、
    前記認識された文字列情報を表示するために使用される表示機器と、
    を備えるシステム。
  16. 請求項15に記載のシステムであって、
    前記文字ゾーンをぼけ修正することは、
    前記画像フレームシーケンス内の全てのフレームにわたって対応している各文字ゾーンに関し、前記各文字ゾーンの明瞭度を計算し、
    前記対応文字ゾーンの中で明瞭度が最も高い文字ゾーンを、候補文字ゾーンとして選択することを備え、
    前記候補文字ゾーンの明瞭度が既定の閾値以上である場合に、前記候補文字ゾーンを、後続の認識処理のための前記対応文字ゾーンの選択画像と見なし、
    前記候補文字ゾーンの明瞭度が前記既定の閾値未満である場合に、認識のために次の画像フレームシーケンスを取得する、システム。
  17. 請求項16に記載のシステムであって、
    各文字ゾーンの明瞭度を計算することは、
    文字ゾーン内の各画素の強度値を、前記文字ゾーン内の各画素の水平勾配特徴及び垂直勾配特徴に基づいて取得し、
    各文字ゾーンの明瞭度を、前記文字ゾーン内の前記画素の強度値に基づいて決定すること、
    を備える、システム。
  18. 請求項15に記載のシステムであって、
    前記カード画像フレームシーケンス内の各フレームに対してカードゾーンを位置特定することは、
    前記カード画像フレームシーケンス内の各フレームに対してカードゾーンの位置特定を行う前に、
    カード面を撮影したビデオストリーム又は複数のシングルフレーム画像をキャッシュに保存し、
    前記キャッシュから前記画像フレームシーケンスを取得すること、
    を備える、システム。
  19. 請求項18に記載のシステムであって、
    前記キャッシュから前記画像フレームシーケンスを取得することは、
    前記キャッシュ内の前記ビデオストリームから、前記画像フレームシーケンス内の個々のフレームを所定のフレーム数間隔で選択することを備える、システム。
  20. 請求項15に記載のシステムであって、
    前記情報認識機器は、更に、
    文字列情報がカードのための所定のルールに適合するか否かを検証し、
    前記文字列情報が前記所定のルールに適合する場合に、確認に使用するために前記文字列情報をカード情報としてユーザに対して表示し、
    前記文字列情報が前記所定のルールに適合しない場合に、認識のために次の画像フレームシーケンスを取得するために使用される、システム。
  21. 請求項17に記載のシステムであって、
    前記各画素の強度値は、行列の各要素及び前記各要素のグレースケール値に関係する、システム。
  22. 有体の非一時的なコンピュータ読み取り可能ストレージ媒体に盛り込まれた、情報認識のためのコンピュータプログラム製品であって、
    複数のフレームを含むカード画像フレームシーケンス内の各フレームに対してカードゾーンを位置特定するためのコンピュータ命令と、
    各カードゾーン内において情報ゾーンを位置特定するためのコンピュータ命令と、
    各情報ゾーンを少なくとも1つの文字ゾーンに分割するためのコンピュータ命令と、
    前記カード画像フレームシーケンス内の全てのフレームにわたって同じ領域に対応している文字ゾーンをぼけ修正するためのコンピュータ命令と、
    前記ぼけ修正された文字ゾーンに基づいて文字列情報を認識するためのコンピュータ命令と、
    を備えるコンピュータプログラム製品。
JP2016516260A 2013-06-03 2014-06-03 情報認識のための方法及びシステム Active JP6255486B2 (ja)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
CN201310216611.5A CN104217202B (zh) 2013-06-03 2013-06-03 信息识别方法、设备和系统
CN201310216611.5 2013-06-03
US14/292,288 2014-05-30
US14/292,288 US9367753B2 (en) 2013-06-03 2014-05-30 Method and system for recognizing information on a card
PCT/IB2014/001854 WO2014195802A2 (en) 2013-06-03 2014-06-03 Method and system for recognizing information

Publications (2)

Publication Number Publication Date
JP2016523397A true JP2016523397A (ja) 2016-08-08
JP6255486B2 JP6255486B2 (ja) 2017-12-27

Family

ID=51985179

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016516260A Active JP6255486B2 (ja) 2013-06-03 2014-06-03 情報認識のための方法及びシステム

Country Status (8)

Country Link
US (2) US9367753B2 (ja)
EP (1) EP3005234A4 (ja)
JP (1) JP6255486B2 (ja)
KR (1) KR101836071B1 (ja)
CN (2) CN109766890B (ja)
SG (2) SG11201509903TA (ja)
TW (1) TW201447775A (ja)
WO (1) WO2014195802A2 (ja)

Families Citing this family (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109766890B (zh) * 2013-06-03 2020-11-06 支付宝(中国)网络技术有限公司 信息识别方法、设备和系统
CN105100126B (zh) 2014-04-18 2019-12-03 阿里巴巴集团控股有限公司 发送卡券、生成卡券的方法、公众账号服务端和移动终端
CN104809157B (zh) * 2015-03-25 2018-05-18 小米科技有限责任公司 号码识别方法及装置
WO2017066353A1 (en) * 2015-10-12 2017-04-20 Drone Seed Co. Forestry information management systems and methods streamlined by automatic biometric data prioritization
CN106156767A (zh) * 2016-03-02 2016-11-23 平安科技(深圳)有限公司 行驶证有效期自动提取方法、服务器及终端
CN106203425B (zh) * 2016-07-01 2020-02-04 北京旷视科技有限公司 字符识别方法及装置
GB2567390B (en) * 2016-09-02 2021-10-06 Hitachi High Tech Corp Method for generating text string dictionary, method for searching text string dictionary, and system for processing text string dictionary
CN106557766B (zh) * 2016-11-22 2020-05-19 宇龙计算机通信科技(深圳)有限公司 模糊字符处理方法、系统及电子设备
US10817356B2 (en) 2017-10-11 2020-10-27 Bank Of America Corporation Entity resource distribution channel manipulation
US10530780B2 (en) 2017-10-11 2020-01-07 Bank Of America Corporation Entity validation for resource distribution location
US10579440B2 (en) 2017-11-07 2020-03-03 Bank Of America Corporation Virtual resource control and distribution
US10320662B1 (en) 2017-11-17 2019-06-11 Bank Of America Corporation Centralized resource routing and distribution
CN108154132A (zh) * 2018-01-10 2018-06-12 马上消费金融股份有限公司 一种身份证文字提取方法、系统及设备和存储介质
CN110647784A (zh) * 2018-06-27 2020-01-03 中国移动通信集团浙江有限公司 一种基于深度学习的设备资产管理的方法及装置
CN109101960A (zh) * 2018-07-26 2018-12-28 中国科学院半导体研究所 身份文本信息检测方法及装置
CN109325480A (zh) * 2018-09-03 2019-02-12 平安普惠企业管理有限公司 身份信息的录入方法及终端设备
CN109389110B (zh) * 2018-10-11 2021-03-19 北京奇艺世纪科技有限公司 一种区域确定方法及装置
GB201820569D0 (en) * 2018-12-18 2019-01-30 Continental Automotive Gmbh Printed character recognition
CN110059576A (zh) * 2019-03-26 2019-07-26 北京字节跳动网络技术有限公司 图片的筛选方法、装置和电子设备
US11036996B2 (en) * 2019-07-02 2021-06-15 Baidu Usa Llc Method and apparatus for determining (raw) video materials for news
CN113012422B (zh) * 2019-12-20 2023-03-21 百度在线网络技术(北京)有限公司 公交车定位方法、装置、设备及存储介质
CN113469179A (zh) * 2020-03-30 2021-10-01 阿里巴巴集团控股有限公司 一种图像识别方法、装置、电子设备以及存储介质
CN111914741B (zh) * 2020-07-30 2024-04-19 云知声智能科技股份有限公司 房产证识别方法、装置和设备
CN117333421A (zh) * 2022-06-24 2024-01-02 北京京东振世信息技术有限公司 一种图像清晰度确定方法、装置、设备及存储介质
KR102486208B1 (ko) * 2022-07-07 2023-01-10 캥스터즈 주식회사 인공 지능 기반의 사용자 맞춤형 복지 큐레이션 서비스 서버, 그 방법 및 프로그램
CN115509477B (zh) * 2022-09-09 2024-04-09 上海国微芯芯半导体有限公司 车载显示屏中字符图像动态显示方法、装置、设备、介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05225388A (ja) * 1991-10-04 1993-09-03 Canon Inc 画像処理方法及びその装置と、文字認識方法及びその装置と、統合オフィスオートメーション機器
JP2005037902A (ja) * 2003-07-01 2005-02-10 Olympus Corp 顕微鏡システム、顕微鏡画像表示システム、観察体画像表示方法、及びプログラム
CN201159903Y (zh) * 2008-03-14 2008-12-03 北京信路威科技发展有限公司 一种车牌识别装置
JP2010191909A (ja) * 2009-02-20 2010-09-02 Mitsubishi Heavy Ind Ltd 文字認識装置及び文字認識方法
US20130004076A1 (en) * 2011-06-29 2013-01-03 Qualcomm Incorporated System and method for recognizing text information in object

Family Cites Families (32)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4454506A (en) * 1981-09-04 1984-06-12 Bell Telephone Laboratories, Incorporated Method and circuitry for reducing flicker in symbol displays
JP3519134B2 (ja) * 1994-08-10 2004-04-12 富士通株式会社 ソフトウェア使用量測定装置およびマルチメディア情報出力装置
US6853984B1 (en) 1997-04-08 2005-02-08 Propay U.S.A., Inc. Method and apparatus for credit card processing via facsimile
US7505604B2 (en) * 2002-05-20 2009-03-17 Simmonds Precision Prodcuts, Inc. Method for detection and recognition of fog presence within an aircraft compartment using video images
CN1170251C (zh) * 2003-03-14 2004-10-06 西安交通大学 啤酒瓶凸性字符提取与识别硬件系统及处理方法
US7756357B2 (en) * 2003-07-01 2010-07-13 Olympus Corporation Microscope system for obtaining high and low magnification images
JP3990375B2 (ja) * 2004-03-30 2007-10-10 東芝ソリューション株式会社 画像処理装置および画像処理方法
CN1684097A (zh) * 2004-04-16 2005-10-19 中国科学院自动化研究所 一种实时ic卡数字字符识别与校验系统及方法
KR100647284B1 (ko) * 2004-05-21 2006-11-23 삼성전자주식회사 영상의 문자 추출 장치 및 방법
JP4616096B2 (ja) * 2005-07-12 2011-01-19 オリンパス株式会社 動画撮像装置および撮像プログラム
TWI265715B (en) * 2005-07-21 2006-11-01 Inventec Appliances Corp Method for collecting business card data in mobile communication apparatus
US7706610B2 (en) * 2005-11-29 2010-04-27 Microsoft Corporation Segmentation of objects by minimizing global-local variational energy
US7826665B2 (en) * 2005-12-12 2010-11-02 Xerox Corporation Personal information retrieval using knowledge bases for optical character recognition correction
US7802720B2 (en) * 2008-01-04 2010-09-28 Intuit Inc. Method and system for performing a card-present transaction using image capture on a portable device
EP2088548A1 (en) * 2008-02-11 2009-08-12 Accenture Global Services GmbH Point of sale payment method
EP2260646B1 (en) * 2008-03-28 2019-01-09 On-net Surveillance Systems, Inc. Method and systems for video collection and analysis thereof
JP5540553B2 (ja) * 2008-06-30 2014-07-02 株式会社リコー 画像処理装置、画像形成装置、画像処理方法及び画像処理プログラム
KR101102572B1 (ko) 2009-01-15 2012-01-04 주식회사 비츠로씨앤씨 차량 번호판 인식방법
CN101510258B (zh) * 2009-01-16 2013-02-13 北京中星微电子有限公司 一种证件验证方法、系统及一种证件验证终端
JP4875117B2 (ja) * 2009-03-13 2012-02-15 株式会社東芝 画像処理装置
US8290273B2 (en) * 2009-03-27 2012-10-16 Raytheon Bbn Technologies Corp. Multi-frame videotext recognition
CN101515325B (zh) * 2009-04-08 2012-05-23 北京邮电大学 基于字符切分和颜色聚类的数字视频中的字符提取方法
JP5293514B2 (ja) * 2009-09-08 2013-09-18 株式会社リコー 画像処理装置及び画像処理プログラム
JP5500996B2 (ja) * 2010-01-06 2014-05-21 キヤノン株式会社 画像処理装置及び画像処理方法
JP2012094936A (ja) * 2010-10-22 2012-05-17 Sony Corp 画像処理装置、および画像処理方法、並びにプログラム
US20130202185A1 (en) 2012-02-08 2013-08-08 Scientific Games International, Inc. Method for optically decoding a debit or credit card
US9754172B2 (en) * 2012-03-02 2017-09-05 Nissan Motor Co., Ltd. Three-dimenisional object detection device
CN102708356B (zh) * 2012-03-09 2014-04-09 沈阳工业大学 一种基于复杂背景下的车牌自动定位和识别方法
US8990223B2 (en) * 2012-06-29 2015-03-24 Rovi Guides, Inc. Systems and methods for matching media content data
US20140052636A1 (en) 2012-08-15 2014-02-20 Jumio Inc. Image Processing For Credit Card Validation
CN102880859A (zh) * 2012-08-30 2013-01-16 华南理工大学 一种车牌识别方法
CN109766890B (zh) * 2013-06-03 2020-11-06 支付宝(中国)网络技术有限公司 信息识别方法、设备和系统

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05225388A (ja) * 1991-10-04 1993-09-03 Canon Inc 画像処理方法及びその装置と、文字認識方法及びその装置と、統合オフィスオートメーション機器
JP2005037902A (ja) * 2003-07-01 2005-02-10 Olympus Corp 顕微鏡システム、顕微鏡画像表示システム、観察体画像表示方法、及びプログラム
CN201159903Y (zh) * 2008-03-14 2008-12-03 北京信路威科技发展有限公司 一种车牌识别装置
JP2010191909A (ja) * 2009-02-20 2010-09-02 Mitsubishi Heavy Ind Ltd 文字認識装置及び文字認識方法
US20130004076A1 (en) * 2011-06-29 2013-01-03 Qualcomm Incorporated System and method for recognizing text information in object
JP2014524085A (ja) * 2011-06-29 2014-09-18 クゥアルコム・インコーポレイテッド オブジェクトにおけるテキスト情報を認識するための方法およびシステム

Also Published As

Publication number Publication date
SG10201606988WA (en) 2016-10-28
CN109766890B (zh) 2020-11-06
KR101836071B1 (ko) 2018-03-08
CN104217202A (zh) 2014-12-17
WO2014195802A2 (en) 2014-12-11
US9367753B2 (en) 2016-06-14
EP3005234A4 (en) 2017-03-15
TW201447775A (zh) 2014-12-16
US20160247037A1 (en) 2016-08-25
KR20160014728A (ko) 2016-02-11
EP3005234A2 (en) 2016-04-13
US20140355883A1 (en) 2014-12-04
SG11201509903TA (en) 2016-01-28
US10210415B2 (en) 2019-02-19
JP6255486B2 (ja) 2017-12-27
CN104217202B (zh) 2019-01-01
WO2014195802A3 (en) 2015-04-23
CN109766890A (zh) 2019-05-17

Similar Documents

Publication Publication Date Title
JP6255486B2 (ja) 情報認識のための方法及びシステム
US20230117712A1 (en) Feature density object classification, systems and methods
WO2019061658A1 (zh) 眼镜定位方法、装置及存储介质
EP2973226A1 (en) Classifying objects in digital images captured using mobile devices
CN111008935B (zh) 一种人脸图像增强方法、装置、系统及存储介质
GB2517674A (en) Image capture using client device
JP5656768B2 (ja) 画像特徴量抽出装置およびそのプログラム
CN114255337A (zh) 文档图像的矫正方法、装置、电子设备及存储介质
JP2017120503A (ja) 情報処理装置、情報処理装置の制御方法、及びプログラム
US20150112853A1 (en) Online loan application using image capture at a client device
US10373329B2 (en) Information processing apparatus, information processing method and storage medium for determining an image to be subjected to a character recognition processing
WO2020244076A1 (zh) 人脸识别方法、装置、电子设备及存储介质
CN111079624A (zh) 一种样本信息采集的方法、装置、电子设备以及介质
CN108304840B (zh) 一种图像数据处理方法以及装置
CN112907206B (zh) 一种基于视频对象识别的业务审核方法、装置及设备
JP2017120455A (ja) 情報処理装置、プログラム及び制御方法
Sharma et al. An analysis of vision based techniques for quality assessment and enhancement of camera captured document images
CN107045522A (zh) 一种基于掌纹数据的业务处理方法和装置
CN117746442A (zh) 手写签名验证方法、装置及电子设备
CN112073684A (zh) 一种通用图像视频资源采集的方法

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20161110

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20161206

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170227

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20170704

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20171020

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20171020

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20171109

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20171128

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20171204

R150 Certificate of patent or registration of utility model

Ref document number: 6255486

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250