JP4995554B2 - 光学式文字認識補正のための知識ベースを利用した個人情報の検索方法 - Google Patents

光学式文字認識補正のための知識ベースを利用した個人情報の検索方法 Download PDF

Info

Publication number
JP4995554B2
JP4995554B2 JP2006329176A JP2006329176A JP4995554B2 JP 4995554 B2 JP4995554 B2 JP 4995554B2 JP 2006329176 A JP2006329176 A JP 2006329176A JP 2006329176 A JP2006329176 A JP 2006329176A JP 4995554 B2 JP4995554 B2 JP 4995554B2
Authority
JP
Japan
Prior art keywords
text
image
image segment
text content
business card
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2006329176A
Other languages
English (en)
Other versions
JP2007164785A (ja
Inventor
ブレッサン マルコ
デジャン エルベ
アール ダンス クリストファー
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xerox Corp
Original Assignee
Xerox Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xerox Corp filed Critical Xerox Corp
Publication of JP2007164785A publication Critical patent/JP2007164785A/ja
Application granted granted Critical
Publication of JP4995554B2 publication Critical patent/JP4995554B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/12Detection or correction of errors, e.g. by rescanning the pattern
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/26Techniques for post-processing, e.g. correcting the recognition result
    • G06V30/262Techniques for post-processing, e.g. correcting the recognition result using context analysis, e.g. lexical, syntactic or semantic context
    • G06V30/268Lexical context
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Character Discrimination (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、情報技術に関する。特に、携帯電話の内蔵カメラを用いて撮影した名刺から、テキストの個人情報を摘出する方法および装置に関する。本発明は、全般的には、デジタルカメラ、ハンディスキャナなどの携帯撮像機によって取得した画像からテキストの個人情報を摘出すること、および携帯撮像機をテキスト抽出技術などと組み合わせて使用して、個人情報を取得することに関する。
デジタルカメラ内蔵型携帯電話は、ビジネスマンや専門家により一般的に持ち運ばれている機器である。用途は広いが、携帯電話のデジタルカメラ部分に適用される使用法の1つとして、名刺を素早く取り込むことが挙げられる。初対面の人、または転職や昇格などによって個人情報が変更された人に会ったときに、携帯電話の内蔵カメラを使用してその人の名刺を撮影し、名刺のデジタル画像を作成できれば、ビジネスマンや専門家にとって便利である。実質的に、デジタルカメラ内蔵型携帯電話を、携帯インスタント・ドキュメント・スキャナとして使用することになる。
しかしながら、写真は画像形式なので、テキスト形式の個人用連絡先リストや他のテキスト形式のデータベースへの入力に、文字の内容をそのまま使用することはできない。
光学式文字認識(OCR)ソフトウェアは、画像から文字情報を抽出する。したがって携帯電話の内蔵デジタルカメラで撮った名刺から、OCRを使用して文字情報を抽出すると、望ましい組み合わせになる。一旦テキストを抽出すれば、テキストの各行をデータの種別に応じて適宜タグ付けし(テキスト行を個人名、肩書き、所属団体などでタグ付けする)、必要であれば、連絡先データベースに取り込むことができる。
しかしながら実際には、デジタルカメラにより撮影した名刺画像に、OCRを効果的に適用するのは難しいことが分かっている。
1つの問題として、携帯電話における内蔵デジタルカメラの解像度が一般的に低いことが挙げられる。現存の携帯電話に内蔵されたカメラの解像度は、一般的なディスプレイモニタの荒い画素密度に対応した、いわゆるVGA解像度である場合がある。現存する携帯電話によっては、約1〜2メガピクセル以上のより高い解像度を持つものもある。画素当たりのコストが下がれば、内蔵カメラの解像度は、上がるだろうと予想されている。しかしながら、解像度が改善されても、低品質の光学系により画質は限られてしまうであろう。物理的な光学系の製造コストは電子機器と比べて高いので、製造者は限られた品質の光学系を利用しがちである。レンズの品質は、解像度と比べ実質的に改良が遅く、このような一般的な携帯電話カメラの状況は、近い将来において実質的に改善されそうにない。さらに、携帯電話は、よりコンパクトに、より薄くなる傾向にあり、光学系の小型化が要求されるので、光学的品質を高く製造することは難しくなる。低品質のレンズにおいて一般的な悪影響には、画像ノイズ、収差、アーティファクト、およびぼけが含まれる。OCRは、これらの条件下では誤りがより多くなり、不確実性がより増大する。
さらに、名刺の撮像中は、携帯電話は手で保持され、小さな名刺に焦点を合わせることになる。したがって、撮影中にカメラが不安定になり、ぼけ、アーティファクト、または他の画像劣化が生じる。撮像は、光の変化、強い影、非熟練者による使用、対象物までの距離の変化、三次元における視角の変化など、管理されない条件の下で一般的に行われる。取得された文書画像の向きには、多くの場合、縮尺、ゆがみ、および/または回転要素が実質的に含まれ、また、照度の実質的な変化が含まれる可能性がある。まとめると、カメラの物理的特性、理想的ではない撮像環境、および一般的に限られた操作者の撮影技術が重なって、一般的に携帯電話の内蔵デジタルカメラでは、比較的に実質上不備のある品質の名刺画像が取得されるので、OCRにおいて実質的な誤りや不確実性につながりやすい。
名刺のテキスト内容も、OCRを正確にする助けになるものではない。一般的なOCR処理では、対象物を認識し、文字、数字、句読点、または他の活字としてパターン照合により識別するが、文字の表現が最適ではなかったり、テキストフォントが違ったりするなどの理由により、不確実性が残ることになる。このような問題点を克服するため、OCR処理では、不確実な言葉やフレーズを電子辞書または文法チェッカと比較し、不確実性を解決する。このような手法は、名刺のテキスト内容に対してOCR変換を適用する場合は、わりと効果が薄い。なぜなら、その内容(個人名、肩書き、団体、住所など)は、一般的に電子辞書にはなく、また通常の文法規則に従わないからである。したがって、このようなテキスト内容の性質により、OCRにおいて解決できない誤りや不確実性を生じやすい。
本発明の一態様では、連絡先データベースを更新するシステムが提供される。携帯撮像機は、名刺電子画像を取得するように構成されている。画像セグメント化部は、その名刺デジタル画像からテキスト画像セグメントを抽出するように構成されている。光学式文字認識装置(OCR)は、各テキスト画像セグメントに対して、1つまたは複数のテキスト内容候補を生成するように構成されている。スコアリングプロセッサは、各テキスト内容候補に対するデータベースへの問い合わせの結果に基づいて、テキスト内容候補をスコアリングするように構成されている。内容セレクタは、少なくとも割り当てられたスコアに基づいて、各テキスト画像セグメントに対するテキスト内容候補を選択する。インタフェースは、選択されたテキスト内容候補に基づいて、連絡先データベースを更新するように構成されている。
本発明の他の態様では、個人情報を取得する方法が提供される。名刺画像を取得し、この名刺画像からテキスト画像セグメントを抽出する。光学式文字認識(OCR)をテキスト画像セグメントに適用して、複数のテキスト内容候補を生成する。テキスト内容候補ごとに、少なくとも1つのデータベースへの問い合わせを実行する。少なくともこの問い合わせに対して返されたレコードに基づいて、最も可能性の高い1つのテキスト内容候補を選択する。
本発明のさらに他の態様では、光学式文字認識(OCR)によって抽出した名刺画像のテキスト画像セグメントに対するテキスト内容候補から、テキスト内容レコードを生成するシステムが提供される。データベースへの問い合わせでは、テキスト内容候補ごとに少なくとも1つのデータベースに問い合わせを実行し、問い合わせごとに返されたレコードを収集する。内容候補スコアリングプロセッサは、収集したレコードに基づいて、テキスト内容候補にスコアを割り当てる。内容セレクタは、少なくとも割り当てられたスコアに基づいて、各テキスト画像セグメントに対するテキスト内容候補を選択する。
図1において、ビジネスマンや専門家、または他の個人が名刺10を受け取り、連絡先データベースや連絡先リストなどに追加したいと望む。そこで、携帯撮像機12を使用して名刺10の画像を取得する。携帯撮像機12として、例えば、デジタルカメラ内蔵型携帯電話、携帯デジタルカメラ、ハンディ・ドキュメント・スキャナなどが挙げられる。携帯電話は、ビジネスマンおよび専門家が会議や他の集まりの場に持ち込む一般的な携帯機器であるので、携帯撮像機12として携帯電話の内蔵カメラを使用すると都合がよい。携帯電話の内蔵カメラまたはオートフォーカス型デジタルカメラを使用すると、シャッタボタンを押せば名刺画像を取得することができる。ただし、携帯スキャナや他のスキャンベースの携帯撮像機を用いて画像を取得することも可能である。
図示した実施形態において、名刺10は、約5.1 × 約8.9センチメートル(2 × 3.5インチ)または他の同様のサイズの名刺であって、ビジネスマンや専門家が一般的に携帯する物理的なカードである。しかしながら、携帯撮像機によりデジタル画像化し、かつテキストの個人情報を抽出して連絡先データベースに取り入れるのに都合がよい、他の印刷された略式の個人情報も、「名刺」という用語には含まれる。例えば、ここでの「名刺」という用語は、OHPによるプレゼンテーションにおける、タイトルスライドのハードコピー上にある発表者に関する情報や、科学論文や技術論文のプレプリントなどの最初のページ上にある著者情報などを含む。名刺の個人情報の内容には、個人名、肩書き、所属先(会社名、大学名、事務所名など)、デザインされた所属先ロゴ(企業ロゴ、大学ロゴ、事務所ロゴなど)、勤務先住所情報、勤務先電話番号、勤務先FAX番号、メールアドレスなどが一般的に含まれる。もらった名刺には、これらの内のいくつかの項目のみ、またはすべての項目が含まれる場合もあれば、付加的な情報、または他の情報が含まれる場合もある。
必要であれば、画像プレプロセッサ14により、取得した名刺画像に対して画像事前処理を指定して行う。このような事前処理には、例えば、画像の四角化、画像のサイズ変更、ぶれ補正、影補正、反射補正、または他の補正、名刺画像のモノクロ化、画像圧縮などが含まれる。実施形態によっては、携帯電話または他の携帯撮像機12上に設けられ、かつ実行されるモバイル・ドキュメント・イメージング・ソフトウェア(フランス、グルノーブルに所在するゼロックス社の欧州研究センタ(Xerox Research Centre Europe)より入手可能)に、画像プレプロセッサ14を組み込む。他の実施形態では、画像プレプロセッサを、携帯撮像機12上に設けられ、かつ実行される、他のプレプロセッサソフトウェアとすることも可能である。別の実施形態では、画像プレプロセッサ14を、ネットワークサーバ上、パソコン上、または他のコンピュータ上で実行することもできる。その場合、画像プレプロセッサ14は、有線または無線(ブルートゥース接続や携帯電話網接続など)の適切な通信経路を介して、携帯電話または他の携帯撮像機12から、名刺画像を受け取るものである。
引き続き図1を参照すると共に図2においても、取得した、そして任意により事前処理した名刺画像は、画像セグメント化部16によりセグメント化され、テキスト画像セグメント20および任意のロゴ画像セグメント22が抽出される。各テキスト画像セグメント20は、名刺画像のテキスト1行中のドットマトリクス表示に適宜対応する。図2の名刺の例では、次の5つのテキスト画像セグメントを含むことになろう。つまり、「ジョンH.スミス(John H. Smith)」、「プロセスエンジニア」、「ABCウィジェット社」、「12345メインストリート」、「ニューヨーク、NY 11111」である。テキスト画像セグメントは、カーニングなどのフォントの特徴を保持する。なぜなら、テキスト画像セグメントは、文字ベースではないからである。この例では、テキスト画像セグメントは、テキストの物理的な各行に対応する。ただし、名刺のレイアウトや画像セグメント化部16に実装されたセグメント化アルゴリズムによっては、テキスト画像セグメントを実施形態により物理的なテキスト行以外のグループに対応させることもできる。
同様に、画像セグメント化部16は、任意でロゴ画像セグメント22も抽出することができる。図2の名刺の例では、ロゴ画像セグメント22は、名刺の左側にある1つのロゴを含むであろう。そのロゴは、ABCウィジェット社の仕掛け(widget)製品を暗示するように、左側の「W」にAが入って記されており、社名である「ABC」を示している。
光学式文字認識装置(OCR)26は、各テキスト画像セグメント20を処理して、文字ベースのテキスト内容候補30を生成する。OCR作業は、パターン認識アルゴリズム、または予期した文字の形状と比較することにより文字を認識するアルゴリズムに基づく。OCR処理の出力には、さまざまな要因により、誤りまたは不確実性が生じることが見込まれる。例えば、印刷されている文字と予期されているパターンが理想的な合致にならない、画像品質が最適ではない(画像プレプロセッサ14による改善にもかかわらず)、名前や住所などが通常のテキスト内容に不足している、実質的に装飾的な、または他のデザイン的な特徴により比較するのが難しいフォントである、などが挙げられる。したがって、OCR26は、各テキスト画像セグメントに対して、1つ、または複数(不確実性があった場合)の文字ベースのテキスト内容候補を出力する。例えば、「ジョンH.スミス」というテキスト画像セグメントをOCR処理すると、「ジョンN.スミス(John N. Smith)」、「ヨンH.スニス(Yohn H. Srnith)」、「ジョンH.スミス(John H. Smith)」など、数個の違ったテキスト内容候補を提示する可能性がある。
不確実性を解決するために、OCR26は、追加の情報、またはスペルチェック、文法チェックなどの変換後処理を任意で利用する。しかしながら、名刺には通常、個人名や住所などの一般的に辞書に記載されていない内容が含まれ、かつ名刺の内容は文法的に正しい形式で配置されていないので、辞書や文法チェックを用いて不確実性を解決しようとしても、本願では有効的ではない可能性が高い。
他の実施形態では、パターン合致度、および任意により、テキスト内容候補全体(またはテキスト内容候補内の単語)が辞書の用語に合致するかどうかなどの他の情報に基づいて、OCR26は各テキスト内容候補に信頼レベルを割り当てる。ここでも、一般的な名刺における非標準的な内容、フォント、およびテキストレイアウトにより、OCR26がテキスト内容候補に割り当てる信頼レベルは、他の一般的なOCRアプリケーションよりも疑わしいものになるであろう。
必要であれば、セグメントタッガー32により、テキスト画像セグメント20にタグ付けをして、各テキスト画像セグメントが伝えている内容の種別を示すようにする。例えば、名刺のタグとして適するものには、「個人名」、「肩書き」、「団体」(会社や大学など、所属先にふさわしいタグ)、「住所」などが含まれる。セグメントタッガー32は、テキスト画像20にタグ付けする際にさまざまな情報を使用することができる。例えば、最初の行、および/またはフォントサイズが一番大きな行は、多くの場合個人の名前であり、その個人の情報が名刺により伝えられている。したがって、テキスト画像セグメント「ジョンH.スミス」の位置と大きなフォントサイズにより、タッガー32はこのテキスト画像セグメントを個人名としてタグ付けすることができるであろう。相対的なフォントサイズは、テキスト画像セグメント20から適宜引き出すことができる。住所情報は、多くの場合数字から始まる。したがって、テキスト画像セグメント「12345メインストリート」は、タッガー32によって住所の最初の行としてタグ付けされるであろう。テキストが数字から始まっているという認識は、文字ベースのテキスト内容候補30から適宜引き出される。タッガー32は、一般的にテキスト画像セグメント20、テキスト内容候補30、またはその両方に作動する。OCR処理と同様に、セグメントタッガー32が任意に割り当てるタグは、通常不確実性をある程度含んでいることは理解されるであろう。
OCRおよびタグ付けの不確実性と限られた精度を考慮すると、テキスト内容候補30および割り当てられたタグには、通常ある程度の不確実性がある。1つのテキスト画像セグメントに対応する複数のテキスト内容候補から選択するために(例えば、テキスト画像セグメント「ジョンH.スミス」に対して「ジョンN.スミス」、「ヨンH.スニス」、「ジョンH.スミス」などから選択する)、テキスト内容候補スコアリングプロセッサ36は、各テキスト内容候補にスコアを割り当てる。各テキスト内容候補に割り当てられるスコアは、テキスト内容候補の正確度を示す重み、確率、または他の指標を反映する。連絡先レコード内容セレクタ38は、連絡先レコードに入れる各テキスト画像セグメント用のテキスト内容候補を、少なくとも割り当てられたスコアに基づいて選択する。テキスト内容候補スコアリングプロセッサ36は、各テキスト内容候補にスコアを割り当てるが、そのスコアは、各テキスト内容候補ごとに実行された少なくとも1つのデータベースに対する問い合わせにより収集されたレコードに基づく。
図1に、テキスト内容候補スコアリングプロセッサ36が問い合わせを実行するのに適している、いくつかのデータベースの概略を示す。例えば、インターネット住所録または名簿40、あるいは企業名簿42であり、これらは両方ともネットワーク経路44を介してアクセス可能である。または、個人用連絡先リスト46であり、このリストは携帯撮像機12(例えば、携帯電話の連絡先リスト)またはビジネスマンや専門家のパソコンに備わっている場合もある。後者には、名刺10が特定する個人を、その個人情報を取得した人はすでに知っているが、名刺10には更新された所属先情報(例えば、名刺10が特定する個人が最近転職した場合)、または役職(例えば、名刺10が特定する個人が最近昇格した場合)などが含まれている場合がある。
データベースの問い合わせにより、テキスト内容候補が妥当であるかどうかの情報が提供される。例に挙げたテキスト画像セグメント「ジョンH.スミス」では、各テキスト内容候補「ジョンN.スミス」、「ヨンH.スニス」、「ジョンH.スミス」に対して問い合わせが実行され、「ヨンH.スニス」は容易に除外されるものである。なぜなら、ヒットがほとんどまたはまったくないであろうからである。さらに、収集されたレコードは、タグ情報を更新するために役立つであろう。例えば、収集されたレコードに個人名としてタグ付けされた「ジョンH.スミス」が含まれていた場合、これによりテキスト画像セグメント「ジョンH.スミス」が個人名としてタグ付けされる傾向が高まる。実施形態によっては、任意に抽出されたロゴ画像セグメント22についても、ロゴデータベース48に対して問い合わせを実行する。そのロゴの問い合わせにより、ロゴに関するメタデータが返されるであろう。図2の名刺の例では、名刺の左にあるロゴに関するロゴの問い合わせにより、ロゴとABCウィジェット社とを関連付ける団体識別メタデータが返される可能性がある。このことにより、テキスト画像セグメント「ABCウィジェット社」に対して可能性のある複数のテキスト内容候補から「ABCウィジェット社」を選択できるようになる。
連絡先レコード内容セレクタ38は、連絡先レコードに入れるために、各テキスト画像セグメントに対して、最も可能性の高いテキスト内容候補を1つ選択する。連絡先レコードは、連絡先データベース、例えば企業名簿42、個人用連絡先リスト46、またはそれら両方の連絡先データベース42、46などに適宜保存される。必要であれば、ユーザインタフェース50を設けて、1つまたは複数の連絡先データベース42、46に保存する前に、名刺10により情報が伝えられている個人用に構築された連絡先レコードを、ユーザが確認し、任意で編集できるようにする。
前述したとおり、画像プレプロセッサ14を、携帯撮像機12(例えば、内蔵カメラ付き携帯電話のソフトウェアアプリケーションとして)に常駐させる場合もあるし、またはネットワークサーバやパソコンなどに常駐させる場合もある。同様に、画像セグメント化部16、OCRプロセッサ26、セグメントタッガー32、スコアリングプロセッサ36、連絡先レコード内容セレクタ38、およびユーザインタフェース50もさまざまな場所に設けることが可能である。実施形態によっては、処理要素14、16、26、32、36、38、50のすべてを携帯撮像機12に常駐させることも可能である。このような実施形態では、ネットワーク経路44は、無線携帯電話接続、インターネットホットスポットへの無線接続、または他の無線部分を適宜含むものである。他の実施形態では、処理要素14、16、26、32、36、38、50のいくつか、またはすべてをネットワークサーバやパソコンなどに常駐させる。処理段階の適切な時点で、データを携帯撮像機12からネットワークサーバやパソコンなどに転送する。このような実施形態では、ネットワーク経路44は、処理を実行するネットワークサーバやパソコンなどに適した有線または無線要素を含むであろう。後者の実施形態の1つの例として、画像プレプロセッサ14および画像セグメント化部16を、携帯撮像機12に携帯電話ベースのソフトウェアとして常駐させ、携帯電話ベースの画像セグメント化部16により出力されたテキスト画像セグメント20および任意のロゴ画像セグメント22を、企業ネットワーク(ネットワークサーバなど)に転送し、OCRおよびその後の処理を実行する。ネットワーク上に連絡先レコードを生成すれば、そのレコードを企業名簿42に保存することもできるし、および/または携帯撮像機12に返して、携帯撮像機に携帯電話連絡先リストとして常駐する個人用連絡先リスト46に保存することもできる。
引き続き図1を参照すると共に図3においても、テキスト内容候補スコアリングプロセッサ36の実施形態を、例として図示して説明する。データベースの問い合わせ60は、各テキスト内容候補20について、1つまたは複数のデータベース40、42、46に対して問い合わせを実行し、問い合わせごとに返されるレコードを収集する。ローカルスコアリングプロセッサ62は、テキスト内容候補ごとの問い合わせにより返されたレコードに基づいて、各内容候補のスコアを計算する。1つのデータベースのみに対して問い合わせが実行される場合は、テキスト内容候補に対する1つのローカルスコアpが問い合わせにより返されるレコード数またはヒット数の合計となる。複数のデータベースに対して問い合わせが実行される場合は、テキスト内容候補に対する1つのローカルスコアpは、次の数式により算出される。
Figure 0004995554
ここで、kは、問い合わせを受けたデータベースを示し、スコアk(p)は、各データベースのスコアを示し(例えば、スコアk(p)は、実施形態によっては、テキスト内容候補pごとの問い合わせに対するデータベースkから収集されたレコード数またはヒット数として計算されるのが適している)、またwkは、データベースの重み64の集合からデータベースkへ割り当てられた信頼度の重みを示す。信頼度の重みwkは、正しいテキスト内容候補をサポートし、誤ったテキスト内容候補をサポートしないという、データベースkの信頼度を示す。実施形態によっては、重みwkは省略され、各データベースにはローカルスコアを決定するのに等しい重みが与えられる。
実施形態によっては、問い合わせを受けるデータベースをユーザが選択することも可能であろう。例えば、名刺画像はユーザの会社の同僚に関するものであることをユーザが分かっている場合は、データベースの問い合わせ60によって実行される問い合わせを、対応する企業データベースに任意で制限する。一方、ユーザが名刺画像を勤務先の会社外の人から会議で取得した場合は、データベースの問い合わせ60によって実行される問い合わせは、インターネット住所名簿40のような他のデータベースを含むように広げられるのが好適である。
実施形態によっては、式(1)のローカルスコアに基づいて、複数のテキスト内容候補の中で、どれがテキスト画像セグメントに対して正しく抽出されたテキストかを判断することは適切である。しかしながら、計算的には分かりやすいが、もっぱらローカルなだけのこの方法では、さまざまなテキスト画像セグメント20間の相互関係によるメリットを生かすことができない可能性がある。図2の名刺を例として挙げると、名前「ジョンスミス」は、米国では一般的である。したがって、データベースの問い合わせにより、正しい「ジョンH.スミス」テキスト内容候補、および誤った「ジョンN.スミス」テキスト内容候補の両方のレコードを多数収集することになるであろう。このように、もっぱらローカルなだけの方法では、正しい「ジョンH.スミス」と誤った「ジョンN.スミス」を正確に区別することはできないであろう。このような不明確さは、テキスト画像セグメント「ABCウィジェット社」の問い合わせに対して収集されたレコードを考慮することで解決される可能性がある。正しいテキスト内容候補「ABCウィジェット社」に対して収集されたレコードには、「ジョンH.スミス」を含むレコードも含まれる可能性がある。なぜなら、彼はABCウィジェット社の社員だからである。そして、ABCウィジェット社にその名前の社員がいないと仮定すると、「ジョンN.スミス」が含まれている可能性は低い。
このため実施形態によっては、他のテキスト画像セグメント用の他のテキスト内容候補に対する問い合わせに対して返されたレコードの少なくとも1つに、第1テキスト内容候補が含まれていた場合に、グローバル調整部70により、第1イメージセグメントに対する第1テキスト内容候補のスコアを修正する。より概略的には、グローバル調整部70は、テキスト内容候補のスコアを、他のテキスト内容候補に対するデータベースの問い合わせの結果に基づいて、選択的に調整するように構成されている。1つの好適な実施形態において、グローバル調整部70は、次のスコア調整を実施する。
Figure 0004995554
ここで、レコードrがテキスト内容候補pを含む場合は、合致(r,p)=1である。含まない場合は、合致(r,p)=0である。また、|テキスト画像セグメント|は、データベースの問い合わせ60が問い合わせを実行したテキスト画像セグメント20の総数に等しい。テキスト内容候補が他のテキスト画像セグメントに対するテキスト内容候補のレコードと合致する場合は、そのスコアは高くなる。テキスト内容候補が、名刺画像における他の各テキスト画像セグメントすべてのテキスト内容候補と合致するレコードと合致する場合は、式(2)からなるグローバル調整部70による引き上げは最大となる。一方、テキスト内容候補が、名刺画像におけるどのテキスト内容候補にも合致しないレコードに合致した場合は、式(2)からなるグローバル調整部70による引き上げは最小となる。任意により、引き上げ係数を、複数のレコードに対して正規化する。
必要であれば、グローバル調整部70により、ロゴ画像セグメント22ごとに実施される画像データベースの問い合わせ74により返されたメタデータに基づいて、ローカルスコアを選択的に調整する。ロゴ画像を含むデータベースに問い合わせを実行し、ロゴ画像セグメント22と関連付けられたテキストメタデータを使用してスコアを調整できる。テキストメタデータは、例えば、会社名、会社住所などを含む。
実施形態によっては、データベースの問い合わせ60の結果を、テキスト画像セグメント20のタグの調整にも使用する。例えば、タグ調整部76により、テキスト内容候補に対して収集されたレコードのタグ付けに基づいて、セグメントタッガー32によりテキスト画像セグメントに既に割り当てられているタグを調整できる。例えば図2の名刺では、セグメントタッガー32がテキスト画像セグメント「プロセスエンジニア」に最初に誤って勤務先団体としてタグ付けした場合でも、「ジョンH.スミス」を含むレコードが肩書きまたは職業としてタグ付けされているテキスト「プロセスエンジニア」も含むので、タグ調整部76は、これらのレコードのタグを使用して、テキスト画像セグメント「プロセスエンジニア」のタグ付けを適宜正しく修正する。
連絡先レコード内容セレクタ38は、名刺10に対するレコードに含める各テキスト画像セグメント用の、最も可能性が高いテキスト内容候補を選択するために、結果として得られたスコア80を適宜使用する。必要であれば、OCR信頼レベル値などの他の情報とともに用いることもできる。
引き続き図3において、実施形態によっては、データベースの重み64の集合を、データベース重み調整部82によって自動的に調整する。例えば、ユーザがユーザインタフェース50を介してテキスト内容候補の誤った選択を修正したときには常に、訂正フラグ84を立てる。これがトリガとなり、データベース重み調整部82は、誤って間違った選択をサポートしたデータベースkの重みwkを相対的に下げる(一般的には、重みwkは正規化されるので、1つの重みwkが相対的に下がると、他のデータベースの重みが相対的に上がることになる)。同様に、ユーザが不適当なテキスト内容候補を正しいテキスト内容候補に置き換え、その正しいテキスト候補が他のデータベースk’によりサポートされていた場合は、対応する重みwk’は適宜相対的に上げられる。このようにデータベースの重み64を、テキスト内容候補のサポートにおける精度に基づいて継続的に調整することで、システムは、テキスト内容候補のサポートが多くの場合正しくないデータベースの重要度を下げ、テキスト内容候補のサポートが多くの場合正しいデータベースの重要度を上げることができる。
実施形態によっては、テキスト内容候補スコアリングプロセッサ36が出力するスコアのみに基づいて、連絡先レコード内容セレクタ38により、最も可能性の高いテキスト内容候補を選択することも可能である。
他の実施形態では、連絡先レコード内容セレクタ38は、最も可能性の高いテキスト内容候補を選択するために、他の情報や基準と合わせてスコアを使用する場合もある。このような実施形態では、データベースの問い合わせに対してヒットがない場合には、スコアの影響がないように、スコア計算を任意に設定する。例えば、1つの手法としては、文字合致度などの基準や、テキスト内容候補全体またはその一部が電子辞書に登録されているなどの基準に基づき、OCRプロセッサ26により各テキスト内容候補に対して信頼レベルを返す。テキスト内容候補プロセッサ36が特定のテキスト内容候補に高いスコアを割り当てた場合は、OCRプロセッサ26が割り当てる信頼レベルは上がり、一方、割り当てられた低いスコアは適宜無視される。これは、例えば、テキスト内容候補プロセッサ36が特定のテキスト内容候補に割り当てたスコアを、OCRプロセッサ26がテキスト内容候補に割り当てる信頼レベル値に加算することで実現できる。実施形態によっては、OCRの信頼レベルまたは他の標準に基づいて、最も可能性が高いと判断されたテキスト内容候補に対してヒットがなかった場合には、ユーザインタフェースを使用してユーザに対して警告を発行することも可能である。なぜなら、データベースにヒットが見つからないということは、テキスト内容候補の選択が誤っていることを示している可能性があるからである。
データベースの問い合わせに基づくスコアリング技術は、図3および式(1)、(2)を参照しながら図解して説明されている。熟練した技術者であれば、正確度を示すスコアをテキスト内容候補に割り当てるための他のスコアリングアルゴリズムを容易に構築できるであろう。概略的には、一般的にスコアリングは、データベースに頻繁に登場するテキスト内容候補が選択される可能性を高めるべきである。また、任意により、テキスト画像セグメントには、そのテキスト画像セグメントに対して可能性が高いテキスト内容候補に与えられたタグに合致するタグを選択する可能性を通常高める必要がある。必要であれば、スコアリングを、同じレコード内に一緒に見つかった他のテキスト画像セグメントのテキスト内容候補の正確度も選択的に高めるように構築する。なぜならこれにより、他のテキスト画像セグメントの一般的な相互関係を、スコアリングにおいて有利に考慮に入れられるからである。また、必要であれば、割り当てられたスコアを、OCR信頼レベルや、他の指標、つまり各テキスト画像セグメントに対する最も可能性の高いテキスト内容候補を1つ選択する際の正確度を示す指標と組み合わせる。
上記開示の変更形態、他の特性および機能、またはこの代替案は、他の多くの異なるシステムやアプリケーションに所望に応じて組み込むことができることは、明白であろう。また、現時点では予想外または想定外の代替案、変更、応用、または改良は、後で当業者により行われる可能性があるが、それらも本請求項により網羅されるものとする。
名刺画像を取得し、その名刺画像を処理して連絡先レコードを構築するシステムを、概略的に示す図である。 個人名、肩書き、勤務先企業、勤務先住所、および企業ロゴを含む、一般的な名刺の例を示す図である。 図1のシステムにおけるテキスト内容候補スコアリングプロセッサの主要部分を、概略的に示す図である。
符号の説明
12 携帯撮像機、20 テキスト画像セグメント、22 ロゴ画像セグメント、26 光学式文字認識装置(OCR)、38 連絡先レコード内容セレクタ、40 インターネット住所録または名簿、42 企業名簿、46 個人用連絡先リスト、48 ロゴデータベース、60 データベースの問い合わせ、62 ローカルスコアリングプロセッサ、80 スコア。

Claims (4)

  1. 個人情報を取得する方法であって、
    名刺画像を取得するステップと、
    前記名刺画像から複数のテキスト画像セグメントを抽出するステップと、
    光学式文字認識(OCR)を前記テキスト画像セグメントに適用して、各テキスト画像セグメントに対して1又は複数のテキスト内容候補を生成するステップと
    少なくとも1つのデータベースへの問い合わせにより返されたレコードに基づき、前記テキスト画像セグメントに対して生成されたテキスト内容候補の中から当該テキスト画像セグメントに含まれるテキストを選択する選択ステップと、
    前記選択ステップにより一の前記テキスト画像セグメントに含まれるテキストを選択する際に返されたレコードに、他のテキスト画像セグメントに対して生成されたテキスト内容候補が含まれていた場合、その含まれていたテキスト内容候補を当該他のテキスト画像セグメントに含まれるテキストと決定する決定ステップと、
    を含む方法。
  2. さらに、前記テキスト画像セグメントに対して、当該各テキストの内容を示すタグを割り当てる割当ステップを含み、
    前記決定ステップは、前記選択ステップによる問い合わせにより返されたレコードに、いずれかのタグといずれかのテキスト画像セグメントに対して生成されたテキスト内容候補とが対応付けられて含まれていた場合において、その対応付けが前記割当ステップにより割り当てられたタグとテキスト画像セグメントとの対応付けと異なる場合、前記割当ステップによる対応付けを当該レコードに含まれていた対応付けで修正する、請求項1に記載の方法。
  3. 前記選択ステップは
    少なくとも前記返されたレコードに基づき、前記各テキスト内容候補にスコアを割り当て、
    前記割り当てられたスコアに基づいて、前記テキスト内容候補から最も可能性の高い1つを選択する、請求項1に記載の方法。
  4. らに、前記名刺画像からロゴ画像セグメントを抽出するステップと、
    前記ロゴ画像セグメントごとに、少なくとも1つの画像データベースに問い合わせを実行するステップと
    を含み、
    記選択ステップ、前記ロゴ画像セグメントごとに少なくとも1つの前記画像データベースへの前記問い合わせにより返されたレコードに基づいて前記各テキスト内容候補にスコアを割り当てる、請求項3に記載の方法。


JP2006329176A 2005-12-12 2006-12-06 光学式文字認識補正のための知識ベースを利用した個人情報の検索方法 Expired - Fee Related JP4995554B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US11/299,453 US7826665B2 (en) 2005-12-12 2005-12-12 Personal information retrieval using knowledge bases for optical character recognition correction
US11/299,453 2005-12-12

Publications (2)

Publication Number Publication Date
JP2007164785A JP2007164785A (ja) 2007-06-28
JP4995554B2 true JP4995554B2 (ja) 2012-08-08

Family

ID=37853056

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006329176A Expired - Fee Related JP4995554B2 (ja) 2005-12-12 2006-12-06 光学式文字認識補正のための知識ベースを利用した個人情報の検索方法

Country Status (3)

Country Link
US (1) US7826665B2 (ja)
EP (1) EP1796019A1 (ja)
JP (1) JP4995554B2 (ja)

Families Citing this family (55)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070168382A1 (en) * 2006-01-03 2007-07-19 Michael Tillberg Document analysis system for integration of paper records into a searchable electronic database
US8306336B2 (en) * 2006-05-17 2012-11-06 Qualcomm Incorporated Line or text-based image processing tools
US8433729B2 (en) * 2006-09-29 2013-04-30 Sap Ag Method and system for automatically generating a communication interface
US8290270B2 (en) * 2006-10-13 2012-10-16 Syscom, Inc. Method and system for converting image text documents in bit-mapped formats to searchable text and for searching the searchable text
US7949191B1 (en) 2007-04-04 2011-05-24 A9.Com, Inc. Method and system for searching for information on a network in response to an image query sent by a user from a mobile communications device
US7849398B2 (en) 2007-04-26 2010-12-07 Xerox Corporation Decision criteria for automated form population
JP4960817B2 (ja) * 2007-09-19 2012-06-27 キヤノン株式会社 画像処理装置、および画像処理方法
JP5242202B2 (ja) * 2008-03-14 2013-07-24 京セラ株式会社 携帯通信端末
US8103132B2 (en) * 2008-03-31 2012-01-24 International Business Machines Corporation Fast key-in for machine-printed OCR-based systems
US20100014124A1 (en) * 2008-07-21 2010-01-21 Kevin Deal Portable business card scanner
US20100104187A1 (en) * 2008-10-24 2010-04-29 Matt Broadbent Personal navigation device and related method of adding tags to photos according to content of the photos and geographical information of where photos were taken
US8655803B2 (en) 2008-12-17 2014-02-18 Xerox Corporation Method of feature extraction from noisy documents
KR200445556Y1 (ko) * 2009-05-07 2009-08-11 김광환 명함이 저장관리되는 휴대용 전자지갑
US8452599B2 (en) * 2009-06-10 2013-05-28 Toyota Motor Engineering & Manufacturing North America, Inc. Method and system for extracting messages
US9135277B2 (en) 2009-08-07 2015-09-15 Google Inc. Architecture for responding to a visual query
US9087059B2 (en) 2009-08-07 2015-07-21 Google Inc. User interface for presenting search results for multiple regions of a visual query
US8670597B2 (en) 2009-08-07 2014-03-11 Google Inc. Facial recognition with social network aiding
US9405772B2 (en) 2009-12-02 2016-08-02 Google Inc. Actionable search results for street view visual queries
US8805079B2 (en) 2009-12-02 2014-08-12 Google Inc. Identifying matching canonical documents in response to a visual query and in accordance with geographic information
US8811742B2 (en) 2009-12-02 2014-08-19 Google Inc. Identifying matching canonical documents consistent with visual query structural information
US9183224B2 (en) * 2009-12-02 2015-11-10 Google Inc. Identifying matching canonical documents in response to a visual query
US8977639B2 (en) 2009-12-02 2015-03-10 Google Inc. Actionable search results for visual queries
US9852156B2 (en) 2009-12-03 2017-12-26 Google Inc. Hybrid use of location sensor data and visual query to return local listings for visual query
US8509534B2 (en) * 2010-03-10 2013-08-13 Microsoft Corporation Document page segmentation in optical character recognition
JP2012008733A (ja) * 2010-06-23 2012-01-12 King Jim Co Ltd カード情報管理装置
US8340425B2 (en) 2010-08-10 2012-12-25 Xerox Corporation Optical character recognition with two-pass zoning
US11610653B2 (en) * 2010-09-01 2023-03-21 Apixio, Inc. Systems and methods for improved optical character recognition of health records
US9874454B2 (en) * 2011-01-13 2018-01-23 Here Global B.V. Community-based data for mapping systems
US9418304B2 (en) 2011-06-29 2016-08-16 Qualcomm Incorporated System and method for recognizing text information in object
CN102231188A (zh) * 2011-07-05 2011-11-02 上海合合信息科技发展有限公司 结合文字识别和图像匹配的名片识别方法
CN102270296A (zh) * 2011-07-05 2011-12-07 上海合合信息科技发展有限公司 结合文字识别和图像匹配交换名片信息的方法
CN102393847B (zh) * 2011-07-05 2013-04-17 上海合合信息科技发展有限公司 判断联系人列表中是否存在欲添加名片的方法
US9082035B2 (en) * 2011-08-29 2015-07-14 Qualcomm Incorporated Camera OCR with context information
US11455350B2 (en) * 2012-02-08 2022-09-27 Thomson Reuters Enterprise Centre Gmbh System, method, and interfaces for work product management
JP5246364B1 (ja) * 2012-05-18 2013-07-24 富士ゼロックス株式会社 情報処理システム及びプログラム
US8639036B1 (en) 2012-07-02 2014-01-28 Amazon Technologies, Inc. Product image information extraction
US11151515B2 (en) * 2012-07-31 2021-10-19 Varonis Systems, Inc. Email distribution list membership governance method and system
CN104217202B (zh) * 2013-06-03 2019-01-01 支付宝(中国)网络技术有限公司 信息识别方法、设备和系统
US20150006362A1 (en) * 2013-06-28 2015-01-01 Google Inc. Extracting card data using card art
CN103927352A (zh) * 2014-04-10 2014-07-16 江苏唯实科技有限公司 利用知识库海量关联信息的中文名片ocr数据修正系统
RU2604668C2 (ru) * 2014-06-17 2016-12-10 Общество с ограниченной ответственностью "Аби Девелопмент" Визуализация машинно-генерируемого изображения документа
US20160125387A1 (en) 2014-11-03 2016-05-05 Square, Inc. Background ocr during card data entry
CN104915664B (zh) * 2015-05-22 2021-02-09 腾讯科技(深圳)有限公司 联系对象标识获取方法和装置
US20170046668A1 (en) * 2015-08-16 2017-02-16 Google Inc. Comparing An Extracted User Name with Stored User Data
US10157190B2 (en) * 2016-03-28 2018-12-18 Microsoft Technology Licensing, Llc Image action based on automatic feature extraction
US10069955B2 (en) * 2016-04-29 2018-09-04 Samuel Philip Gerace Cloud-based contacts management
JP6325604B2 (ja) * 2016-06-22 2018-05-16 株式会社ランドスケイプ 個人情報登録・管理システム
CN106683103A (zh) * 2016-12-30 2017-05-17 上海云丞聚智能科技有限公司 题目获取方法及装置
US12079706B2 (en) * 2019-04-30 2024-09-03 Clari Inc. Method for capturing and storing contact information from a physical medium using machine learning
CN110708401A (zh) * 2019-09-29 2020-01-17 北京百度网讯科技有限公司 名片生成的方法及装置
US11093774B2 (en) 2019-12-04 2021-08-17 International Business Machines Corporation Optical character recognition error correction model
CN112288548A (zh) * 2020-11-13 2021-01-29 北京沃东天骏信息技术有限公司 目标对象的关键信息的提取方法、装置、介质及电子设备
CN113420564B (zh) * 2021-06-21 2022-11-22 国网山东省电力公司物资公司 一种基于混合匹配的电力铭牌语义结构化方法及系统
US11487798B1 (en) * 2022-03-30 2022-11-01 Altada Technology Solutions Ltd. Method for identifying a data segment in a data set
US12033620B1 (en) * 2023-09-08 2024-07-09 Google Llc Systems and methods for analyzing text extracted from images and performing appropriate transformations on the extracted text

Family Cites Families (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2984862B2 (ja) * 1991-05-29 1999-11-29 株式会社日立製作所 名刺電子ファイリング装置
US5483052A (en) 1993-12-07 1996-01-09 Smith, Iii; Herbert J. System for reading, storing and using bar-encoded data from a coded business card or other printed material
US5604640A (en) 1994-01-31 1997-02-18 Motorola Business card scanner and method of use
US5754671A (en) * 1995-04-12 1998-05-19 Lockheed Martin Corporation Method for improving cursive address recognition in mail pieces using adaptive data base management
US5850480A (en) 1996-05-30 1998-12-15 Scan-Optics, Inc. OCR error correction methods and apparatus utilizing contextual comparison
GB9809679D0 (en) 1998-05-06 1998-07-01 Xerox Corp Portable text capturing method and device therefor
JP2000090192A (ja) * 1998-09-16 2000-03-31 Sharp Corp 住所および郵便番号の文字列修正方法
JP3774331B2 (ja) * 1999-05-27 2006-05-10 株式会社Pfu 個人情報記載媒体認識方法およびその個人情報記載媒体認識装置並びに記録媒体
US20010044324A1 (en) 1999-12-13 2001-11-22 Peter Carayiannis Cellular telephone
US7120302B1 (en) * 2000-07-31 2006-10-10 Raf Technology, Inc. Method for improving the accuracy of character recognition processes
US6823084B2 (en) 2000-09-22 2004-11-23 Sri International Method and apparatus for portably recognizing text in an image sequence of scene imagery
DE10104270A1 (de) 2001-01-31 2002-08-01 Siemens Ag Verfahren und System zum Verarbeiten von auf Informationsträgern dargestellten Informationen
US20020131636A1 (en) * 2001-03-19 2002-09-19 Darwin Hou Palm office assistants
US6778979B2 (en) 2001-08-13 2004-08-17 Xerox Corporation System for automatically generating queries
US6922487B2 (en) 2001-11-02 2005-07-26 Xerox Corporation Method and apparatus for capturing text images
US6783060B2 (en) 2002-05-02 2004-08-31 International Business Machines Corporation Smart business card system
US7106905B2 (en) 2002-08-23 2006-09-12 Hewlett-Packard Development Company, L.P. Systems and methods for processing text-based electronic documents
US7493322B2 (en) 2003-10-15 2009-02-17 Xerox Corporation System and method for computing a measure of similarity between documents
JP4597644B2 (ja) * 2003-11-28 2010-12-15 シャープ株式会社 文字認識装置、プログラムおよび記録媒体

Also Published As

Publication number Publication date
US20070133874A1 (en) 2007-06-14
JP2007164785A (ja) 2007-06-28
EP1796019A1 (en) 2007-06-13
US7826665B2 (en) 2010-11-02

Similar Documents

Publication Publication Date Title
JP4995554B2 (ja) 光学式文字認識補正のための知識ベースを利用した個人情報の検索方法
US10073859B2 (en) System and methods for creation and use of a mixed media environment
US9357098B2 (en) System and methods for use of voice mail and email in a mixed media environment
US8195659B2 (en) Integration and use of mixed media documents
US8600989B2 (en) Method and system for image matching in a mixed media environment
US7639387B2 (en) Authoring tools using a mixed media environment
US7885955B2 (en) Shared document annotation
US8335789B2 (en) Method and system for document fingerprint matching in a mixed media environment
US9405751B2 (en) Database for mixed media document system
US7669148B2 (en) System and methods for portable device for mixed media system
US8838591B2 (en) Embedding hot spots in electronic documents
US8521737B2 (en) Method and system for multi-tier image matching in a mixed media environment
US7917554B2 (en) Visibly-perceptible hot spots in documents
US8949287B2 (en) Embedding hot spots in imaged documents
US8332401B2 (en) Method and system for position-based image matching in a mixed media environment
US9171202B2 (en) Data organization and access for mixed media document system
US7551780B2 (en) System and method for using individualized mixed document
EP1917636A1 (en) Method and system for image matching in a mixed media environment
JP2010217996A (ja) 文字認識装置、文字認識プログラム、および文字認識方法
EP1917637A1 (en) Data organization and access for mixed media document system
US7508978B1 (en) Detection of grooves in scanned images
US10165149B2 (en) Methods and systems for automatically generating a name for an electronic document
JP2005055991A (ja) 携帯情報端末及びそれを用いた文字行抽出方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20091204

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20111216

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20111220

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120319

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120417

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120510

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150518

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees