JP7298227B2 - 情報処理装置、情報処理方法、情報処理プログラム及び情報処理システム - Google Patents

情報処理装置、情報処理方法、情報処理プログラム及び情報処理システム Download PDF

Info

Publication number
JP7298227B2
JP7298227B2 JP2019053899A JP2019053899A JP7298227B2 JP 7298227 B2 JP7298227 B2 JP 7298227B2 JP 2019053899 A JP2019053899 A JP 2019053899A JP 2019053899 A JP2019053899 A JP 2019053899A JP 7298227 B2 JP7298227 B2 JP 7298227B2
Authority
JP
Japan
Prior art keywords
image
unit
reference image
template
information processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2019053899A
Other languages
English (en)
Other versions
JP2020154895A (ja
Inventor
寿樹 杉山
慶二 大村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP2019053899A priority Critical patent/JP7298227B2/ja
Priority to CN202010203078.9A priority patent/CN111723641B/zh
Publication of JP2020154895A publication Critical patent/JP2020154895A/ja
Application granted granted Critical
Publication of JP7298227B2 publication Critical patent/JP7298227B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/413Classification of content, e.g. text, photographs or tables
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/153Segmentation of character regions using recognition of characters or words

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Image Analysis (AREA)
  • Arrangements For Transmission Of Measured Signals (AREA)

Description

本発明は、情報処理装置、情報処理方法、情報処理プログラム及び情報処理システムに関する。
今日において、カメラ装置で撮像した認識対象の撮像画像に基づいて文字等を抽出し、所定の記載欄に書き込んだ書類データの作成等を行う文字認識システムが知られている。
特許文献1(特開2015-114956号公報)には、ガスメータに表示されるガスの使用量の読み取りシステムが開示されている。この読み取りシステムの場合、正面を避けてカメラが設置された場合でも、撮像画像の歪みを補正することで、計測値の自動読みとりの精度低下を防止するようになっている。
しかし、特許文献1の技術では、撮像するカメラ装置又は撮像対象の位置ずれが生じた場合には、文字の読み取りを行うことが困難となる問題があった。
本発明は、上述の課題に鑑みてなされたものであり、カメラ装置又は認識対象の位置ずれ等の認識を困難にする事象が発生した場合でも認識対象の認識を可能とする情報処理装置、情報処理方法、情報処理プログラム及び情報処理システムの提供を目的とする。
上述した課題を解決し、目的を達成するために、本発明は、認識対象が撮像される撮像画像に含まれる基準画像を記憶する基準画像記憶部と、認識対象が撮像された撮像画像に対して認識対象のテンプレート画像に基づくパターンマッチング処理を行い、撮像画像に含まれる認識対象を認識するマッチング処理部と、撮像画像から基準画像を認識する基準画像認識部と、認識対象の認識率が所定以下となったタイミングで、基準画像認識部により認識された基準画像の変化を検出する変化検出部と、検出された基準画像の変化に基づいて、マッチング処理部におけるパターンマッチング処理に用いられる撮像画像又はテンプレート画像の少なくともいずれかに所定の処理を行うマッチング調整部とを有する。
本発明によれば、カメラ装置又は認識対象の位置ずれ等の認識を困難にする事象が発生した場合でも認識対象の認識を可能とすることができるという効果を奏する。
図1は、実施の形態の文字認識システムのシステム構成を示す図である。 図2は、文字認識用PCのハードウェア構成図である。 図3は、文字認識用PCのCPUが文字認識処理プログラムを実行することで実現される各機能の機能ブロック図である。 図4は、モニタ画面の撮像画像の一例を示す図である。 図5は、文字認識用PCにおける文字認識動作の流れを示すフローチャートである。 図6は、テンプレート画像の再作成動作の流れを示すフローチャートである。 図7は、基準画像の初期位置を示す図である。 図8は、基準画像が検出されず、処理画像が検出されるモニタ画面の撮像画像の例を示す図である。 図9は、一方の基準画像が検出されるモニタ画面の撮像画像の例を示す図である。 図10は、外乱光により、第1の基準画像及び第2の基準画像の各色(RGB値)が変化した様子を示す図である。 図11は、奥行方向(Z方向)に対して位置ずれが発生している基準画像及び処理画像を示す図である。 図12は、奥行方向(Z方向)に対して位置ずれが発生している基準画像及び処理画像を特徴量抽出アルゴリズムに基づいて検出する様子を示す図である。 図13は、回転方向(θ方向)に対して位置ずれが発生している基準画像及び処理画像を示す図である。 図14は、回転方向(θ方向)に対して位置ずれが発生している基準画像及び処理画像を特徴量抽出アルゴリズムに基づいて検出する様子を示す図である。 図15は、回転方向(θ方向)の位置ずれに対応するテンプレート画像を説明するための図である。 図16は、縦横方向(XY方向)に対して位置ずれが発生している基準画像及び処理画像を示す図である。
以下、添付図面を参照して、情報処理装置、情報処理方法、情報処理プログラム及び情報処理システムの実施の形態となる文字認識システムの説明をする。
(システム構成)
図1は、実施の形態の文字認識システムのシステム構成を示す図である。この図1に示すように、実施の形態の文字認識システムは、一つ又は複数のカメラ装置1、文字認識処理用パーソナルコンピュータ装置(文字認識用PC)2、結果表示用PC3,管理用PC4、データベース5及びタブレット端末8を有している。
一つ又は複数のカメラ装置1は、LAN(Local Area Network)等のローカルネットワーク6を介して文字認識用PC2に接続されている。カメラ装置1は、認識対象となる文字が表示されたモニタ装置の表示画像を撮像し、この撮像画像を、ローカルネットワーク6を介して文字認識用PC2に接続する。
文字認識用PC2、結果表示用PC3、管理用PC4及びデータベース5は、工場内ネットワーク7を介して相互に接続されている。後述するが、文字認識用PC2は、カメラ装置1から供給された撮像画像中の「基準画像」及び「文字」を抽出し、「基準画像のテンプレート画像」及び「文字のテンプレート画像」をそれぞれ形成して記憶する。
文字認識用PC2は、通常、この「基準画像のテンプレート画像」及び「文字のテンプレート画像」に基づいて、カメラ装置1で撮像された撮像画像から文字の抽出を行う。文字認識用PC2は、抽出した文字の文字データを、予め定められた形式の書類の記入欄に入力した書類データを作成し、データベース5に記憶する。データベース5に記憶された書類データ(及び抽出した文字の文字データ)は、結果表示用PC3、管理用PC4又はタブレット端末8等を介して閲覧可能となっている。
一方、カメラ装置1及びモニタ装置の相対的な位置関係にズレが生ずることで、カメラ装置1の撮像画像に基づいて文字認識処理が困難となった場合(文字認識率が所定以下となった場合)、文字認識用PC2は、この相対的な位置関係のズレによる基準画像の変化を検出する。また、文字認識用PC2は、基準画像の変化に基づいて、文字の新たなテンプレート画像が形成し、この新たなテンプレート画像に基づいて文字認識処理を行う。なお、新たなテンプレート画像を形成するタイミングは、文字認識処理が困難となったタイミングの他、管理者から指定されたタイミング、又は、定期又は不定期のタイミングでもよい。さらに、例えば文字認識対象の数値が「1.0000±0.5」であるのに対して、「1」と「7」を誤認識)することで認識結果が「7.0000」となった場合等のように、文字は認識しているが、あまりにも大きく変わる場合に、新たなテンプレート画像を形成してもよい。
(文字認識用PCのハードウェア構成)
図2に、文字認識用PC2のハードウェア構成を示す。この図2に示すように、文字認識用PC2は、CPU(Center Processing Unit)11、ROM(Read Only Memory)12、RAM(Random Access Memory)13、HDD(ハードディスクドライブ)14、操作インタフェース(操作I/F)15及び通信部16を有している。
HDD14には、文字認識処理プログラムの他、文字認識処理の基準となる基準画像及び各文字のテンプレート画像が記憶されている。CPU11は、この文字認識処理プログラムを実行することで、テンプレート画像に基づく文字認識処理を行うと共に、文字認識処理が困難となった場合に、文字の新たなテンプレート画像の形成処理を行う。
(文字認識用PCの機能構成)
図3は、文字認識用PC2のCPU11が文字認識処理プログラムを実行することで実現される各機能の機能ブロック図である。この図3に示すように、CPU11は文字認識処理プログラムを実行することで、画像取得部21、基準画像登録部22、処理画像登録部23、マッチング処理部26、処理結果出力部27、基準画像認識部28、処理画像認識部30及びマッチング調整部35の各機能を実現する。基準画像認識部28としては、CPU11は、RGB判別部31、Z,θ判別部32及びX,Y判別部33の各機能を実現する。
画像取得部21は、カメラ装置1で撮像された、認識する文字が表示されるモニタ画面の撮像画像を取得する。図4は、このモニタ画面の撮像画像の一例を示す図である。この図4に示す例は、四角で囲んで示すように、第1の電流値(A)及び第2の電流値(A)の数値が認識対象である場合の例である。図4の例では、第1の電流値は「0.5655A」及び第2の電流値が「0.1775A」となっている。
基準画像登録部22は、モニタ画面の撮像画像上の認識対象の抽出範囲を示す、いわばマーカとなる基準画像の座標情報の登録を行う。詳しくは後述するが、基準画像としては、中心軸回りに回動させた場合に、同じ形状とはならない形状の画像が用いられ、認識対象の抽出範囲の対角線上の端部から一定距離離れた位置にそれぞれ配置される。基準画像登録部22は、この2つの基準画像が配置された座標位置を示す座標情報を、HDD14等の記憶部(基準画像座標保存部)に記憶(登録)する。
なお、基準画像としては、一つ又は3つ以上の基準画像を配置してもよい。
処理画像登録部23は、モニタ画面の撮像画像上の認識対象の抽出範囲の例えば4つの角部の座標情報の登録を行う。処理画像登録部23は、認識対象の抽出範囲の4つの角部の座標情報を、HDD14等の記憶部(基準画像座標保存部)に記憶(登録)する。
マッチング処理部26は、HDD14等の記憶部に、予め記憶されている数字のテンプレート画像を用いて、モニタ画面の撮像画像に対する画像マッチング処理を行い、撮像画像から第1の電流値(A)及び第2の電流値(A)の数値を抽出する。
処理結果出力部27は、マッチング処理部26により抽出された第1の電流値(A)及び第2の電流値(A)の数値を出力する。CPU11は、所定の書類の指定された記入欄に、この第1の電流値(A)及び第2の電流値(A)の数値を入力処理した書類の書類データを形成し、図1に示す工場内ネットワーク7を介してデータベース5に記憶させる。
基準画像取得部の一例である基準画像認識部28は、モニタ画面の撮像画像上のR(赤)、G(緑)、B(青)の色合い、色相(Hue)、輝度(Lightness)、彩度(Saturation)、奥行上の位置(Z)、傾き具合(θ)、2次元上の位置(X,Y)等を判別して、モニタ画面の撮像画像から基準画像を認識する。
マッチング調整部35は、検出された基準画像の変化に基づいて、マッチング処理部26におけるパターンマッチング処理に用いられる撮像画像又はテンプレート画像のうち、少なくともいずれかに対して所定の処理を行う。マッチング調整部35には、テンプレート作成部29が含まれる。
テンプレート作成部29は、例えばモニタ画面の撮像画像から数字(認識対象の一例)の認識が困難となった際に、撮像画像上の現在の基準画像と、正常に数値を認識していた際の基準画像との差異(位置、傾き、大きさ、色合い等)に基づいて、テンプレート画像を作成し直す(テンプレート画像を補正する)。マッチング処理部26は、作成し直されたテンプレート画像を用いてマッチング処理を行うことで、パターンマッチング処理が所定以上の精度となるように調整を行うことができ、モニタ画面の撮像画像から正確に数値を認識することができる。
処理画像認識部30は、モニタ画面の撮像画像から基準画像を認識できない場合に、モニタ画面の撮像画像全体から、数値の検出範囲に相当する処理画像の認識を行う。
なお、画像取得部21~処理画像登録部23、及び、マッチング処理部26~基準画像認識部28、処理画像認識部30及びマッチング調整部35は、ソフトウェアで実現することとしたが、これらのうち全部又は一部を、IC(Integrated Circuit)等のハードウェアで実現してもよい。
また、文字認識処理プログラムは、インストール可能な形式又は実行可能な形式のファイル情報でCD-ROM、フレキシブルディスク(FD)などのコンピュータ装置で読み取り可能な記録媒体に記録して提供してもよい。また、文字認識処理プログラムは、CD-R、DVD(Digital Versatile Disk)、ブルーレイ(登録商標)ディスク、半導体メモリ等のコンピュータ装置で読み取り可能な記録媒体に記録して提供してもよい。また、文字認識処理プログラムは、インターネット等のネットワーク経由でインストールするかたちで提供してもよい。また、文字認識処理プログラムは、機器内のROM等に予め組み込んで提供してもよい。
(文字認識動作)
次に、図5のフローチャートを用いて、文字認識用PC2における文字認識動作の流れを説明する。この図5のフローチャートにおいて、ステップS1~ステップS4が、正常時における文字認識動作の流れを示している。すなわち、ステップS1では、基準画像認識部28が、基準画像記憶部の一例であるHDD14等の記憶部に記憶されている基準画像情報の読み出しを行う。また、マッチング処理部26が、HDD14等の記憶部に記憶されているマッチング処理用のテンプレート画像情報の読み出しを行う。
ステップS2では、マッチング処理部26が、HDD14等の記憶部から読み出したテンプレート画像情報に基づいて、画像取得部21で取得されたモニタ画面の撮像画像の指定された範囲(座標情報で示される処理画像の範囲)から、数値の認識処理を行う。そして、マッチング処理部26は、登録されている桁数分の数値が認識できたか否かを判別する。例えば、図4の例の場合、第1の電流値の桁数が、例えば「0」、「5」、「6」、「5」、「5」の5桁であり、第2の電流値の桁数が「0」、「1」、「7」、「7」、「5」の5桁である。このため、マッチング処理部26は、ステップS2において、第1の電流値及び第2の電流値の5桁の数値が、それぞれ認識できたか否かを判別する。
数値を認識できた場合、処理結果出力部27は、例えば認識した数値を、所定の書類の指定された記入欄に入力処理した書類の書類データを形成し、図1に示す工場内ネットワーク7を介してデータベース5に記憶させる等のデータ処理を行う(ステップS3、ステップS4)。このようなデータ処理が終了すると(ステップS4:Yes)、図5のフローチャートの全処理が終了する。
一方、例えばモニタ画面とカメラ装置1との相対的な位置関係にズレが生ずると、モニタ画面の撮像画像に基づいて数値の認識が困難となる。ステップS2で、数値の認識が困難と判別された場合(ステップS2:No)、マッチング処理部26は、例えば3回又は4回等の所定回数、リトライを繰り返す(ステップS5、ステップS6)。所定回数リトライしても数値の認識が困難な場合(ステップS5:Yes)、テンプレート作成部29は、ステップS7~ステップS9に示すテンプレート画像の再作成動作に移行する。
テンプレート画像の再作成動作の流れを簡単に説明すると、変化検出部の一例として動作するテンプレート作成部29は、まず、正常に数値が認識できていた初期の基準画像と、現在の基準画像とを比較し(ステップS7)、両者の変化を検出する(ステップS8)。そして、テンプレート作成部29は、検出した変化(位置、傾き、大きさ、色合い等)に基づいて、テンプレート画像を再作成し、HDD14等の記憶部に記憶し直す(ステップS9)。また、基準画像登録部22は、現在の基準画像を、HDD14等の記憶部に記憶し直す(ステップS9)。
基準画像認識部31は、このように再記憶された基準画像に基づいて、基準画像の認識処理を行う。また、マッチング処理部26は、このように再記憶されたテンプレート画像に基づいて、数値の認識処理を行う。これにより、モニタ画面の撮像画像から正確に数値を認識する正常動作に、文字認識システムを自動で復帰させることができる。
(テンプレート画像の再作成動作)
次に、図6のフローチャートを用いてテンプレート画像の再作成動作(ステップS7~ステップS9の動作)を詳細に説明する。まず、上述のように数値の認識が困難となり、複数回のリトライを行っても、数値の認識が困難であった場合、基準画像認識部28が、数値の認識が困難となっているモニタ画面の撮像画像から、予め位置、大きさ(サイズ)、及び、色合いが設定されている基準画像の認識を試みる(ステップS11)。
図7は、基準画像の初期位置を示している。この図7において、実線の枠は、パターンマッチング処理を行う処理範囲を示している。この図7の例の場合、この実線の枠内に「0」、「1」、「2」、「3」の数値が表示されている。マッチング処理部26は、テンプレート画像を参照して、この実線の枠内の数字を検出する。なお、この例では、マッチング処理により数字を認識することとして説明を進めているが、この他、アルファベット文字、平仮名文字、カタカナ文字、記号等の他の文字を認識してもよい。また、処理範囲内において、パターンマッチング処理を行うこととして説明を進めるが、モニタ画面の撮像画像全体を、パターンマッチング処理の対象としてもよい。
図7に示す長方形状の点線の枠は、数値の検出範囲を示している。この点線の枠の左上の角部から対角線に沿って左上方向に一定距離離れた位置に、第1の基準画像KG1が表示されている。同様に、点線の枠の右下の角部から対角線に沿って、右下方向に一定距離離れた位置に、第2の基準画像KG2が表示されている。
第1の基準画像KG1及び第2の基準画像KG2は、中心軸回りに回動させた場合に、同じ形状とはならない形状の画像が用いられる。一例ではあるが、第1の基準画像KG1としては、鍵型形状(L字形状)の画像が用いられる。また、第2の基準画像KG2としては、直角二等辺三角形状の画像を用いられる。第1の基準画像KG1及び第2の基準画像KG2は、それぞれ同じ形状としてもよいが、異なる形状とすることで、基準画像の認識率をより高いものとすることができる。
また、第1の基準画像KG1及び第2の基準画像KG2には、それぞれ異なる色が配色されている。一例として、第1の基準画像KG1は、赤色(R、G、B(各8ビット)=255、0、0)となっている。また、第2の基準画像KG2は、青色(R、G、B(各8ビット)=0、0、255)となっている。
また、第1の基準画像KG1及び第2の基準画像KG2の位置は、モニタ画面の座標位置で指定されている。この座標位置を示す座標情報が、HDD14等の記憶部に記憶されている。基準画像認識部28は、この記憶部に記憶された各基準画像KG1、KG2の座標情報に基づいて、第1の基準画像KG1及び第2の基準画像KG2の認識を行う。
図6のフローチャートのステップS11では、基準画像認識部28が、モニタ画面の撮像画像から、このような2つの基準画像KG1、KG2が検出されたか否かを判別する。2つの基準画像KG1、KG2が検出されない場合(ステップS11:No)、処理がステップS21に進み、基準画像認識部28が、2つの基準画像KG1、KG2のうち、いずれか一方の基準画像でも検出できたか否かを判別する。
各基準画像KG1、KG2を2つとも検出できない場合(ステップS21:No)、処理がステップS31に進み、処理画像認識部30が、モニタ画面の撮像画像全体から、図7に点線の枠で示した処理画像(数値の検出を行う範囲を示す画像)の検出を試みる。モニタ画面の撮像画像全体から処理画像が検出されないということは(ステップS32:No)、撮像画像に処理画像が写っていないことを意味する。すなわち、モニタ装置又はカメラ装置1にユーザ等が接触したことで、モニタ装置とカメラ装置1との相対的な位置関係に大きなずれが生じたことを意味している。この場合、ユーザは、モニタ画面を正確に撮像するように、画像カメラ装置1等の位置を再調整して(ステップS34)、この図6のフローチャートの処理を終了する。
これに対して、モニタ画面の撮像画像全体から処理画像を検出できた場合(ステップS32:Yes)、基準画像認識部28は、認識された処理画像に対して各基準画像KG1、KG2を設定する。一例ではあるが、図7を用いて説明したように、基準画像認識部28は、認識された処理画像の左上の角部から一定距離離れた位置に、第1の基準画像KG1を配置し、認識された処理画像の右下の角部から一定距離離れた位置に、第2の基準画像KG2を配置する(ステップS33)。このような処理画像の座標情報、及び、各基準画像KG1、KG2の座標情報は、基準画像登録部22又は処理画像登録部23により、HDD14等の記憶部に記憶し直される(処理画像及び各基準画像の再設定)。
なお、図8に示すように、第1の基準画像KG1を配置し直しても、遮蔽物等により検出が困難となる場合は、第1の基準画像KG1の元の位置の座標情報をキャンセルすると共に。第2の基準画像KG2のみを設定し直す。基準画像は、一つのみ設定しても、後述するように処理画像の検出が可能となる。
このような処理画像及び各基準画像KG1,KG2の再設定が行われると、マッチング処理部26は、ステップS15において、再設定された各基準画像KG1,KG2に基づいて処理画像を検出し、この検出した処理画像に含まれる数字を、テンプレート画像に基づいて検出する。この検出結果は、ステップS16において、処理結果出力部27により出力され、上述のように書類の所定の記入欄に入力される。
これに対して、例えば図9に示すように、モニタ画面の撮像画像から、2つの基準画像KG1,KG2のうち、一方の基準画像のみが認識できた場合(ステップS21:Yes)、基準画像認識部28は、認識できた一方の基準画像を特定して位置確認を行う(ステップS22、ステップS23)。基準画像登録部22は、特定された一方の基準画像(図9の例の場合は、第1の基準画像KG1)の座標情報を記憶部に記憶し直す。この場合、他方の基準画像の座標情報は、キャンセルする。また、処理画像登録部23は、特定した基準画像に基づいて処理画像を特定し、処理画像の座標情報を記憶部に記憶し直す。
このような処理画像及びいずれかの基準画像の再設定が行われると、マッチング処理部26は、ステップS15において、再設定された一方の基準画像に基づいて処理画像を検出し、この検出した処理画像に含まれる数字を、テンプレート画像に基づいて検出する。この検出結果は、ステップS16において、処理結果出力部27により出力され、上述のように書類の所定の記入欄に入力される。
一方、ステップS11において、2つの基準画像KG1、KG2が検出された場合(ステップS11:Yes)、処理がステップS12に進み、基準画像認識部28のRGB判別部32が、第1の基準画像KG1及び第2の基準画像KG2の各色(RGB値)に、外乱光による変化が生じているか否かを判別する(ステップS12)。
図10は、外乱光により、第1の基準画像KG1及び第2の基準画像KG2の各色(RGB値)が変化した様子を示している。設定時の第1の基準画像KG1のRGB値が「255、0、0」であったのに対して、外乱光により、「255、127、127」の値に変化している。また、設定時の第2の基準画像KG2のRGB値が「0、0、255」であったのに対して、外乱光により、「130、127、255」の値に変化している。
このような外乱光による影響がある場合(ステップS12:No)、処理がステップS41に進み、RGB判別部31が、各基準画像KG1,KG2のRGB値の確認を行う。そして、テンプレート作成部29が、各基準画像KG1,KG2のRGB値の変化に応じたテンプレート画像を作成して(ステップS42)、HDD14等の記憶部に記憶し直す。
具体的には、外乱光により、各基準画像KG1、KG2の発色が薄くなった場合、テンプレート作成部29は、各基準画像KG1、KG2と同様に、発色を薄くしたテンプレート画像を新たに作成して、HDD14等の記憶部に記憶し直す。反対に、外乱光により、各基準画像KG1、KG2の発色が濃くなった場合、テンプレート作成部29は、各基準画像KG1、KG2と同様に、濃い発色のテンプレート画像を新たに作成して、HDD14等の記憶部に記憶し直す。
このような外乱光による変化に対応したテンプレート画像が新たに作成されると、マッチング処理部26は、ステップS15において、新たに作成されたテンプレート画像に基づいてテンプレートマッチング処理を行い、処理画像に含まれる数字を検出する。この検出結果は、ステップS16において、処理結果出力部27により出力され、上述のように書類の所定の記入欄に入力される。
次に、外乱光の影響が無いものと判別することで(ステップS12:Yes)、ステップS13に処理が進むと、基準画像認識部28のZθ判別部32が、各基準画像KG1、KG2に対する奥行方向(Z方向)、又は、回転方向(θ方向)の位置ずれの有無を判別する。
Zθ判別部32は、例えばAKAZE(Accelerated KAZE)、SIFT(Scale-Invariant Feature Transform)、SURF(Speeded Up Robust Features)、KAZE、ASIFT(Affine-SIFT)、FAST(Features from Accelerated Segment Test)、RIFF(Rotation-Invariant Fast Feature)、BRIEF(Binary Robust Independent Elementary Features)、ORB(Oriented FAST and Rotated BRIEF)、BRISK(Binary Robust Invariant Scalable Key points)、又は、CARD(Compact And Real-time Descriptors)等の特徴量抽出アルゴリズムを用いて、各基準画像KG1,KG2の奥行方向(Z方向)及び回転方向(θ方向)の位置ずれの有無を判別する。
図11は、奥行方向(Z方向)に対して位置ずれが発生している例である。この図11の例の場合、各基準画像KG1,KG2及び処理画像が縮小される方向に位置ずれした例である。Zθ判別部32は、上述の特徴量抽出アルゴリズムに基づいて、図12に示すようにこのような奥行方向(Z方向)に対する位置ずれを検出し(ステップS13)、各基準画像KG1、KG2の、モニタ画面の撮像画像上の位置を確認する(ステップS51)。基準画像登録部22及び処理画像登録部23は、奥行方向(Z方向)の縮尺に対応した各基準画像KG1,KG2及び処理画像の座標情報を、HDD14等の記憶部に登録し直す。
また、テンプレート作成部29は、奥行方向(Z方向)の位置ずれに対応する縮尺のテンプレート画像を新たに形成し、HDD14等の記憶部に記憶する。このような縮尺の変化に対応したテンプレート画像が新たに作成されると、マッチング処理部26は、ステップS15において、新たに作成されたテンプレート画像に基づいてテンプレートマッチング処理を行い、処理画像に含まれる数字を検出する。この検出結果は、ステップS16において、処理結果出力部27により出力され、上述のように書類の所定の記入欄に入力される。
これに対して、図13に示すように各基準画像KG1,KG2に回転方向(θ方向)の位置ずれが発生している場合、基準画像登録部22は、図13及び図14に示すように回転が生じている処理画像の四隅が、四つのいずれかの辺上に位置する、回転が生じていない処理画像を形成し、この回転が生じていない処理画像の座標情報を、記憶部に記憶し直す。
同様に、テンプレート作成部29は、図13及び図15(a)、図15(b)に示すように、回転が生じているテンプレート画像の四隅が、四つのいずれかの辺上に位置する、回転が生じていないテンプレート画像を新たに形成し、この回転が生じていないテンプレート画像をHDD14等の記憶部に記憶する(ステップS52)。このような回転の変化に対応したテンプレート画像が新たに作成されると、マッチング処理部26は、ステップS15において、新たに作成されたテンプレート画像に基づいてテンプレートマッチング処理を行い、処理画像に含まれる数字を検出する。この検出結果は、ステップS16において、処理結果出力部27により出力され、上述のように書類の所定の記入欄に入力される。
なお、回転方向の位置ずれを補正する場合に、各基準画像KG1、KG2、処理画像及びテンプレート画像に対して、傾き補正処理を施して、回転方向の位置ずれを修正してもよい。
次に、奥行方向(Z方向)及び回転方向(θ方向)の位置ずれを検出しない場合(ステップS13:Yes)、処理がステップS14に進み、基準画像認識部28のXY判別部33は、横方向(X方向)又は縦方向(Y方向)に対する、各基準画像KG1、KG2の位置ずれの有無を判別する。
各基準画像KG1、KG2にXY方向の位置ずれが発生している場合(ステップS14:No)、処理画像登録部23は、ステップS61において、XY方向にずれている分だけ、ずらした処理画像の座標情報をHDD14等の記憶部に記憶する。なお、XY方向の位置ずれが発生している場合において、テンプレート作成部29は、テンプレート画像を新たに形成することはなく、予め登録されているテンプレート画像が、そのまま用いられて上述のマッチング処理が行われる。
ステップS14において、各基準画像KG1、KG2に位置ずれが発生していないと判別された場合、及び、XY方向の位置ずれに応じて処理画像の座標情報が登録し直された場合、処理はステップS15及びステップS16に進む。このステップS15及びステップS16では、上述のようにテンプレート画像に基づいて処理画像に含まれる数字が検出される。この検出結果は、ステップS16において、処理結果出力部27により出力され、上述のように書類の所定の記入欄に入力される。
(実施の形態の効果)
以上の説明から明らかなように、実施の形態の文字認識システムは、テンプレート画像を用いたテンプレートマッチング処理により、認識対象となる例えば数字の認識を行う。
文字認識が困難となった場合に、画像処理により補正し、又は、予め複数作成したテンプレートパターンを選択して用いるようにすると、文字認識用PC2のCPU11に掛かる負荷が大きくなるうえ、処理に長時間を要する。また、今後、例えば携帯端末装置又はシングルボードコンピュータ装置等の処理能力が低いCPUを備えた機器でも、撮像画像に基づく文字認識処理を可能とするためには、CPUに掛かる負荷を小さくすることが好ましい。
実施の形態の文字認識システムは、処理画像内の数字と、テンプレート画像の数字とを比較して合致の有無を判別するだけのテンプレートマッチング処理で文字認識を行うため、文字認識用PC2のCPU11に掛かる負荷を大幅に軽減することができる。このため、処理能力が低いCPUを備えた機器でも、撮像画像に基づく文字認識処理を可能とすることができる。
また、実施の形態の文字認識システムは、認識対象となる数字の認識が困難となった場合、各基準画像KG1、KG2の過去と現在の変化を検出し、この変化に対応して、テンプレートマッチング処理に用いる撮像画像又はテンプレート画像の、少なくともいずれかに所定の処理を行う。撮像画像に対して行われる所定の処理には、例えば、上述の傾き補正処理、及び、テンプレートマッチング処理を行う撮像画像中の所定の範囲を変更する処理等が含まれる。
また、テンプレート画像に対して行われる所定の処理には、例えば、上述のように、テンプレート画像の作成が含まれ、基準画像の変化に対応する新たなテンプレート画像を形成して、上述のテンプレートマッチング処理を行う。これにより、CPUに大きな負荷を掛けることなく、様々な変化に対応してテンプレート画像を形成して、数字等の認識対象の認識を行うことができる。
最後に、上述の実施の形態は、一例として提示したものであり、本発明の範囲を限定することは意図していない。この新規な実施の形態は、その他の様々な形態で実施されることが可能であり、発明の要旨を逸脱しない範囲で、種々の省略、置き換え、変更を行うことも可能である。また、実施の形態及び実施の形態の変形は、発明の範囲や要旨に含まれると共に、特許請求の範囲に記載された発明とその均等の範囲に含まれるものである。
1 カメラ装置
2 文字認識用PC
3 結果表示用PC3
4 管理用PC
5 データベース
6 ローカルネットワーク
7 工場内ネットワーク
8 タブレット端末
11 CPU
12 ROM
13 RAM
14 HDD
15 操作インタフェース(操作I/F)
16 通信部
17 マウス装置
18 キーボード装置
21 画像取得部
22 基準画像登録部
23 処理画像登録部
26 マッチング処理部
27 処理結果出力部
28 基準画像認識部
29 テンプレート作成部
30 処理画像認識部
31 RGB判別部
32 Z,θ判別部
33 X,Y判別部
特開2015-114956号公報

Claims (12)

  1. 認識対象が撮像される撮像画像に含まれる基準画像を記憶する基準画像記憶部と、
    前記認識対象が撮像された撮像画像に対して前記認識対象のテンプレート画像に基づくパターンマッチング処理を行い、前記撮像画像に含まれる前記認識対象を認識するマッチング処理部と、
    前記撮像画像から前記基準画像を認識する基準画像認識部と、
    前記認識対象の認識率が所定以下となったタイミングで、前記基準画像認識部により認識された前記基準画像の変化を検出する変化検出部と、
    検出された前記基準画像の変化に基づいて、前記マッチング処理部における前記パターンマッチング処理に用いられる前記撮像画像又は前記テンプレート画像の少なくともいずれかに所定の処理を行うマッチング調整部と
    を有する情報処理装置。
  2. 前記マッチング調整部は、検出された前記変化に基づいて、前記マッチング処理部で用いられる前記認識対象のテンプレート画像を作成するテンプレート作成部を含み、
    前記マッチング処理部は、前記テンプレート作成部により作成されたテンプレート画像を用いて前記パターンマッチング処理を行うこと
    を特徴とする請求項1に記載の情報処理装置。
  3. 前記テンプレート作成部は、前記変化検出部において、前記基準画像の色の変化が検出された場合、変化後の色に基づいてテンプレート画像を作成すること
    を特徴とする請求項2に記載の情報処理装置。
  4. 前記テンプレート作成部は、前記変化検出部において、前記基準画像の縮尺の変化が検出された場合、変化後の縮尺に対応するテンプレート画像を作成すること
    を特徴とする請求項2または請求項3に記載の情報処理装置。
  5. 前記テンプレート作成部は、前記変化検出部において、前記基準画像の回転方向の変化が検出された場合、回転方向の変化が生じている前記認識対象を包含する大きさの、回転方向の変化が生じていない状態のテンプレート画像を作成すること
    を特徴とする請求項2から請求項4のうち、いずれか一項に記載の情報処理装置。
  6. 前記マッチング処理部は、前記撮像画像の所定の範囲に対して前記パターンマッチング処理を行うこと
    を特徴とする請求項1から請求項5のうち、いずれか一項に記載の情報処理装置。
  7. 前記基準画像は、前記撮像画像における前記認識対象と所定の位置関係を有しており、
    前記マッチング調整部は、前記変化検出部において、前記基準画像の前記撮像画像における位置の変化が検出された場合、
    前記撮像画像におけるパターンマッチング処理を行う所定の範囲を変更し、
    前記マッチング処理部は、前記マッチング調整部により変更された前記所定の範囲に対して前記パターンマッチング処理を行うこと
    を特徴とする請求項6に記載の情報処理装置。
  8. 前記基準画像は、中心軸回りに回動させた場合に、同じ形状とはならない形状の画像であること
    を特徴とする請求項7に記載の情報処理装置。
  9. 前記変化検出部において、前記基準画像の傾きが検出された場合、
    前記マッチング調整部は、前記撮像画像の傾き補正を行い、
    前記マッチング処理部は、前記マッチング調整部により傾き補正された前記撮像画像に対して前記パターンマッチング処理を行うこと
    を特徴とする請求項1から請求項8のうち、いずれか一項に記載の情報処理装置。
  10. 情報処理装置によって実行される情報処理方法であって、
    認識対象が撮像された撮像画像に対して認識対象のテンプレート画像に基づくパターンマッチング処理を行い、前記撮像画像に含まれる前記認識対象を認識するマッチング処理ステップと、
    前記撮像画像に含まれる基準画像を認識する基準画像認識ステップと、
    前記認識対象の認識率が所定以下となったタイミングで、前記基準画像の変化を検出する変化検出ステップと、
    マッチング調整部が、検出された前記基準画像の変化に基づいて、前記パターンマッチング処理に用いられる前記撮像画像又は前記テンプレート画像の少なくともいずれかに所定の処理を行うマッチング調整ステップと
    を有する情報処理方法。
  11. コンピュータを、
    認識対象が撮像された撮像画像に対して前記認識対象のテンプレート画像に基づくパターンマッチング処理を行い、前記撮像画像に含まれる前記認識対象を認識するマッチング処理部と、
    前記撮像画像に含まれる基準画像を認識する基準画像認識部と、
    前記認識対象の認識率が所定以下となったタイミングで、前記基準画像の変化を検出する変化検出部と、
    検出された前記基準画像の変化に基づいて、前記マッチング処理部における前記パターンマッチング処理に用いられる前記撮像画像又は前記テンプレート画像の少なくともいずれかに所定の処理を行うマッチング調整部として機能させること
    を特徴とする情報処理プログラム。
  12. 請求項1から請求項のうち、いずれか一項に記載の情報処理装置と、
    前記情報処理装置で認識された前記認識対象を所定の入力欄に入力した状態のデータを形成するデータ形成装置と
    を有する情報処理システム。
JP2019053899A 2019-03-20 2019-03-20 情報処理装置、情報処理方法、情報処理プログラム及び情報処理システム Active JP7298227B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2019053899A JP7298227B2 (ja) 2019-03-20 2019-03-20 情報処理装置、情報処理方法、情報処理プログラム及び情報処理システム
CN202010203078.9A CN111723641B (zh) 2019-03-20 2020-03-20 信息处理装置、方法、系统以及存储介质和计算机装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2019053899A JP7298227B2 (ja) 2019-03-20 2019-03-20 情報処理装置、情報処理方法、情報処理プログラム及び情報処理システム

Publications (2)

Publication Number Publication Date
JP2020154895A JP2020154895A (ja) 2020-09-24
JP7298227B2 true JP7298227B2 (ja) 2023-06-27

Family

ID=72559310

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019053899A Active JP7298227B2 (ja) 2019-03-20 2019-03-20 情報処理装置、情報処理方法、情報処理プログラム及び情報処理システム

Country Status (2)

Country Link
JP (1) JP7298227B2 (ja)
CN (1) CN111723641B (ja)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001224557A (ja) 1999-09-09 2001-08-21 Matsushita Electric Ind Co Ltd データ入力装置、データ入力システム、表示データ解析装置および媒体
JP2006106904A (ja) 2004-09-30 2006-04-20 Toshiba Corp 文字読取装置
JP2007304852A (ja) 2006-05-11 2007-11-22 Univ Of Tsukuba 被写体追尾方法及び装置
US20080205769A1 (en) 2007-01-29 2008-08-28 Junichi Taguchi Apparatus, method and program product for matching with a template
JP2012155627A (ja) 2011-01-27 2012-08-16 Aisin Aw Co Ltd 案内装置、案内方法、および、案内プログラム

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02148280A (ja) * 1988-11-30 1990-06-07 Nec Corp ファクシミリocr装置
JPH06274686A (ja) * 1993-03-19 1994-09-30 Mitsubishi Electric Corp 画像処理装置
JP3230334B2 (ja) * 1993-04-26 2001-11-19 富士ゼロックス株式会社 画像処理装置
JPH1069521A (ja) * 1996-08-28 1998-03-10 Sumitomo Metal Ind Ltd 文字、記号の認識方法及び文字、記号の認識装置
JP2002216130A (ja) * 2001-01-15 2002-08-02 Matsushita Electric Ind Co Ltd 画像認識方法と画像認識装置、及び部品実装装置
JP4572790B2 (ja) * 2005-09-27 2010-11-04 パナソニック株式会社 画像認識装置および画像認識方法
EP1998289A1 (en) * 2006-03-20 2008-12-03 Olympus Corporation Information terminal device
JP4798296B1 (ja) * 2010-04-15 2011-10-19 パナソニック株式会社 帳票
JP2014153894A (ja) * 2013-02-07 2014-08-25 Toshiba Tec Corp 情報処理装置及びプログラム
JP6188052B2 (ja) * 2013-02-26 2017-08-30 Kddi株式会社 情報システム及びサーバー
JP6765791B2 (ja) * 2015-08-25 2020-10-07 キヤノン株式会社 パターンマッチング用の基準画像セットの作成方法、パターンマッチング用の基準画像セットの作成装置、ワークの認識方法、プログラム、及び記録媒体
JP2017130794A (ja) * 2016-01-20 2017-07-27 株式会社ソニー・インタラクティブエンタテインメント 情報処理装置、評価用チャート、評価システム、および性能評価方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001224557A (ja) 1999-09-09 2001-08-21 Matsushita Electric Ind Co Ltd データ入力装置、データ入力システム、表示データ解析装置および媒体
JP2006106904A (ja) 2004-09-30 2006-04-20 Toshiba Corp 文字読取装置
JP2007304852A (ja) 2006-05-11 2007-11-22 Univ Of Tsukuba 被写体追尾方法及び装置
US20080205769A1 (en) 2007-01-29 2008-08-28 Junichi Taguchi Apparatus, method and program product for matching with a template
JP2012155627A (ja) 2011-01-27 2012-08-16 Aisin Aw Co Ltd 案内装置、案内方法、および、案内プログラム

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
野田 侑嗣,テンプレートマッチングによる講義スライド等からの文字情報自動抽出の試み,電子情報通信学会技術研究報告 Vol.110 No.85,日本,社団法人電子情報通信学会,2010年,Vol.110 No.85,p.49-p.54

Also Published As

Publication number Publication date
CN111723641B (zh) 2024-04-09
CN111723641A (zh) 2020-09-29
JP2020154895A (ja) 2020-09-24

Similar Documents

Publication Publication Date Title
EP1909215B1 (en) Image region detection method, recording medium, and device therefor
US20060153447A1 (en) Characteristic region extraction device, characteristic region extraction method, and characteristic region extraction program
US20050196044A1 (en) Method of extracting candidate human region within image, system for extracting candidate human region, program for extracting candidate human region, method of discerning top and bottom of human image, system for discerning top and bottom, and program for discerning top and bottom
JP2001307014A (ja) 二次元コード抽出方法
JP2017161969A (ja) 文字認識装置、方法およびプログラム
JP7298227B2 (ja) 情報処理装置、情報処理方法、情報処理プログラム及び情報処理システム
KR20190027165A (ko) 복수 이미지의 특징을 통일하는 이미지 조정 시스템 및 방법
JP2006323779A (ja) 画像処理方法、画像処理装置
CN113840135B (zh) 色偏检测方法、装置、设备及存储介质
JP4910635B2 (ja) 画像処理装置及び画像処理プログラム
JP7075770B2 (ja) 文字認識システム、文字鮮明化システム、文字鮮明化プログラム、文字鮮明化方法、及び文字鮮明化画像の表示装置
JP2013065164A (ja) 画像処理装置、画像処理方法および画像処理プログラム
JP5056063B2 (ja) 画像処理装置及び画像処理プログラム
JP6736916B2 (ja) 情報処理装置、情報処理方法、及びプログラム
US7103220B2 (en) Image processing apparatus, method and program, and storage medium
JP6815712B1 (ja) 画像処理システム、画像処理方法、画像処理プログラム、画像処理サーバ、及び学習モデル
JP2009272714A (ja) 画像処理装置、画像処理方法、プログラム及びプログラムを記録した記録媒体
EP4202857A1 (en) Texture-based authentication of digital identity documents
US11853844B2 (en) Information processing apparatus, image orientation determination method, and medium
WO2024047847A1 (ja) 検出装置、検出方法、および検出プログラム
JP2018173839A (ja) 画像処理装置、処理方法、プログラム
JP6790611B2 (ja) 生体画像処理装置、生体画像処理方法、および生体画像処理プログラム
JP2021140352A (ja) カード切出装置およびプログラム
KR20220168787A (ko) 만주어의 글자 추출 방법 및 이를 수행하는 시스템
KR20090103475A (ko) 차량 정보 판독 시스템 및 이를 이용한 차량 정보 판독방법

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20220113

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20230117

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20230307

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230502

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230516

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230529

R151 Written notification of patent or utility model registration

Ref document number: 7298227

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151