JP2016115255A - 計器認識システム、方法、および、プログラム - Google Patents

計器認識システム、方法、および、プログラム Download PDF

Info

Publication number
JP2016115255A
JP2016115255A JP2014255159A JP2014255159A JP2016115255A JP 2016115255 A JP2016115255 A JP 2016115255A JP 2014255159 A JP2014255159 A JP 2014255159A JP 2014255159 A JP2014255159 A JP 2014255159A JP 2016115255 A JP2016115255 A JP 2016115255A
Authority
JP
Japan
Prior art keywords
instrument
type
character
character type
virtual character
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2014255159A
Other languages
English (en)
Inventor
達勇 秋山
Tatsuo Akiyama
達勇 秋山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2014255159A priority Critical patent/JP2016115255A/ja
Publication of JP2016115255A publication Critical patent/JP2016115255A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Character Discrimination (AREA)
  • Character Input (AREA)

Abstract

【課題】中間的な表示状態となり得る計器に示された情報を、より精度よく認識する技術を提供すること。
【解決手段】計器において文字盤上の第1字種が表示される状態と、文字盤上で第1字種に隣接する第2字種が表示される状態との中間的な表示状態を段階的に示す仮想字種を表す情報を含む仮想字種辞書101と、入力画像から文字領域画像を抽出する文字領域抽出部102と、仮想字種辞書101を用いて、文字領域画像から仮想字種を認識することにより、前記入力画像が示す計器の中間的な表示状態の段階を認識する仮想字種認識部103と、を備える。
【選択図】図1

Description

本発明は、計器に示される情報を認識する技術に関する。
計器に示される情報を認識する技術が知られている。計器は、文字の一部分が示される中間的な表示状態となる場合がある。これは、例えば、数字が配列された文字盤のうち表示窓に現れる数字によって指示値を示す計器において、指示値が切り替わる際や、視認方向に起因して発生する。このような場合に対応する技術の一例が、特許文献1〜3に記載されている。
特許文献1に記載のワットアワーメータ文字認識装置は、計器の撮像画像から指示値の各桁の画像を切り出し、切り出した桁の画像が分割文字を表すと判定した場合に、上側の文字と下側の文字とを別々に認識する。ここで、分割文字とは、複数種類の文字それぞれの一部分からなる文字である。また、この特許文献1には、上側文字の下半分および下側文字の上半分を結合した画像を辞書として登録した分割文字辞書を用いて、計器に示された情報を認識する技術についても記載されている。
また、特許文献2に記載の計器読み取り装置は、計器の撮像画像から抽出した数値候補領域が、数値の一部分をそれぞれ示す複数の領域からなる場合には、各領域のそれぞれについて類似する数字を求める。
また、特許文献3に記載の文字認識装置は、中間文字を含む認識辞書を用いて、計器に示された認識対象を認識する。中間文字とは、認識対象となる文字の一部分と、その文字に続く次の文字の一部分で構成される文字をいう。中間文字の一例としては、認識対象となる文字から次の文字への変化の過程を6分割した中間文字が記載されている。具体的には、この文字認識装置は、認識辞書と認識対象とを比較して候補文字を決定する。そして、候補文字が中間文字である場合、この文字認識装置は、あらかじめ定められた約束にしたがって、認識対象となる文字またはその文字に続く次の文字のいずれか一方であると認識する。
特許第3372111号 特許第5530752号 特開平6−150069号公報
しかしながら、上述の特許文献1から特許文献3に記載された関連技術には、以下の課題がある。
特許文献1および特許文献2に記載された文字の一部分を個別に認識する方法では、計器に示された情報の認識精度が確保しづらい。それは、例えば、文字盤が上下方向に回転する計器では、表示窓に現れる上側文字および下側文字のうちいずれかの文字高さが小さくなる場合が想定されるからである。このような場合、これらの関連技術は、文字高さが小さい方の文字の認識精度を確保するのが難しい。このように、中間的な表示状態となり得る計器では、表示窓に現れる各文字が、個別の認識精度を確保するのに十分な割合でその一部分が示されるとは限らない。その結果、これらの関連技術は、計器に示された情報の認識精度を確保できない。
また、特許文献1に記載された分割文字辞書は、上側文字の下半分と下側文字の上半分とを同程度の高さずつ結合した画像を辞書として格納している。したがって、この関連技術は、表示窓に部分的に示されている各文字の高さが同程度でない場合に、それらを表す画像を分割文字辞書と精度よく照合することができない。その結果、この関連技術は、計器に示された情報を、精度よく認識することができない場合がある。
また、特許文献3に記載された関連技術は、中間文字を含む認識辞書を用いて決定した候補文字に基づいて、認識対象となる文字またはそれに続く文字のいずれかを決定してる。ここで、計器は、中間的な表示状態となる場合に、その前後のいずれかの文字を示しているとは限らない。つまり、中間的な表示状態が、情報として意味を持つ場合もある。そのため、この関連技術は、中間的な表示状態に応じた認識精度を確保することができない。
本発明は、上述の課題を解決するためになされたものである。すなわち、本発明は、中間的な表示状態となり得る計器に示された情報を、より精度よく認識する技術を提供することを目的とする。
本発明の計器認識システムは、計器において文字盤上の第1字種が表示される状態と、前記文字盤上で前記第1字種に隣接する第2字種が表示される状態との中間的な表示状態を段階的に示す仮想字種を表す情報を含む仮想字種辞書と、入力画像から文字領域画像を抽出する文字領域抽出手段と、前記仮想字種辞書を用いて、前記文字領域画像から前記仮想字種を認識することにより、前記入力画像が示す計器の中間的な表示状態の段階を認識する仮想字種認識手段と、を備える。
また、本発明の他の計器認識システムは、入力画像の表す計器の種別を認識する計器種別認識手段と、前記計器種別認識手段によって認識された種別に基づいて、前記入力画像から文字領域画像を抽出する文字領域抽出手段と、を備える。
また、本発明の方法は、計器において文字盤上の第1字種が表示される状態と、前記文字盤上で前記第1字種に隣接する第2字種が表示される状態との中間的な表示状態を段階的に示す仮想字種を表す情報を含む仮想字種辞書を用いて、入力画像から文字領域画像を抽出し、前記仮想字種辞書を用いて、前記文字領域画像から前記仮想字種を認識することにより、前記入力画像が示す計器の中間的な表示状態の段階を認識する。
また、本発明のプログラムは、計器において文字盤上の第1字種が表示される状態と、前記文字盤上で前記第1字種に隣接する第2字種が表示される状態との中間的な表示状態を段階的に示す仮想字種を表す情報を含む仮想字種辞書を用いて、入力画像から文字領域画像を抽出する文字領域抽出ステップと、前記仮想字種辞書を用いて、前記文字領域画像から前記仮想字種を認識することにより、前記入力画像が示す計器の中間的な表示状態の段階を認識する仮想字種認識ステップと、をコンピュータ装置に実行させる。
本発明は、中間的な表示状態となり得る計器に示された情報を、より精度よく認識する技術を提供することができる。
本発明の第1の実施の形態としての計器認識システムの構成を示すブロック図である。 本発明の第1の実施の形態としての計器認識システムのハードウェア構成の一例を示す図である。 本発明の第1の実施の形態としての計器認識システムの動作を説明するフローチャートである。 本発明の第2の実施の形態としての計器認識システムの構成を示すブロック図である。 本発明の第2の実施の形態としての計器認識システムの動作を説明するフローチャートである。 本発明の第3の実施の形態としての計器認識システムの構成を示すブロック図である。 本発明の第3の実施の形態における仮想字種辞書に格納される情報の一例を示す図である。 本発明の第3の実施の形態において抽出される文字セグメント画像の一例を示す図である。 本発明の第3の実施の形態としての計器認識システムの動作の概略を説明するフローチャートである。 本発明の第3の実施の形態としての計器認識システムの文字セグメント画像抽出動作の詳細な一例を説明するフローチャートである。 本発明の第3の実施の形態としての計器認識システムの読み取り値決定動作の詳細な一例を説明するフローチャートである。 本発明の第3の実施の形態における仮想字種列および読み取り値の具体例を示す図である。 本発明の第3の実施の形態としての計器認識システムの数値解釈動作の詳細な一例を説明するフローチャートである。 本発明の第4の実施の形態としての計器認識システムの構成を示すブロック図である。 本発明の第4の実施の形態としての計器認識システムの動作を説明するフローチャートである。 本発明の第5の実施の形態としての計器認識システムの構成を示すブロック図である。 本発明の第5の実施の形態としての計器認識システムの動作を説明するフローチャートである。 本発明の第5の実施の形態としての計器認識システムの履歴生成動作の詳細な一例を説明するフローチャートである。
以下、本発明の実施の形態について、図面を参照して詳細に説明する。
(第1の実施の形態)
本発明の第1の実施の形態としての計器認識システム1の機能ブロック構成を、図1に示す。図1において、計器認識システム1は、仮想字種辞書101と、文字領域抽出部102と、仮想字種認識部103とを備える。計器認識システム1は、対象の計器に示された文字情報を認識する装置である。対象の計器は、複数種類の文字が配列された文字盤と、それらの文字の一部が外部から視認可能な表示窓とを有する。このような計器は、文字盤に配列された複数種類の文字のうち表示窓に現れる文字またはそのような文字の組合せにより情報を示す。また、このような計器は、文字盤上で隣接する2種類の文字それぞれの表示状態の間で中間的な表示状態を示す場合がある。
ここで、計器認識システム1のハードウェア構成の一例を、図2に示す。図2において、計器認識システム1は、CPU(Central Processing Unit)1001、メモリ1002、出力装置1003、入力装置1004、撮像装置1005、および、ネットワークインタフェース1006を含む。メモリ1002は、RAM(Random Access Memory)、ROM(Read Only Memory)、補助記憶装置(ハードディスク、フラッシュメモリ等)等によって構成される。出力装置1003は、ディスプレイ装置やプリンタ等のように、情報を出力する装置によって構成される。入力装置1004は、操作ボタンやタッチパネル等のように、ユーザ操作の入力を受け付ける装置によって構成される。ネットワークインタフェース1006は、ネットワークに接続するインタフェースである。撮像装置1005は、カメラやビデオカメラ等、対象物を撮像することにより対象物を表す画像を生成する装置である。この場合、仮想字種辞書101は、メモリ1002によって構成される。文字領域抽出部102および仮想字種認識部103は、メモリ1002に格納されるコンピュータ・プログラムを読み込んで実行するとともに他の各部を制御するCPU1001によって構成される。なお、計器認識システム1およびその各機能ブロックのハードウェア構成は、上述の構成に限定されない。
仮想字種辞書101は、仮想字種を表す情報を記憶している。仮想字種とは、計器において文字盤上の第1字種が表示される状態と、文字盤上で第1字種に隣接する第2字種が表示される状態との中間的な表示状態を段階的に表す情報である。ここで、仮想字種を表す情報とは、そのような仮想字種を表すテンプレート画像であってもよい。例えば、第1字種の表示状態と、第2字種の表示状態との間の中間的な表示状態がn(nは1以上の整数)段階に分けられているとする。この場合、仮想字種辞書101は、文字盤上で隣接する字種間につきn個ずつの各段階に対応する仮想字種を表す情報を格納していればよい。なお、仮想字種辞書101は、第1字種の表示状態および第2字種の表示状態を示す情報についても、それぞれ、仮想字種を表す情報として記憶しておく。また、仮想字種辞書101は、仮想字種を表す情報に対して、その仮想字種を表す情報によって示される中間的な表示状態の段階を識別する識別情報を対応付けておく。そのような識別情報は、第1字種または第2字種を表す情報と、段階を表す情報とを含んでいればよい。
文字領域抽出部102は、入力画像から文字領域画像を抽出する。入力画像は、計器の少なくとも一部が撮像されることにより生成された画像である。また、文字領域は、入力画像において計器に示された文字情報を表す領域である。また、文字領域画像は、そのような文字領域の画像である。もし、入力画像の示す計器が前述のような中間的な表示状態である場合、文字領域抽出部102は、文字領域画像として、文字の一部分を含む文字領域画像を抽出することになる。なお、文字領域抽出部102は、入力画像として、撮像装置1005によって撮像された画像を取得してもよい。あるいは、文字領域抽出部102は、入力画像を、ネットワークインタフェース1006を介して外部から取得してもよい。また、文字領域抽出部102は、そのような入力画像における文字領域として、対象とする計器において指示値が表示される位置や大きさに基づいてあらかじめ定められた領域を抽出してもよい。あるいは、文字領域抽出部102は、画像から文字を表す領域を抽出する各種公知の技術を用いて、文字領域画像を抽出してもよい。
仮想字種認識部103は、仮想字種辞書101を用いて、文字領域画像から仮想字種を認識することにより、入力画像が示す計器の中間的な表示状態の段階を認識する。具体的には、仮想字種認識部103は、文字領域画像と、仮想字種辞書101に含まれる仮想字種を表す情報とを照合し、照合結果が所定条件を示す仮想字種を認識する。そして、仮想字種認識部103は、認識した仮想字種の識別情報に基づいて、入力画像が示す計器の中間的な表示状態の段階を認識すればよい。
以上のように構成された計器認識システム1の動作について、図3を参照して説明する。
図3では、まず、文字領域抽出部102は、入力画像から文字領域画像を抽出する(ステップS11)。
次に、仮想字種認識部103は、仮想字種辞書101を用いて、文字領域画像から仮想字種を認識することにより、入力画像が示す計器の中間的な表示状態の段階を認識する(ステップS12)。
以上で、計器認識システム1は、動作を終了する。
次に、本発明の第1の実施の形態の効果について述べる。
本発明の第1の実施の形態としての計器認識システムは、中間的な表示状態となり得る計器に示された情報を、より精度よく認識することができる。
その理由について説明する。本実施の形態では、仮想字種辞書に、計器において文字盤上の第1字種が表示される状態と、文字盤上で第1字種に隣接する第2字種が表示される状態との中間的な表示状態を段階的に示す情報である仮想字種を表す情報を登録しておく。そして、文字領域抽出部が、計器を表す入力画像から、文字領域画像を抽出する。抽出される文字領域画像は、計器が中間的な表示状態である場合には、文字の一部分を含む領域となる。そして、仮想字種認識部は、仮想字種辞書を用いて、文字領域画像を照合する。これにより、仮想字種認識部は、文字領域画像から仮想字種を認識し、計器の中間的な表示状態を認識することができる。その結果、本実施の形態は、計器の示す中間的な表示状態が、第1字種の表示状態および第2字種の表示状態の間のどのような段階にあっても、計器に示された情報を精度よく認識することができる。
(第2の実施の形態)
次に、本発明の第2の実施の形態について図面を参照して詳細に説明する。なお、本実施の形態の説明において参照する各図面において、本発明の第1の実施の形態と同一の構成および同様に動作するステップには同一の符号を付して本実施の形態における詳細な説明を省略する。
まず、本発明の第2の実施の形態としての計器認識システム2の構成を、図4に示す。図4において、計器認識システム2は、計器種別認識部206と、文字領域抽出部202とを備える。なお、計器認識システム2は、図2を参照して説明した本発明の第1の実施の形態としての計器認識システム1と同一のハードウェア要素によって構成可能である。この場合、計器認識システム2の各機能ブロックは、メモリ1002に格納されるコンピュータ・プログラムを読み込んで実行するとともに他の各部を制御するCPU1001によって構成される。なお、計器認識システム2およびその各機能ブロックのハードウェア構成は、上述の構成に限定されない。
計器種別認識部206は、入力画像の表す計器の種別を認識する。例えば、計器種別認識部206は、各種の計器を表すテンプレート画像(計器種別画像)と、入力画像とを照合することにより、計器の種別を判別してもよい。そのような計器種別画像は、あらかじめメモリ1002に記憶されていてもよい。なお、照合処理には、公知の画像認識手法を適用すればよい。また、例えば、計器種別認識部206は、入力画像の表す計器の設置位置情報を利用して、計器の種別を認識してもよい。この場合、計器種別認識部206は、設置位置情報および計器の種別の対応関係を表す情報を参照することにより、計器の種別を認識してもよい。そのような対応関係を表す情報は、あらかじめメモリ1002に記憶されていてもよい。例えば、計器種別認識部206は、計器の設置位置情報を取得し、取得した設置位置情報から所定範囲内にある設置位置情報に対応付けられた計器の種別を、当該計器の種別であると認識してもよい。なお、例えば、計器種別認識部206は、GPS(Grobal Positioning System)等の地理的な位置情報を特定するデバイスが搭載された計器であれば、当該計器と通信することにより、その設置位置情報を取得可能である。これに限らず、計器種別認識部206は、入力画像の表す計器の種別を、その他の手法で認識してもよい。
また、計器種別認識部206は、計器の種別として1つ以上の候補を出力装置1003に出力してもよい。そして、この場合、計器種別認識部206は、入力装置1004を介して得られる情報にしたがって、候補の中から計器の種別を決定してもよい。
また、計器種別認識部206は、入力画像の傾きを補正する処理を行ってもよい。例えば、計器種別認識部206は、計器種別画像および入力画像の間の傾きを表す情報を算出してもよい。傾きの算出処理には、例えば、コンピュータビジョン技術におけるホモグラフィー行列やF行列などを用いた手法が適用可能である。例えば、計器種別画像が、計器に正対するカメラによって撮像されているとする。この場合、文字領域抽出部202は、計器に正対していないカメラによって撮像された入力画像を、正対する方向から撮影されたように補正することができる。以降、入力画像とは、入力画像に対して補正処理がなされた場合には補正後の画像をさすものとする。これにより、他の機能ブロックによる処理の精度向上が望める。
また、計器種別認識部206は、認識した計器の種別に応じて定められたパラメータを取得してもよい。計器の種別に応じたパラメータは、メモリ1002に記憶されていてもよい。パラメータには、例えば、その種別の計器を表す画像において、読み取り値の認識対象となる領域(読み取り値認識領域)を特定する情報が含まれていてもよい。
なお、計器種別認識部206は、入力画像として、撮像装置1005によって撮像された画像を取得してもよい。あるいは、計器種別認識部206は、入力画像を、ネットワークインタフェース1006を介して外部から取得してもよい。
文字領域抽出部202は、認識された計器の種別に基づいて、入力画像から、文字領域画像を抽出する。具体的には、例えば、文字領域抽出部202は、上述のパラメータに含まれる読み取り値認識領域を特定する情報にしたがって、入力画像における読み取り値認識領域を決定してもよい。そして、文字領域抽出部202は、読み取り値認識領域の画像を、文字領域画像として抽出すればよい。なお、該当する計器の種別のパラメータに、読み取り値認識領域を特定する情報が含まれていない場合も想定される。その場合、文字領域抽出部202は、あらかじめ定められた領域を読み取り値認識領域として決定してもよい。あるいは、文字領域抽出部202は、読み取り値認識領域を指定する情報を、入力装置1004を介して取得してもよい。
以上のように構成された計器認識システム2の動作について、図5を参照して説明する。
図5において、まず、計器種別認識部206は、入力画像が示す計器の種別を認識する(ステップS21)。
前述のように、計器種別認識部206は、入力画像と計器種別画像との照合により、計器の種別を認識してもよい。また、計器種別認識部206は、計器の設置位置情報と計器の種別との対応関係に基づいて、計器の種別を認識してもよい。また、計器種別認識部206は、入力画像の傾きを補正してもよい。
次に、計器種別認識部206は、認識された種別についてパラメータを取得する(ステップS22)。
次に、文字領域抽出部202は、パラメータに含まれる情報に基づいて、入力画像から文字領域画像を抽出する(ステップS23)。
前述のように、文字領域抽出部202は、パラメータに含まれる読み取り値認識領域を特定するための情報に基づいて、入力画像における読み取り値認識領域を決定し、決定した領域の画像を抽出してもよい。
以上で、計器認識システム2は、動作を終了する。
次に、本発明の第3の実施の形態の効果について述べる。
本発明の第3の実施の形態としての計器認識システムは、中間的な表示状態となり得る計器に示された情報を、より精度よく認識するための事前処理を行うことができる。
その理由について述べる。本実施の形態では、計器種別認識部が、入力画像が示す計器の種別を認識する。そして、文字領域抽出部が、入力画像における読み取り数値の認識領域を決定し、決定した領域から文字領域画像を抽出するからである。このように、本実施の形態は、計器の種別に応じた読み取り値認識領域を決定することで、中間的な表示状態を示すことのある計器であっても、より確実に、読み取り値認識領域に含まれる文字領域画像を抽出できる。その結果、本実施の形態は、中間的な表示状態を示す計器に示された情報を認識する装置に対して、認識精度を向上させるためにより適切な文字領域画像を出力することができる。
(第3の実施の形態)
次に、本発明の第3の実施の形態について図面を参照して詳細に説明する。なお、本実施の形態の説明において参照する各図面において、本発明の第1の実施の形態と同一の構成および同様に動作するステップには同一の符号を付して本実施の形態における詳細な説明を省略する。
まず、本発明の第3の実施の形態としての計器認識システム3の機能ブロック構成を、図6に示す。図6において、計器認識システム3は、仮想字種辞書301と、文字領域抽出部302と、仮想字種認識部303と、認識信頼度格納バッファ304と、読み取り値決定部305とを含む。なお、認識信頼度格納バッファ304は、本発明の仮想字種認識手段の一部の一実施形態を構成する。ここで、計器認識システム3およびその各機能ブロックは、図2を参照して説明した本発明の第1の実施の形態としての計器認識システム1と同一のハードウェア要素によって構成可能である。なお、計器認識システム3およびその各機能ブロックのハードウェア構成は、上述の構成に限定されない。
本実施の形態において、計器認識システム3が対象とする計器は、対象の計器は、複数種類の文字が配列された回転可能な文字盤と、それらの複数種類の文字の一部が外部から視認可能な表示窓とを有する。このような計器は、文字盤を回転させて複数種類の文字のうち所望の文字を表示窓から視認可能に配置する。これにより、このような計器は、表示窓から現れる文字またはそのような文字の組合せを用いて情報を示す。また、対象の計器は、文字盤上で隣接する2種類の文字それぞれの表示状態の間の中間的な表示状態を示す場合がある。
仮想字種辞書301は、計器の中間的な表示状態を、文字盤の回転量に応じて段階的に示す仮想字種を表す情報を記憶している。つまり、仮想字種辞書301に記憶される各仮想字種を表す情報は、文字盤上の第1字種の表示状態と、文字盤上で第1字種に隣接する第2字種の表示状態との中間的な表示状態のうち、文字盤の回転量に応じた各段階における表示状態を表している。また、仮想字種辞書301は、各仮想字種を表す情報に、中間的な表示状態の段階を識別する識別情報を対応付けて記憶している。また、仮想字種辞書301は、各仮想字種を表す情報に、後述の特徴ベクトルを対応付けて記憶しておいてもよい。
具体的には、仮想字種辞書301は、仮想字種を表す情報として、まず、文字盤上に配列されたそれぞれの文字を表すテンプレート画像を記憶している。加えて、仮想字種辞書301は、文字盤上で隣接する第1字種の表示状態および第2字種の表示状態の間の中間的な表示状態を段階的に表すテンプレート画像を記憶している。つまり、同一の第1字種および第2字種の組合せに対して、それら2つの字種の表示状態の中間的な表示状態を表すテンプレート画像は、中間的な表示状態の段階(すなわち文字盤の回転量)に応じて、複数個ずつ用意されることが望ましい。図7は、仮想字種辞書301に記憶される仮想字種を表す情報の一例である。ここでは、文字盤に配列された複数種類の文字は、0〜9までの数字であることを想定している。また、文字盤上において、これらの数字はその数値の大きさの順に上下方向に配列されているものとしている。この場合、文字盤が上下方向に回転することにより表示窓に現れる中間的な表示状態には、第1字種の下側の一部分と、第2字種の上側の一部分とを上下に連結したテンプレート画像により表されるいくつかの段階がある。また、この場合の中間的な表示状態には、第1字種(第2字種)の数字の一部分が中央より上側(下側)に配置されたテンプレート画像により表されるいくつかの段階がある。そこで、仮想字種辞書301は、図7に示すように、仮想字種を表すテンプレート画像を格納している。なお、図7において、“80”、“81”、“82”、・・・“99”は、仮想字種に与えられた識別情報を表している。この例では、識別情報は、2文字からなり、左側の文字は、第1字種を表している。また右側の文字は、第1字種および第2字種の間の中間的な表示状態の段階を表している。例えば、仮想字種“80”は、数字「8」の表示状態を表している。同様に、仮想字種“90”は、数字「9」の表示状態を表している。また、仮想字種“81”〜“89”は、第1字種としての数字「8」の表示状態と、第2字種としての数字「9」の表示状態との中間的な表示状態を、文字盤の回転量に応じて段階的に表している。また、仮想字種“91”〜“99”は、第1字種としての数字「9」の表示状態と、第2字種としての数字「0」の表示状態との中間的な表示状態を、文字盤の回転量に応じて段階的に表している。
文字領域抽出部302は、入力画像から、1つ以上の文字セグメント画像を抽出する。文字セグメントは、1文字の候補となる画像中の部分領域のことをいう。
文字セグメント画像を抽出する手法の一例について述べる。例えば、文字領域抽出部302は、画像を既知の手法で二値化し、二値のうち文字を表す値(文字色)を特定する。例えば、文字領域抽出部302は、二値化画像内のあらかじめ指定された領域における白画素数および黒画素数の数に基づいて、文字色を特定してもよい。具体的には、文字領域抽出部302は、画素数の多い方の色を背景色とし、少ない方の色を文字色としてもよい。そして、文字領域抽出部302は、互いに隣り合う文字色の画素を連結して得られる領域(以下、連結領域と呼ぶ)の画像を、文字セグメント画像とすればよい。なお、文字セグメント画像は、入力画像においてそのような連結領域に含まれる画像であってもよい。あるいは、文字セグメント画像は、二値化画像においてそのような連結領域に含まれる画像であってもよい。本実施の形態では、文字セグメント画像は、二値化画像から抽出されたものとして説明する。また、本実施の形態では、二値化画像において、背景色が白、文字色が黒であることを想定して説明する。なお、背景色が黒および文字色が白である場合については、以降の説明において、適宜、「白」を「黒」と読み替え、「黒」を「白」と読み替えることにより同様に説明される。
また、文字領域抽出部302は、抽出した文字セグメントのうち、入力画像内で互いに近い位置にある文字セグメントを統合して新たな文字セグメントを生成してもよい。なお、文字領域抽出部302は、複数の文字セグメントが互いに近い位置にあるか否かを、複数の領域が近いことを示す所定条件を満たすか否かにより判断すればよい。例えば、所定条件とは、領域の重心間の距離が閾値以下にあるという条件であってもよい。なお、これに限らず、所定条件は、複数の領域が近いことを判定可能な他の条件であってもよい。
以降、統合により得られた文字セグメントを、結合セグメントとも呼ぶ。また、統合によらずに得られた文字セグメントを、プリミティブセグメントとも呼ぶ。つまり、結合セグメントは、複数のプリミティブセグメントが統合されたものである。また、1つのプリミティブセグメントは、複数の文字セグメント(プリミティブセグメントおよび結合セグメント)に含まれる場合がある。ここでは、プリミティブセグメントおよび結合セグメントの双方をそれぞれ文字セグメントとして扱うものとする。
図8は、プリミティブセグメントと結合セグメントとの違いを説明するための図である。符号8a、8b、8c、8d、8eは、プリミティブセグメントを表す。また、符号8fは、結合セグメントを表す。結合セグメント8fは、プリミティブセグメント8dおよび8eが統合されて得られたものである。
仮想字種認識部303は、仮想字種辞書301を参照し、文字セグメント画像のそれぞれから仮想字種を認識する。具体的には、仮想字種認識部303は、文字セグメント画像と、仮想字種辞書301の仮想字種を表す情報との間で、文字認識処理を行う。文字認識処理としては、既知の手法を採用可能である。例えば、仮想字種認識部303は、文字セグメント画像と、仮想字種を表す情報との間で、認識処理の信頼度を算出し、信頼度が所定条件を満たす仮想字種を認識結果としてもよい。また、例えば、仮想字種認識部303は、1つの文字セグメント画像に対して、信頼度が最良の仮想字種から順にn(nは1以上の整数)候補分を認識結果として出力してもよい。なお、仮想字種認識部303は、信頼度として、信頼度が高いほど大きい値をとる情報を算出してもよい。この場合、仮想字種認識部303は、各文字セグメント画像について、信頼度が最大の仮想字種から順にn候補分を認識結果として出力すればよい。また、仮想字種認識部303は、信頼度として、信頼度が高いほど小さい値をとる情報(距離)を算出してもよい。この場合、仮想字種認識部303は、各文字セグメント画像に対して、距離が最小の仮想字種から順にn候補分を認識結果として出力すればよい。
もし、信頼度として距離を採用する場合、仮想字種認識部303は、文字セグメント画像から文字認識に好適な特徴量ベクトルを計算し、計算した特徴量ベクトルと、仮想字種を表すテンプレート画像の特徴量ベクトルとの距離を求めてもよい。なお、仮想字種を表すテンプレート画像の特徴量ベクトルは、あらかじめ算出されて仮想字種辞書301に記憶されていてもよい。そして、仮想字種認識部303は、仮想字種を表すテンプレート画像の特徴量ベクトルを算出した特徴量算出アルゴリズムと同等のアルゴリズムを用いて、文字セグメント画像から特徴量ベクトルを算出すればよい。また、もし、信頼度として、高いほど大きい値をとる情報を算出する場合、仮想字種認識部303は、0から上述の距離を引いた値や、距離の逆数等を、信頼度として算出してもよい。また、これらに限らず、仮想字種認識部303は、その他の手法を用いて文字セグメント画像および仮想字種を表す情報間の信頼度を求めてもよい。
また、仮想字種認識部303は、各文字セグメント画像の認識結果として、仮想字種の識別情報および信頼度の組合せを、認識信頼度格納バッファ304に格納する。もし、1つの文字セグメント画像についてn個の候補を認識結果とする場合、仮想字種認識部303は、n個の組合せを認識信頼度格納バッファ304に格納すればよい。
認識信頼度格納バッファ304は、仮想字種認識部303によって出力される仮想字種の識別情報および信頼度の対と、文字セグメント画像の識別情報とを対応付けて格納する。
読み取り値決定部305は、仮想字種認識部303による認識結果と、その認識結果が示す中間的な表示状態の段階とに基づいて、読み取り値を決定する。このとき、読み取り値決定部305は、認識信頼度格納バッファ304に格納された信頼度も考慮して、読み取り値を決定する。なお、読み取り値は、入力画像の表す計器に示された情報(指示値)とみなされる。
具体的には、読み取り値決定部305は、文字列認識および数値解釈を行う。ここで、文字列認識とは、各文字セグメントの認識結果から、それらの複数の文字セグメントが表す仮想字種の列を認識する処理をいう。以降、仮想字種の列を、仮想字種列とも記載する。また、数値解釈とは、認識した仮想字種列から、その仮想字種列が示す数値を解釈する処理である。
詳細には、読み取り値決定部305は、認識結果(仮想字種の識別情報および信頼度の対)に加えて、複数の文字セグメントの配置関係や包含関係を考慮して、仮想字種列を認識する。例えば、読み取り値決定部305は、あらかじめ与えられた読み取り値の桁数の情報を用いて、仮想字種からなる文字列を認識してもよい。この場合、読み取り値決定部305は、公知文献「特許4600651号」に記載の技術を用いて、文字列認識を行ってもよい。具体的には、読み取り値決定部305は、与えられた桁数からなる仮想字種列パターンそれぞれに対して、複数の文字セグメントの組み合わせがその仮想字種列パターンを示す信頼度を計算する。そのような信頼度は、各文字セグメントの認識結果に含まれる信頼度に基づいて算出することが可能である。例えば、読み取り値決定部305は、ある仮想字種列パターンに対して、複数の文字セグメントの組み合わせのうち最も高い信頼度を示す組み合わせを、その仮想字種列パターンの信頼度とすればよい。そして、読み取り値決定部305は、最も高い信頼度を示す仮想字種列パターンを、複数の文字セグメントが表す仮想字種列として認識すればよい。なお、この手法に限らず、読み取り値決定部305は、その他の公知の手法により複数の文字セグメントが示す仮想字種列を認識してもよい。
また、読み取り値決定部305は、認識された仮想字種列の数値解釈として、仮想字種列中での各仮想字種の位に応じた解釈を行ってもよい。例えば、仮想文字列中の各仮想字種は、その表示状態が示す意味に応じて次の2通りがある。一つ目は、仮想字種の示す中間的な表示状態の回転量が、量的な意味を持つケースである。これを、ケース1とも記載する。通常、最下位の桁の仮想字種は、このケース1に当てはまる。二つ目は、計器に本来表示されるはずの文字の上部(または下部)に、その文字の上側(または下側)に隣接する文字が少しだけ映り込むケースである。これを、ケース2とも記載する。例えば、計器が“7888”を示すとき、認識された仮想字種列のうち最上位は、仮想字種“70”のはずである。しかしながら、7のひとつ前の数字である6の下部が少しだけ見えている場合がある。このような場合、認識された仮想字種列のうち最上位が、仮想字種“69”や“68”となる可能性がある。通常、最下位以外の桁の仮想字種は、このケース2に当てはまる。ただし、最下位以外の桁の仮想字種であっても、1つ下の位が9から0に変化中である場合は、ケース1となる。
ケース1の仮想字種の数値解釈について説明する。また、例えば、仮想字種列のうち最も低い位を示す仮想字種が、中間的な状態を示す仮想字種であるとする。この場合、読み取り値決定部305は、最も低い位より1桁以上低い位が、その仮想字種が示す中間的な状態の段階に応じた数値を持つと解釈してもよい。具体的には、認識された仮想字種列の最も低い位(一の位)が仮想字種“98”であったとする。この場合、読み取り値決定部305は、一の位の数値を「9」、小数点第1位を「8」と解釈してもよい。さらに、この場合、読み取り値決定部305は、そのように一旦解釈した上で、少数点第1位を四捨五入、切り捨て、切り上げ等して加工した数値を解釈してもよい。
ケース2の仮想字種の数値解釈について説明する。この場合、読み取り値決定部305は、その位として、第1字種および第2字種のうち、その仮想字種の示す中間的な状態の段階が近い方の字種を解釈してもよい。
以上のように構成された計器認識システム3の動作について、図面を参照して説明する。
図9は、計器認識システム3の全体の動作を示すフローチャートである。図9では、まず、文字領域抽出部302は、入力画像から、文字セグメント画像を抽出する(ステップS31)。このステップの詳細な動作については後述する。
次に、仮想字種認識部303は、抽出された文字セグメント画像のそれぞれについて、仮想字種辞書301を用いて文字認識処理を行う。そして、仮想字種認識部303は、各文字セグメント画像についての認識結果を、認識信頼度格納バッファ304に格納する(ステップS32)。
前述のように、仮想字種認識部303は、各文字セグメント画像と、仮想字種辞書301に格納されている各仮想字種を表す情報との間で、信頼度を計算すればよい。そして、仮想字種認識部303は、各文字セグメント画像について、信頼度が最良の仮想字種から順にn個の候補の識別情報およびその信頼度の組合せを、認識結果として認識信頼度格納バッファ304に出力すればよい。
例えば、図8の例では、仮想字種認識部303は、5つのプリミティブセグメント8a〜8eおよび1つの結合セグメント8fの合計6つの文字セグメントそれぞれに対して、n個ずつの認識結果を、認識信頼度格納バッファ304に格納する。
次に、読み取り値決定部305は、認識信頼度格納バッファ304に格納された認識結果を基に、読み取り値を決定する(ステップS33)。このステップの詳細な動作については後述する。
以上で、計器認識システム3は、動作を終了する。
次に、ステップS31における文字セグメント画像抽出動作の詳細を、図10に示す。
図10では、まず、文字領域抽出部302は、入力画像を二値化する(ステップA1)。
ここで、二値化処理には、公知の手法を採用可能である。
次に、文字領域抽出部302は、二値化された画像の中からプリミティブセグメントを抽出する(ステップA2)。
前述のように、文字領域抽出部302は、隣接する文字色の画素を連結することにより得られる連結領域を、プリミティブセグメントとしてもよい。
次に、文字領域抽出部302は、互いに近い位置にあることを示す所定条件を満たすプリミティブセグメントを統合し、結合セグメントを生成する(ステップA3)。
前述のように、文字領域抽出部302は、重心間の距離が閾値以下のプリミティブセグメントを結合してもよい。
例えば、図8の例では、文字領域抽出部302は、5つのプリミティブセグメント8a〜8eのうち、プリミティブセグメント8dおよび8eの重心間の距離が閾値以下であると判断する。そして、文字領域抽出部302は、プリミティブセグメント8dおよび8eを結合して結合セグメント8fを生成している。
そして、文字領域抽出部302は、プリミティブセグメントおよび結合セグメントのそれぞれを、文字セグメントとして出力する。
以上で、ステップS31における文字セグメント画像抽出動作の説明を終了する。
次に、ステップS33における読み取り値決定動作の詳細を、図11に示す。
図11では、まず、読み取り値決定部305は、複数の文字セグメントの組み合わせから、仮想字種列を認識する(ステップB1)。
前述のように、読み取り値決定部305は、既知の桁数を用いて、公知文献「特許4600651号」に開示される技術を用いて、仮想字種列を認識してもよい。
次に、読み取り値決定部305は、認識された仮想字種列について、数値解釈を行う(ステップB2)。このステップの詳細な動作の例については後述する。
前述のように、読み取り値決定部305は、仮想字種列中での各仮想字種の位に応じた解釈を行ってもよい。
以上で、ステップS33における読み取り値決定動作の詳細な説明を終了する。
ここで、読み取り値決定動作の具体例について、図12を参照して説明する。
図12は、ステップB1で認識された仮想字種列の具体例を示している。ここでは、4桁の仮想字種列“70”、“80”、“88”、“98”が認識されている。なお、“70”、“80”、“88”、“98”は、それぞれ、図5に一例を示した仮想字種の識別情報である。また、図7に示していない仮想字種“70”は、数字「7」の表示状態を示す仮想字種である。この仮想字種列は、左から順に、千の位、百の位、十の位、一の位を表すものとする。上述のように、この例では、仮想字種の識別情報は、2文字から構成されている。そこで、千の位として認識された仮想字種の識別情報を構成する2文字を、それぞれx(4)、y(4)と表すことにする。同様に、百、十、一の位としてそれぞれ認識された仮想字種の識別情報を構成する2文字を、x(3)、y(3)、x(2)、y(2)、x(1)、y(1)と表すこととする。つまり、この仮想字種列の場合、x(4)=7、y(4)=0、x(3)=8、y(3)=0、x(2)=8、y(2)=8、x(1)=9、y(1)=8である。ここで、一の位の仮想字種である“98”は、一の位の文字盤が、仮想字種“90”が示す表示状態から、仮想字種“00”が示す表示状態に向かって、8/10だけ回転した表示状態であるとみなすことができる。そこで、読み取り値決定部305は、計器に表示されない小数点第1位の値も推定することが可能である。したがって、読み取り値決定部305は、ステップB2において、計器に表示された4桁に加えて小数点以下1桁の数字を含む5桁の数値を解釈して出力することとする。ここでは、出力する数値の千の位をz(4)、百の位をz(3)、十の位をz(2)、一の位をz(1)、小数点第一位をz(0)と表すこととする。
このような具体例において、ステップB2での数値解釈動作の一例を、図13を参照して説明する。
図13では、まず、読み取り値決定部305は、仮想字種列の一の位の仮想字種から、読み取り値の一の位および小数点第一位の数値を決定する(ステップC1)。
具体的には、読み取り値決定部305は、z(1)=x(1)、z(0)=y(1)と決定する。これは、一の位の仮想字種は、上述のケース1に相当するとの考えに基づいている。
次に、読み取り値決定部305は、i=2〜nまで、ステップC2〜C8を繰り返す。ただし、nは、仮想字種列の桁数である。上述の4桁の仮想字種列の例では、n=4である。また、iは、処理対象の位を表す。例えば、i=2は、十の位を表す。i=3は、百の位を表す。i=4は、千の位を表す。
ここでは、まず、読み取り値決定部305は、z(i−1)=9であるか否かを判断する(ステップC2)。つまり、読み取り値決定部305は、処理対象の位より1つ低い位として解釈された数値が9であるか否かを判断する。
ここで、z(i−1)=9であれば、処理対象の位として認識された仮想字種は、上述のケース1(回転量が量的な意味を持つケース)とみなすことができる。そこで、この場合、読み取り値決定部305は、z(i)=x(i)と決定する(ステップC3)。
一方、z(i−1)が9でなければ、処理対象の位として認識された仮想字種は、上述のケース2(隣接する数字が映り込んでいるケース)とみなすことができる。そこで、この場合、読み取り値決定部305は、0≦y(i)≦b(i)であるか否かを判断する。ここで、b(i)は、iで示される処理対象の位が第1字種であるx(i)に近いかどうかを判断するため定められた1以上9以下の閾値である。
ここで、0≦y(i)≦b(i)であれば、処理対象の位として認識された仮想字種は、第1字種であるx(i)の文字の下部に、x(i)の下側に隣接するx(i)+1の文字が映り込んでいるだけであるとみなすことができる。そこで、読み取り値決定部305は、z(i)=x(i)と決定する(ステップC5)。
一方、0≦y(i)≦b(i)でなければ、読み取り値決定部305は、a(i)≦y(i)≦9であるか否かを判断する(ステップC5)。ここで、a(i)は、iで示される処理対象の位が第2字種であるx(i)+1に近いかどうかを判断するための1以上9以下の閾値である。なお、a(i)は、b(i)より小さい値であることが好ましい。
ここで、a(i)≦y(i)≦9であれば、処理対象の位として認識された仮想字種は、第2字種であるx(i)+1の文字の上部に、x(i)+1の上側に隣接するx(i)の文字が映り込んでいるだけであるとみなすことができる。そこで、この場合、読み取り値決定部305は、z(i)=x(i)+1と決定する(ステップC7)。
一方、a(i)≦y(i)≦9でない場合、読み取り値決定部305は、数値解釈結果を棄却(ステップC8)して処理を終了する。これは、認識された仮想字種の識別情報に誤りがある場合などに相当する。
このようにして、ステップC2〜C8の処理を、十の位を示すi=2から順に最上位のi=nまで完了すると、計器認識システム3は、z(n)〜z(0)までの数値を各位の数字として、n+1桁の数値解釈結果を出力する(ステップC9)。
以上で、計器認識システム3は、数値解釈処理を終了する。
図12の例では、仮想字種列“70”、“80”、“88”、“98”に対して、このようにして数値解釈処理が行われた結果、数値「7889.8」が解釈されている。
次に、本発明の第3の実施の形態の効果について述べる。
本発明の第3の実施の形態としての計器認識システムは、回転する文字盤を有する計器が任意の中間的な表示状態である場合にも、計器に示された情報をより精度よく認識することができる。
その理由について述べる。本実施の形態では、仮想字種辞書が、文字盤上の第1字種の表示状態と、文字盤上で第1字種に隣接する第2字種の表示状態との中間的な表示状態を、文字盤の回転量に応じて段階的に表す仮想字種のテンプレート画像を記憶している。そして、文字領域抽出部によって抽出された各文字セグメント画像について、仮想字種認識部が、仮想字種のテンプレート画像との文字認識による信頼度を算出し、より高い信頼度が算出された仮想字種を、各文字セグメント画像の認識結果とする。そして、読み取り値決定部が、複数の文字セグメントの組み合わせから、仮想字種列を認識するからである。
これにより、本実施の形態は、入力画像において計器の認識対象領域が第1字種と第2字種との中間的な表示状態を示す場合でも、文字盤の回転量に応じた各段階の中間的な表示状態を示す仮想字種とのと対応付けにより、精度よく認識を行うことができる。
さらには、本実施の形態は、回転する文字盤を有する計器が任意の中間的な表示状態である場合にも、計器の文字盤の回転量に応じてより精度の高い読み取り値を出力することができる。
その理由は、読み取り値決定部が、認識した仮想字種列における各仮想字種について、その仮想字種が表す中間的な表示状態の段階と、仮想字種列中での仮想字種の位置とに基づいて、数値解釈を行うからである。これにより、本実施の形態は、認識した仮想字種列における仮想字種が、回転量に応じた量的な意味を持つ場合と、本来表示されるはずの文字の付近に隣接する文字が映り込んでいる場合とを区別して処理することができる。つまり、本実施の形態は、表示されるはずの文字の付近に隣接文字が映りこんでいる場合には、本来表示されるはずの文字を解釈するので、隣接文字の映り込みに影響されることなく、読み取り値を決定することができる。また、本実施の形態は、仮想字種が、回転量に応じた量的な意味を持つ場合には、計器に表示される桁数より詳細な低い位まで解釈することができる。なお、例えば、上述した特許文献1には、計器に表示された部分的な上側の文字と、部分的な下側の文字との境界の位置を検出し、検出した位置に基づいて、表示桁数より低い位まで数値解釈を行う例については記載されている。しかし、この関連技術では、このような数値解釈処理は、文字認識処理とは異なる処理として行われているため、処理コストが高くなる。これに対して、本実施の形態は、中間的な表示状態を示す仮想字種の認識結果を用いて、詳細な数値解釈を行うことができる。その結果、本実施の形態は、処理コストを抑えながら、文字盤の回転量に応じてより精度の高い読み取り値を出力することができる。
(第4の実施の形態)
次に、本発明の第4の実施の形態について図面を参照して詳細に説明する。なお、本実施の形態の説明において参照する各図面において、本発明の第1〜第3の実施の形態と同一の構成および同様に動作するステップには同一の符号を付して本実施の形態における詳細な説明を省略する。
まず、本発明の第4の実施の形態としての計器認識システム4の構成を、図14に示す。図14において、計器認識システム4は、本発明の第2の実施の形態としての計器認識システム2が備える機能要素と、本発明の第3の実施の形態としての計器認識システム3が備える機能要素とを含む。ただし、計器認識システム4は、本発明の第2の実施の形態における文字領域抽出部202または本発明の第3の実施の形態における文字領域抽出部302に替えて、文字領域抽出部402を備える。さらに、計器認識システム4は、画像入力部407と、仮想字種辞書取得部408と、計器識別情報取得部409と、情報出力部410とを備える。なお、計器認識システム4およびその各機能ブロックは、図2を参照して説明した本発明の第1の実施の形態としての計器認識システム1と同一のハードウェア要素によって構成可能である。なお、計器認識システム4およびその各機能ブロックのハードウェア構成は、上述の構成に限定されない。
画像入力部407は、ネットワークインタフェース1006または撮像装置1005を介して、計器を表す入力画像を取得する。
文字領域抽出部402は、本発明の第2の実施の形態における文字領域抽出部202と同様に、入力画像から、計器の種別に基づいて、読み取り値認識領域の文字領域画像を抽出する。また、文字領域抽出部402は、抽出した文字領域画像から、本発明の第3の実施の形態における文字領域抽出部302と同様に、文字セグメント画像を抽出する。
仮想字種辞書取得部408は、計器種別認識部206によって認識された計器の種別に応じて、仮想字種辞書301を取得する。ここで、計器の種別によって、文字盤に配列される文字のフォント等が同一とは限らないことが想定される。そこで、仮想字種辞書301は、計器の種別に応じて用意されることが好ましい。これらの仮想字種辞書301は、例えば、あらかじめメモリ1002に記憶されていてもよい。そして、仮想字種辞書取得部408は、認識された計器の種別に応じた仮想字種辞書301を取得すればよい。また、計器の種別に応じた仮想字種辞書301を特定するための情報は、計器種別認識部206によって取得されるパラメータに含まれていてもよい。
計器識別情報取得部409は、入力画像から、計器を識別する計器識別情報を取得する。計器識別情報は、例えば、計器に記載される装置固有の番号や記号列である。具体的には、例えば、計器識別情報取得部409は、計器の種別に応じたパラメータを参照することにより、入力画像において計器識別情報を認識する対象となる計器識別情報認識領域を決定してもよい。そして、この場合、計器の種別に応じたパラメータには、その種別の計器において計器識別情報が記載されている領域を特定する情報が含まれているとする。また、計器の種別に応じたパラメータにそのような情報が含まれていない場合、計器識別情報取得部409は、あらかじめ定められた範囲を計器識別情報認識領域として決定してもよい。そして、計器識別情報取得部409は、決定した計器識別情報認識領域の画像から、計器識別情報を認識する。認識処理には、公知の文字認識手法を適用可能である。なお、計器識別情報の文字認識に用いられる辞書は、計器の種別に応じた計器識別情報認識用の辞書であってもよい。その場合、計器識別情報認識用の辞書を特定する情報が、前述のパラメータに含まれていてもよい。
その他、計器に、その固有情報を特定するためのバーコードまたはRFID(radio frequency identifier)等が貼付されている場合がある。この場合、計器識別情報取得部409は、バーコードまたはRFIDを、対応するリーダ(図示せず)によって読み取ることにより、計器識別情報を取得してもよい。
情報出力部410は、読み取り値決定部305によって決定された読み取り値を、計器識別情報とともに出力する。出力先は、メモリ1002、出力装置1003、または、ネットワークインタフェース1006を介して接続される他の装置等であってもよい。
以上のように構成された計器認識システム4の動作について、図15を参照して説明する。
図15において、まず、計器認識システム4は、ステップS21〜S23まで、本発明の第2の実施の形態と同様に動作する。これにより、入力画像の示す計器の種別が認識される。また、入力画像における読み取り値認識領域が決定される。また、計器の種別に対応するパラメータが取得される。
次に、仮想字種辞書取得部408は、認識された計器の種別に応じて、仮想字種辞書301を取得する(ステップS41)。
次に、計器識別情報取得部409は、入力画像が示す計器の計器識別情報を取得する(ステップS42)。
以降、計器認識システム4は、ステップS31〜S33まで、本発明の第3の実施の形態の計器認識システム3と略同様に動作して、読み取り値を決定する。ただし、ステップS31において、本発明の第3の実施の形態では、文字領域抽出部302が、入力画像から文字セグメント画像を抽出していた。本実施の形態では、文字領域抽出部402は、ステップS23で決定された読み取り値認識領域の文字領域画像から、文字セグメント画像の抽出を行えばよい。
次に、情報出力部410は、読み取り値と、計器識別情報とを対応付けて出力する(ステップS43)。
以上で、計器認識システム4は、動作を終了する。
次に、本発明の第4の実施の形態の効果について述べる。
本発明の第4の実施の形態としての計器認識システムは、中間的な表示状態となり得る計器に示された情報を、さらに精度よく認識することができる。
その理由について説明する。本実施の形態では、計器種別認識部が、入力画像の示す計器の種別を認識する。そして、領域決定部が、計器の種別に応じて、入力画像における読み取り値認識領域を決定する。そして、文字領域抽出部が、入力画像において決定された読み取り値認識領域の画像から文字セグメント画像を抽出する。これにより、入力画像全体から文字セグメント画像を抽出する場合と比べて、さらに精度よく文字セグメント画像が抽出される。また、仮想字種辞書取得部が、計器の種別に応じた仮想字種辞書を取得する。そして、仮想字種認識部が、計器の種別に応じた仮想字種辞書を用いて、文字セグメント画像の示す仮想字種を認識する。これにより、計器の種別を考慮しない仮想字種辞書を利用する場合と比べて、さらに精度よく仮想字種が認識される。その結果、読み取り値決定部は、精度よく抽出された文字セグメント画像から精度よく認識された仮想字種に基づいて、さらに精度よく読み取り値を決定することができる。
さらに、本発明の第4の実施の形態としての計器認識システムは、指示値が中間的な表示状態を示し得る計器を点検するユーザ作業を支援することができる。
その理由について説明する。本実施の形態では、画像入力部が、入力画像を取得する。そして、計器識別情報取得部が、入力画像の示す計器の計器識別情報を取得する。そして、情報出力部が、読み取り値を計器識別情報と共に出力するからである。これにより、ユーザは、中間的な表示状態の計器から指示値を読み取る作業を行う必要がなくなる。また、ユーザは、読み取り値および計器識別情報を入力する作業を行う必要がない。つまり、ユーザは、本実施の形態を用いて計器を撮像するだけで、指示値が中間的な表示状態を示し得る計器から得られる精度よい読み取り値を、計器識別情報と共に記録することができる。
(第5の実施の形態)
次に、本発明の第5の実施の形態について図面を参照して詳細に説明する。なお、本実施の形態の説明において参照する各図面において、本発明の第3の実施の形態と同一の構成および同様に動作するステップには同一の符号を付して本実施の形態における詳細な説明を省略する。
まず、本発明の第5の実施の形態としての計器認識システム5の構成を、図16に示す。図16において、計器認識システム5は、本発明の第4の実施の形態としての計器認識システム4に対して、情報出力部410に替えて情報出力部510を備える点が異なる。また、計器認識システム5は、さらに、履歴作成部511と、領域記録部512とを備える。なお、計器認識システム5およびその各機能ブロックは、図2を参照して説明した本発明の第1の実施の形態としての計器認識システム1と同一のハードウェア要素によって構成可能である。なお、計器認識システム5およびその各機能ブロックのハードウェア構成は、上述の構成に限定されない。
履歴作成部511は、読み取り値決定部305により決定された読み取り値の履歴情報を作成する。例えば、履歴作成部511は、読み取り値に、読み取り時刻やコメント情報等の付随する情報を対応付けて、その履歴を履歴情報として作成してもよい。また、履歴作成部511は、このような履歴情報を、テキストファイルとして作成してもよい。あるいは、履歴作成部511は、専用のデータ構造で、履歴情報を作成してもよい。これに限らず、履歴作成部511は、その他の形式で履歴情報を作成してもよい。
また、履歴作成部511は、過去の読み取り値の履歴情報を参照することにより、今回の読み取り値が妥当であるか否かを判断してもよい。例えば、履歴作成部511は、過去の読み取り値に対して今回の読み取り値が連続的であるか否かに基づいて、妥当性を判断してもよい。また、例えば、履歴作成部511は、仮想字種列としての信頼度が所定の良好条件を満たすか否かに基づいて、妥当性を判断してもよい。また、例えば、履歴作成部511は、読み取り値に対するユーザの確認結果を表す情報に基づいて、妥当性を判断してもよい。そのようなユーザによる確認結果を表す情報は、入力装置1004を介して取得される。また、そのような確認結果を表す情報には、読み取り値が妥当でないと判断された場合の正しい読み取り値が含まれていてもよい。
また、履歴作成部511は、読み取り値が妥当であると判断した場合に、その読み取り値を含む情報を、履歴情報に追加する。なお、履歴作成部511は、入力装置1004を介して読み取り値が入力された場合に、入力された読み取り値を含む情報を、履歴情報に追加すればよい。
領域記録部512は、入力画像における読み取り値認識領域を特定する情報を記録する。例えば、計器種別認識部206によって取得されたパラメータに読み取り値認識領域を特定するための情報が含まれていない場合がある。このような場合、領域記録部512は、読み取り値決定部305によって決定された読み取り値の基となった文字セグメント画像の組み合わせを含む領域を、読み取り値認識領域として特定してもよい。そして、領域記録部512は、当該読み取り値認識領域を特定する情報を、計器の種別に対応付けて記録してもよい。これにより、文字領域抽出部402は、計器の種別に応じたパラメータに、読み取り値認識領域を特定する情報が含まれていない場合にも対応できる。つまり、この場合、文字領域抽出部402は、過去に認識対象とした計器と同種別の計器であれば、領域記録部512を参照して読み取り値認識領域を特定可能となる。
また、領域記録部512は、さらに、入力画像における計器識別情報認識領域を特定する情報を記録してもよい。例えば、計器種別認識部206によって取得されたパラメータに、計器識別情報認識領域を特定するための情報が含まれていない場合がある。このような場合、領域記録部512は、計器識別情報取得部409によって認識された計器識別情報を表す領域を、計器の種別に対応付けて記録してもよい。これにより、計器識別情報取得部409は、領域記録部512に記録のある種別の計器を表す入力画像を対象とする場合、新たに計器識別情報認識領域を決定する処理を省略することができる。
なお、領域記録部512は、これらの記録情報を、テキストファイル形式で記録してもよい。あるいは、領域記録部512は、これらの記録情報を、専用に定義されたデータ構造で記録してもよい。また、記録情報は、その他の形式であってもよい。
情報出力部510は、読み取り値および計器識別情報を出力することに加えて、各種情報の出力を行う。
例えば、情報出力部510は、読み取り値が異常である場合に、読み取り値が異常であることを示す情報を報知してもよい。報知先は、例えば、出力装置1003(液晶ディスプレイまたはスピーカー等)や、ネットワークインタフェース1006を介して接続された装置であってもよい。
この場合、情報出力部510は、読み取り値決定部305によって決定された読み取り値に基づいて、読み取り値が正常であるか異常であるかを検出する。例えば、情報出力部510は、計器の種別または計器識別情報に対応付けて、読み取り値の正常な変動パターンを記憶しておく。そして、情報出力部510は、読み取り値決定部305によって読み取られた数値が、該当する変動パターンにマッチしているか否かに基づいて、読み取り値が正常であるか否かを判断してもよい。例えば、読み取り値が異常である場合、計器自体が正常に動作していない場合が考えられる。あるいは、読み取り値が異常である場合、計器によって測定されている状況が、正常でない状況となっている場合が考えられる。
また、情報出力部510は、履歴作成部511によって生成された履歴情報を出力してもよい。出力先は、例えば、ネットワークインタフェース1006を介して接続された装置であってもよい。
また、情報出力部510は、計器の種別、計器識別情報、または、読み取り値等に応じて、計器の点検作業手順を表す情報を出力してもよい。出力先は、例えば、出力装置1003であってもよい。
また、情報出力部510は、点検記録を表す情報を出力してもよい。例えば、情報出力部510は、入力装置1004を介して入力される作業者のコメント情報を取得し、取得したコメント情報と、計器識別情報と、読み取り値とを含む点検記録を表す情報を生成し、出力してもよい。出力先は、例えば、出力装置1003やメモリ1002等であってもよい。
また、情報出力部510は、領域記録部512によって記録された読み取り値認識領域や計器識別情報認識領域を、入力画像に重畳して出力装置1003に出力してもよい。さらに、情報出力部510は、読み取り値を、入力画像における読み取り値認識領域に重畳して出力してもよい。これにより、情報出力部510は、計器認識システム5の認識結果を分かりやすくユーザに提示できる。
以上のように構成された計器認識システム5の動作について、図17を参照して説明する。
図17では、計器認識システム5は、本発明の第4の実施の形態と同様にステップS21〜S23、S41〜S42、S31〜S33まで実行する。これにより、読み取り値が決定される。
次に、履歴作成部511は、読み取り値の履歴情報を生成する(ステップS51)。このステップの詳細については後述する。
次に、領域記録部512は、計器の種別に対応付けて、各種領域を特定する情報を記録する(ステップS52)。例えば、前述のように、領域記録部512は、入力画像において読み取り値認識領域を特定する情報や、計器識別情報認識領域を特定する情報を記録する。
次に、情報出力部510は、各種情報を出力する(ステップS53)。
例えば、前述のように、情報出力部510は、読み取り値が異常であるか否かを表す情報を検出し、その結果を出力してもよい。また、前述のように、情報出力部510は、履歴情報を出力してもよい。また、前述のように、情報出力部510は、読み取り値認識領域および計器識別情報認識領域が重畳された入力画像を出力してもよい。また、前述のように、情報出力部510は、読み取り値が重畳された入力画像等を出力してもよい。また、前述のように、情報出力部510は、計器の種別や計器識別情報に応じた点検作業手順を表す情報や、点検記録を表す情報を出力してもよい。
以上で、計器認識システム5は、動作を終了する。
次に、ステップS51における履歴情報生成動作の一例を、図18に示す。
図18において、まず、履歴作成部511は、読み取り値が棄却されずに得られているかどうかをチェックする(ステップD1)。
ここで、読み取り値が得られている場合、履歴作成部511は、読み取り結果が妥当であるか否かを判断する(ステップD2)。
前述のように、履歴作成部511は、履歴情報を参照することにより過去の読み取り値から今回の読み取り値までが連続的であるかどうかに基づいて、妥当性を判断してもよい。また、履歴作成部511は、仮想字種列としての信頼度が所定の良好条件を満たすか否かに基づいて、妥当性を判断してもよい。または、履歴作成部511は、読み取り値を出力し、ユーザ入力に基づいて、妥当性を判断してもよい。また、履歴作成部511は、これらの手法を組み合わせて読み取り値の妥当性を判断してもよい。
ここで、読み取り値が妥当であると判断された場合、履歴作成部511は、読み取り値および付随する情報を履歴情報に追加する(ステップD4)。
一方、ステップD1で読み取り値が得らていないと判断された場合、または、ステップD2で読み取り値が妥当でないと判断された場合、履歴作成部511は、次の動作を行う。すなわち、履歴作成部511は、正しい読み取り値を取得する(ステップD3)。
例えば、履歴作成部511は、ユーザに対して計器の目視チェックを指示する情報を出力することにより、入力装置1004を介して入力される目視情報を、正しい読み取り値として取得してもよい。そして、履歴作成部511は、得られた読み取り値および付随する情報を、履歴情報に追加する(ステップD4)。
以上で、計器認識システム5は、ステップS51における履歴情報生成動作を終了する。
次に、計器認識システム5の具体的な利用例について説明する。
<利用例1:計器の作業点検指示内容の参照、点検記録作成>
点検作業者が、計器認識システム5を用いて、計器の点検作業を行うことを想定する。この場合、計器認識システム5は、計器識別情報および計器の指示値を認識し、認識した情報に応じた点検作業手順を、出力装置1003に出力する。また、計器認識システム5は、計器識別情報および計器の指示値に、ユーザ入力情報を加えて、点検記録情報を作成してメモリ1002に出力する。
このとき、点検作業者は、次の手順で計器認識システム5を利用する。
1)点検作業者は、計器認識システム5を用いて計器を撮像し、計器識別情報および計器指示値を認識させる。
2)点検作業者は、認識された計器識別情報および計器指示値に応じて表示される作業点検手順に従って、点検作業を行う。
3)点検作業者は、点検の際に気付いたこと、作業報告などをコメントとして入力する。
4)点検作業者は、作業記録として計器認識システム5に記録されたデータ(計器識別情報、計器の指示値、および、コメント)を、作業確証として出力する。
<利用例2:異常監視>
利用例1と同様に、点検作業者が、計器認識システム5を用いて、計器の点検作業を行うことを想定する。この場合、計器認識システム5は、計器識別情報および計器指示値の認識に加えて、計器の種別または計器識別情報に応じて読み取り値の異常状態の検出を行う。
このとき、点検作業者は、次の手順で計器認識システム5を利用する。
1)点検作業者は、計器認識システム5を用いて計器を撮像し、計器識別情報および計器指示値を認識させる。
2)点検作業者は、計器認識システム5から異常状態であるとの出力があった場合には、計器の緊急停止等のオペレーション、もしくは、作業を管轄する管理センター等への通報等を行う。
<利用例3:スマートメータ>
計器の読み取り値を定期的にサーバにアップロードすることを想定する。この場合、計器認識システム5は、計器に対して、指示値の読み取りに適した位置・角度に設置される。計器認識システム5は、所定タイミング毎に、計器の指示値を認識し、履歴情報をサーバーに送信する。
次に、本発明の第5の実施の形態の効果について述べる。
本発明の第5の実施の形態としての計器認識システムは、中間的な表示状態となり得る計器に示された情報を、さらに精度よく認識することができる。
その理由について説明する。本実施の形態では、履歴作成部が、読み取り値の履歴情報を生成する。そして、履歴作成部が、過去の読み取り値の履歴情報を参照することにより、今回の読み取り値の妥当性を判断するからである。これにより、本実施の形態は、妥当でないと判断された読み取り値を採用することがなく、より精度よい読み取り値を出力することができる。また、本実施の形態では、領域記録部が、入力画像における文字認識領域を、計器の種別に対応付けて記録する。これにより、計器の種別に応じたパラメータに、これらの認識領域を特定する情報が含まれていない場合であっても、本実施の形態は、過去に対象とした種別と同一の種別の計器であれば、より正確に文字認識領域を決定することができる。その結果、本実施の形態は、そのような文字認識領域の画像から精度よく読み取り値を決定することができる。
さらに、本発明の第5の実施の形態としての計器認識システムは、指示値が中間的な表示状態を示し得る計器を点検するユーザ作業を、さらにより良く支援することができる。
その理由について説明する。本実施の形態では、情報出力部が、履歴作成部により作成された履歴情報を提示する。また、情報出力部が、計器識別情報、計器の種別、読み取り値等に応じた点検作業手順情報を生成して提示する。また、情報出力部が、読み取り値および計器識別情報を含む点検記録情報を生成して記録する。また、情報出力部が、読み取り値が正常であるか異常であるかを検出し、異常を検出した場合に報知を行う。このように、本実施の形態は、指示値が中間的な表示状態を示し得る計器を点検するユーザに想定される各種作業を支援することができる。
なお、上述した本発明の各実施の形態において、各機能ブロックは、二値化画像を用いて動作する例を中心に説明した。これに限らず、各機能ブロックは、二値化されていない画像や、グレースケール化された画像等を用いてもよい。
また、上述した本発明の各実施の形態において、文字盤上に配列される文字が数字である例を中心に説明した。これに限らず、文字盤上に配列される文字は、数字以外の文字であってもよい。
また、上述した本発明の各実施の形態において、文字盤上において、文字に対して上下方向に文字が配列される例を中心に説明した。これに限らず、文字盤上に配列される文字は、文字に対して左右方向などの他の方向に配列されていてもよい。また、その場合、文字盤が回転する場合の回転方向は、配列されている文字の方向であればよい。
また、上述した本発明の各実施の形態において、計器は、回転する4つの文字盤により4桁の指示値を表示する例を中心に説明した。ただし、各実施の形態において、計器に表示される数値の桁数は限定されない。
また、上述した本発明の各実施の形態において、プリミティブセグメントおよび結合セグメントを抽出する手法の一例を記載した。これに限らず、画像から文字を表すプリミティブセグメントおよび結合セグメントを抽出する手法には、公知の各技術を採用可能である。
また、上述した本発明の各実施の形態において、文字セグメントの組み合わせから仮想字種列を認識する手法として、公知文献「特許4600651号」に記載の技術を適用する例を説明した。これに限らず、文字セグメントの組み合わせから仮想字種列を認識する手法には、その他の公知の技術を採用可能である。
また、上述した本発明の各実施の形態において、仮想字種辞書、計器の種別に応じたパラメータ、計器種別画像、計器識別情報認識用の辞書、計器の種別および設置位置情報の対応関係等が、計器認識システムを構成するメモリに記憶されている例を中心に説明した。これに限らず、これらの各情報の一部または全部は、ネットワークを介した接続されるサーバ等の装置に記憶されていてもよい。その場合、各機能ブロックは、必要となるこれらの情報を適宜サーバからダウンロードすればよい。
また、上述した本発明の各実施の形態において、計器認識システムの各機能ブロックが、記憶装置またはROMに記憶されたコンピュータ・プログラムを実行するCPUによって実現される例を中心に説明した。これに限らず、各機能ブロックの一部、全部、または、それらの組み合わせが専用のハードウェアにより実現されていてもよい。
また、上述した本発明の各実施の形態において、計器認識システムの機能ブロックは、複数の装置に分散されて実現されてもよい。
また、上述した本発明の各実施の形態において、各フローチャートを参照して説明した計器認識システムの動作を、本発明のコンピュータ・プログラムとしてコンピュータの記憶装置(記憶媒体)に格納しておく。そして、係るコンピュータ・プログラムを当該CPUが読み出して実行するようにしてもよい。そして、このような場合において、本発明は、係るコンピュータ・プログラムのコードあるいは記憶媒体によって構成される。
また、上述した各実施の形態は、適宜組み合わせて実施されることが可能である。
また、本発明は、上述した各実施の形態に限定されず、様々な態様で実施されることが可能である。
また、上述した各実施の形態の一部又は全部は、以下の付記のようにも記載されうるが、以下には限られない。
(付記1)
計器において文字盤上の第1字種が表示される状態と、前記文字盤上で前記第1字種に隣接する第2字種が表示される状態との中間的な表示状態を段階的に示す仮想字種を表す情報を含む仮想字種辞書と、
入力画像から文字領域画像を抽出する文字領域抽出手段と、
前記仮想字種辞書を用いて、前記文字領域画像から前記仮想字種を認識することにより、前記入力画像が示す計器の中間的な表示状態の段階を認識する仮想字種認識手段と、
を備える計器認識システム。
(付記2)
前記入力画像の表す計器の種別を認識する計器種別認識手段を更に備え、
前記文字領域抽出手段は、前記計器種別認識手段によって認識された種別に基づいて、前記文字領域画像を抽出することを特徴とする付記1に記載の計器認識システム。
(付記3)
前記仮想字種辞書は、前記仮想字種を表す情報として、前記文字盤の回転量に応じて前記中間的な表示状態を段階的に示す仮想字種を表す情報を含むことを特徴とする付記1または付記2に記載の計器認識システム。
(付記4)
前記仮想字種認識手段による認識結果と、該認識結果が示す前記中間的な表示状態の前記段階とに基づいて、読み取り値を決定する読み取り値決定手段をさらに備えたことを特徴とする付記1から付記3のいずれか1つに記載の計器認識システム。
(付記5)
前記計器種別認識手段によって認識された種別に応じて、前記仮想字種辞書を取得する仮想字種辞書取得手段をさらに備えたことを特徴とする付記2に記載の計器認識システム。
(付記6)
前記仮想字種認識手段は、前記仮想字種辞書を用いた認識結果の信頼度を算出し、
前記読み取り値決定手段は、前記信頼度に基づいて、前記読み取り値を決定することを特徴とする付記4に記載の計器認識システム。
(付記7)
前記読み取り値決定手段により決定された読み取り値の履歴を表す履歴情報を作成する履歴作成手段をさらに備えたことを特徴とする付記4または付記6に記載の計器認識システム。
(付記8)
前記入力画像の示す計器を識別する計器識別情報を取得する計器識別情報取得手段をさらに備えたことを特徴とする付記1から付記7のいずれか1つに記載の計器認識システム。、
(付記9)
前記入力画像において文字を認識する対象となる領域を特定するための情報を記録する領域記録手段をさらに備えたことを特徴とする付記1から付記8のいずれか1つに記載の計器認識システム。
(付記10)
入力画像の表す計器の種別を認識する計器種別認識手段と、
前記計器種別認識手段によって認識された種別に基づいて、前記入力画像から文字領域画像を抽出する文字領域抽出手段と、
を備えた計器認識システム。
(付記11)
計器において文字盤上の第1字種が表示される状態と、前記文字盤上で前記第1字種に隣接する第2字種が表示される状態との中間的な表示状態を段階的に示す仮想字種を表す情報を含む仮想字種辞書を用いて、
入力画像から文字領域画像を抽出し、
前記仮想字種辞書を用いて、前記文字領域画像から前記仮想字種を認識することにより、前記入力画像が示す計器の中間的な表示状態の段階を認識する方法。
(付記12)
計器において文字盤上の第1字種が表示される状態と、前記文字盤上で前記第1字種に隣接する第2字種が表示される状態との中間的な表示状態を段階的に示す仮想字種を表す情報を含む仮想字種辞書を用いて
入力画像から文字領域画像を抽出する文字領域抽出ステップと、
前記仮想字種辞書を用いて、前記文字領域画像から前記仮想字種を認識することにより、前記入力画像が示す計器の中間的な表示状態の段階を認識する仮想字種認識ステップと、
をコンピュータ装置に実行させるプログラム。
1、2、3、4、5 計器認識システム
101、301 仮想字種辞書
102、202、302、402 文字領域抽出部
103、303 仮想字種認識部
304 認識信頼度格納バッファ
305 読み取り値決定部
206 計器種別認識部
407 画像入力部
408 仮想字種辞書取得部
409 計器識別情報取得部
410、510 情報出力部
511 履歴作成部
512 領域記録部
1001 CPU
1002 メモリ
1003 出力装置
1004 入力装置
1005 撮像装置
1006 ネットワークインタフェース

Claims (10)

  1. 計器において文字盤上の第1字種が表示される状態と、前記文字盤上で前記第1字種に隣接する第2字種が表示される状態との中間的な表示状態を段階的に示す仮想字種を表す情報を含む仮想字種辞書と、
    入力画像から文字領域画像を抽出する文字領域抽出手段と、
    前記仮想字種辞書を用いて、前記文字領域画像から前記仮想字種を認識することにより、前記入力画像が示す計器の中間的な表示状態の段階を認識する仮想字種認識手段と、
    を備える計器認識システム。
  2. 前記入力画像の表す計器の種別を認識する計器種別認識手段を更に備え、
    前記文字領域抽出手段は、前記計器種別認識手段によって認識された種別に基づいて、前記文字領域画像を抽出することを特徴とする請求項1に記載の計器認識システム。
  3. 前記仮想字種辞書は、前記仮想字種を表す情報として、前記文字盤の回転量に応じて前記中間的な表示状態を段階的に示す仮想字種を表す情報を含むことを特徴とする請求項1または請求項2に記載の計器認識システム。
  4. 前記仮想字種認識手段による認識結果と、該認識結果が示す前記中間的な表示状態の前記段階とに基づいて、読み取り値を決定する読み取り値決定手段をさらに備えたことを特徴とする請求項1から請求項3のいずれか1項に記載の計器認識システム。
  5. 前記計器種別認識手段によって認識された種別に応じて、前記仮想字種辞書を取得する仮想字種辞書取得手段をさらに備えたことを特徴とする請求項2に記載の計器認識システム。
  6. 前記仮想字種認識手段は、前記仮想字種辞書を用いた認識結果の信頼度を算出し、
    前記読み取り値決定手段は、前記信頼度に基づいて、前記読み取り値を決定することを特徴とする請求項4に記載の計器認識システム。
  7. 前記読み取り値決定手段により決定された読み取り値の履歴を表す履歴情報を作成する履歴作成手段をさらに備えたことを特徴とする請求項4または請求項6に記載の計器認識システム。
  8. 入力画像の表す計器の種別を認識する計器種別認識手段と、
    前記計器種別認識手段によって認識された種別に基づいて、前記入力画像から文字領域画像を抽出する文字領域抽出手段と、
    を備えた計器認識システム。
  9. 計器において文字盤上の第1字種が表示される状態と、前記文字盤上で前記第1字種に隣接する第2字種が表示される状態との中間的な表示状態を段階的に示す仮想字種を表す情報を含む仮想字種辞書を用いて、
    入力画像から文字領域画像を抽出し、
    前記仮想字種辞書を用いて、前記文字領域画像から前記仮想字種を認識することにより、前記入力画像が示す計器の中間的な表示状態の段階を認識する方法。
  10. 計器において文字盤上の第1字種が表示される状態と、前記文字盤上で前記第1字種に隣接する第2字種が表示される状態との中間的な表示状態を段階的に示す仮想字種を表す情報を含む仮想字種辞書を用いて
    入力画像から文字領域画像を抽出する文字領域抽出ステップと、
    前記仮想字種辞書を用いて、前記文字領域画像から前記仮想字種を認識することにより、前記入力画像が示す計器の中間的な表示状態の段階を認識する仮想字種認識ステップと、
    をコンピュータ装置に実行させるプログラム。
JP2014255159A 2014-12-17 2014-12-17 計器認識システム、方法、および、プログラム Pending JP2016115255A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2014255159A JP2016115255A (ja) 2014-12-17 2014-12-17 計器認識システム、方法、および、プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2014255159A JP2016115255A (ja) 2014-12-17 2014-12-17 計器認識システム、方法、および、プログラム

Publications (1)

Publication Number Publication Date
JP2016115255A true JP2016115255A (ja) 2016-06-23

Family

ID=56142044

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014255159A Pending JP2016115255A (ja) 2014-12-17 2014-12-17 計器認識システム、方法、および、プログラム

Country Status (1)

Country Link
JP (1) JP2016115255A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020154554A (ja) * 2019-03-19 2020-09-24 株式会社Third 計器読取システム

Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08334377A (ja) * 1995-06-06 1996-12-17 Sharp Corp 走行距離検出装置
JP2000057255A (ja) * 1998-08-04 2000-02-25 Chubu Electric Power Co Inc 電力量計銘板等の字体表示面の字体読取装置
JP2000182021A (ja) * 1998-12-16 2000-06-30 Toshiba Corp メータ読取り装置
JP2001101380A (ja) * 1999-09-27 2001-04-13 Nippon Bendeingu Kk 数値読取り方法及びその装置
JP2003242444A (ja) * 2002-02-20 2003-08-29 Toko Electric Corp 現字形計器認識処理装置及び現字形計器認識処理方法
JP2005070869A (ja) * 2003-08-27 2005-03-17 Toyo Electric Mfg Co Ltd 遠隔検針装置
JP2005275590A (ja) * 2004-03-23 2005-10-06 Chugoku Electric Power Co Inc:The 指示値認識方法、指示値認識システム、指示値認識プログラム、指示値認識プログラムを記録した記録媒体
US20060045389A1 (en) * 2004-08-25 2006-03-02 Butterworth Mark M Automatic meter reading
JP2006285303A (ja) * 2005-03-31 2006-10-19 Fuji Electric Systems Co Ltd メータの指示値読取システム
JP4600651B2 (ja) * 2004-10-06 2010-12-15 日本電気株式会社 文字列認識方法および装置
JP2011060067A (ja) * 2009-09-11 2011-03-24 Denkosha:Kk 自動検針システム
WO2011046127A1 (ja) * 2009-10-14 2011-04-21 日本電気株式会社 データ収集システム、携帯端末、シール及びデータ収集方法

Patent Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08334377A (ja) * 1995-06-06 1996-12-17 Sharp Corp 走行距離検出装置
JP2000057255A (ja) * 1998-08-04 2000-02-25 Chubu Electric Power Co Inc 電力量計銘板等の字体表示面の字体読取装置
JP2000182021A (ja) * 1998-12-16 2000-06-30 Toshiba Corp メータ読取り装置
JP2001101380A (ja) * 1999-09-27 2001-04-13 Nippon Bendeingu Kk 数値読取り方法及びその装置
JP2003242444A (ja) * 2002-02-20 2003-08-29 Toko Electric Corp 現字形計器認識処理装置及び現字形計器認識処理方法
JP2005070869A (ja) * 2003-08-27 2005-03-17 Toyo Electric Mfg Co Ltd 遠隔検針装置
JP2005275590A (ja) * 2004-03-23 2005-10-06 Chugoku Electric Power Co Inc:The 指示値認識方法、指示値認識システム、指示値認識プログラム、指示値認識プログラムを記録した記録媒体
US20060045389A1 (en) * 2004-08-25 2006-03-02 Butterworth Mark M Automatic meter reading
JP4600651B2 (ja) * 2004-10-06 2010-12-15 日本電気株式会社 文字列認識方法および装置
JP2006285303A (ja) * 2005-03-31 2006-10-19 Fuji Electric Systems Co Ltd メータの指示値読取システム
JP2011060067A (ja) * 2009-09-11 2011-03-24 Denkosha:Kk 自動検針システム
WO2011046127A1 (ja) * 2009-10-14 2011-04-21 日本電気株式会社 データ収集システム、携帯端末、シール及びデータ収集方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020154554A (ja) * 2019-03-19 2020-09-24 株式会社Third 計器読取システム
JP7093321B2 (ja) 2019-03-19 2022-06-29 株式会社Third 計器読取システム

Similar Documents

Publication Publication Date Title
RU2613734C1 (ru) Захват видео в сценарии ввода данных
US8781172B2 (en) Methods and systems for enhancing the performance of automated license plate recognition applications utilizing multiple results
JP6528147B2 (ja) 会計データ入力支援システム、方法およびプログラム
JP6527410B2 (ja) 文字認識装置、文字認識方法、及びプログラム
JP6874729B2 (ja) 画像処理装置、画像処理方法およびプログラム
CN105511791A (zh) 一种试验质检电子记录表手写处理方法及装置
JP6100532B2 (ja) レシート定義データ作成装置およびそのプログラム
JP6859977B2 (ja) 画像処理装置、画像処理システム、画像処理方法およびプログラム
US20150262030A1 (en) Image processing device, image processing method, and image processing program
JP6786874B2 (ja) 針式メータ検出装置、方法およびプログラム
JP2012221183A (ja) レシートデータ認識装置およびそのプログラム
JP2023522360A (ja) Ocrベース文書分析システム及び方法
JP6744126B2 (ja) 文字認識装置、文字認識プログラム、文字認識方法
CN104408403A (zh) 一种二次录入不一致的仲裁方法及装置
JP2018156308A (ja) 情報処理装置、情報処理システム及びプログラム
JP2016115255A (ja) 計器認識システム、方法、および、プログラム
US11605219B2 (en) Image-processing device, image-processing method, and storage medium on which program is stored
US10679101B2 (en) Optical character recognition systems and methods
JP5045211B2 (ja) 文字認識装置、外観検査装置及び文字認識方法
RU2641452C2 (ru) Неполные эталоны
JP2020052981A (ja) 情報処理装置、学習装置、情報処理システム、情報処理方法及びコンピュータプログラム
JP2011107966A (ja) 文書処理装置
JP6250526B2 (ja) 計量メータ読取装置及びプログラム
JP5712415B2 (ja) 帳票処理システム及び帳票処理方法
JP2021012741A (ja) 画像処理装置、画像処理方法およびプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20171115

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20181112

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20181225

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20190702