JP6542406B1 - 読取システム、読取方法、プログラム、及び記憶媒体 - Google Patents

読取システム、読取方法、プログラム、及び記憶媒体 Download PDF

Info

Publication number
JP6542406B1
JP6542406B1 JP2018026476A JP2018026476A JP6542406B1 JP 6542406 B1 JP6542406 B1 JP 6542406B1 JP 2018026476 A JP2018026476 A JP 2018026476A JP 2018026476 A JP2018026476 A JP 2018026476A JP 6542406 B1 JP6542406 B1 JP 6542406B1
Authority
JP
Japan
Prior art keywords
image
candidate image
segment display
candidate
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2018026476A
Other languages
English (en)
Other versions
JP2019144703A (ja
Inventor
利和 瀧
利和 瀧
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2018026476A priority Critical patent/JP6542406B1/ja
Priority to CN201880088145.8A priority patent/CN111656397B/zh
Priority to PCT/JP2018/035334 priority patent/WO2019159414A1/ja
Application granted granted Critical
Publication of JP6542406B1 publication Critical patent/JP6542406B1/ja
Publication of JP2019144703A publication Critical patent/JP2019144703A/ja
Priority to US16/925,390 priority patent/US11455787B2/en
Priority to US17/893,351 priority patent/US11900664B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/82Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • G06T5/73
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/146Aligning or centring of the image pick-up or image-field
    • G06V30/147Determination of region of interest
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/18Extraction of features or characteristics of the image
    • G06V30/1801Detecting partial patterns, e.g. edges or contours, or configurations, e.g. loops, corners, strokes or intersections
    • G06V30/18019Detecting partial patterns, e.g. edges or contours, or configurations, e.g. loops, corners, strokes or intersections by matching or filtering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/19Recognition using electronic means
    • G06V30/191Design or setup of recognition systems or techniques; Extraction of features in feature space; Clustering techniques; Blind source separation
    • G06V30/19173Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Abstract

【課題】セグメントディスプレイの数値の読み取り精度を向上できる、読取システム、読取方法、プログラム、及び記憶媒体を提供する。【解決手段】実施形態に係る読取システムは、抽出部、判定部、及び読取部を備える。抽出部は、入力画像からセグメントディスプレイが撮影された部分の候補となる候補画像を抽出する。判定部は、候補画像と予め設定されたマスクとを用いて、候補画像にセグメントディスプレイが含まれる確度を示す適合率を算出し、適合率が予め設定された閾値以上である場合に、候補画像をセグメントディスプレイの画像であると判定する。読取部は、セグメントディスプレイの画像と判定された候補画像から、セグメントディスプレイに表示された数値を読み取る。【選択図】図1

Description

本発明の実施形態は、読取システム、読取方法、プログラム、及び記憶媒体に関する。
セグメントディスプレイに表示された数値を読み取るシステムがある。このシステムにおいて、数値の読み取りの精度は、高いことが望ましい。
特開2008−243103号公報
本発明が解決しようとする課題は、セグメントディスプレイの数値の読み取り精度を向上できる、読取システム、読取方法、プログラム、及び記憶媒体を提供することである。
実施形態に係る読取システムは、抽出部、判定部、及び読取部を備える。前記抽出部は、入力画像からセグメントディスプレイが撮影された部分の候補となる候補画像を抽出する。前記判定部は、前記候補画像と予め設定されたマスクとを用いて、前記候補画像にセグメントディスプレイが含まれる確度を示す適合率を算出し、前記適合率が予め設定された閾値以上である場合に、前記候補画像をセグメントディスプレイの画像であると判定する。前記読取部は、セグメントディスプレイの画像と判定された前記候補画像から、セグメントディスプレイに表示された数値を読み取る。
実施形態に係る読取システムの構成を表すブロック図である。 実施形態に係る読取システムの動作を表すフローチャートである。 実施形態に係る読取システムにおける処理を例示する図である。 実施形態の第1変形例に係る読取システムの構成を表すブロック図である。 実施形態の第2変形例に係る読取システムの構成を表すブロック図である。 実施形態の第3変形例に係る読取システムの構成を表すブロック図である。 実施形態に係る読取システムを実現するためのハードウェア構成を表すブロック図である。
以下に、本発明の各実施形態について図面を参照しつつ説明する。
また、本願明細書と各図において、既に説明したものと同様の要素には同一の符号を付して詳細な説明は適宜省略する。
図1は、実施形態に係る読取システムの構成を表すブロック図である。
実施形態に係る読取システムは、セグメントディスプレイを含む画像から、セグメントディスプレイに表示された数値を読み取るために用いられる。本実施形態において、セグメントディスプレイとは、複数のセグメントの表示によって構成される数字や文字等の何らかの表示情報を含むものを表す。
図1に表したように、実施形態に係る読取システム1は、撮像部11、抽出部12、変換部13、切出部14、判定部15、読取部16、及び記憶部18を備える。
撮像部11は、セグメントディスプレイを撮影し、静止した画像を取得する。撮像部11は、取得した画像を抽出部12に出力する。撮像部11により動画が撮影される場合は、その動画から静止画像を切り出して抽出部12に出力する。撮影される画像には、セグメントディスプレイ以外のものが写っていても良い。
抽出部12は、入力された画像から、セグメントディスプレイの画像の候補を抽出する。ここでは、撮像部11によって撮影され、抽出部12に入力される画像を、入力画像と呼ぶ。入力画像の一部であって、セグメントディスプレイの候補となる画像を、候補画像と呼ぶ。候補画像は、セグメントディスプレイが撮影されていると抽出部12によって判定された、入力画像の一部である。抽出部12から出力される候補画像は複数であっても良い。
具体的な一例として、抽出部12は、加工部12a、二値化部12b、輪郭抽出部12c、第1選定部12d、四角形抽出部12e、第2選定部12fを有する。
加工部12aは、例えば、入力画像を、グレイスケールに変換した加工画像を生成する。加工部12aは、加工画像を二値化部12bに出力する。この際に、加工部12aは、例えば、入力画像を予め設定されたサイズに縮小した加工画像を、二値化部12bに出力してもよい。その際、加工部12aは、縮小されていない原寸画像を記憶部18に記憶する。
二値化部12bは、入力された加工画像を二値化し、白色と黒色で表される二値画像を生成する。輪郭抽出部12cは、二値画像において、例えば白色で表されている領域の輪郭を抽出する。
第1選定部12dは、輪郭で囲まれた領域の面積を算出する。複数の輪郭が抽出された場合は、それぞれの領域の面積を算出する。第1選定部12dは、算出された各面積と所定の閾値とを比較し、面積が閾値以上の領域のみを選定する。これにより、面積が小さすぎる領域が候補から除外される。四角形抽出部12eは、選定された領域を直線近似し、四角形を抽出する。例えば、四角形抽出部12eは、抽出された四角形の頂点の座標を取得する。
第2選定部12fは、抽出された四角形の領域を予め設定された条件と比較し、条件に適合する領域を選定する。条件としては、例えば、四角形の縦寸法と横寸法の比率が所定範囲内にあること、頂点の角度が所定範囲内にあること、四角形のいずれかの頂点も画像の外枠近傍(例えば、外枠から3ピクセル以内)にないこと、などが用いられる。第2選定部12fは、選定された四角形を、最終的な候補画像として、変換部13に出力する。
変換部13は、以下の第1処理及び第2処理を行う。
第1処理において、変換部13は、抽出部12から入力された候補画像が歪んでいないか判定する。候補画像が歪んでいると判定された場合、変換部13は、候補画像が正面から撮影された画像に近づくように、その歪みを補正する。
第2処理において、変換部13は、候補画像のサイズが、予め設定された規定サイズと一致するか判定する。候補画像のサイズが規定サイズと一致しない場合、変換部13は、候補画像のサイズが規定サイズに近づくように、候補画像を補正する。
第1処理及び第2処理を行う順序は任意である。または、第1処理と第2処理が同時に行われても良い。変換部13は、例えば、候補画像を射影変換することで、第1処理及び第2処理を同時に行い、歪み及びサイズを補正する。変換部13は、補正した候補画像を切出部14に出力する。候補画像が歪んでおらず、候補画像のサイズが規定サイズに一致すると判定された場合、変換部13は、入力された候補画像をそのまま切出部14に出力する。
切出部14は、記憶部18を参照する。記憶部18には、予め設定されたマスクと、その情報が記憶されている。本実施形態では、マスクは、読み取り対象のセグメントディスプレイに対応した画像である。また、マスクは、対象のセグメントディスプレイを読み取る際の参照情報となる。例えば、全てのセグメントが点灯した状態のセグメントディスプレイの二値画像が、マスクとして用いられる。切出部14は、マスクの縦寸法及び横寸法、実際のセグメントディスプレイにおけるマスクの対応位置を記憶部18から取得する。切出部14は、これらの情報に基づいて、入力された候補画像から、その一部を切り出す。切出部14は、切り出した候補画像を判定部15に出力する。
判定部15は、記憶部18を参照し、入力された候補画像とマスクとを用いて適合率を算出する。適合率は、候補画像にセグメントディスプレイが含まれる確度を示す値である。例えば、適合率が大きいほど、候補画像にセグメントディスプレイが含まれる可能性が高い。
判定部15は、適合率を予め設定された閾値と比較する。適合率が閾値以上である場合、判定部15は、その候補画像がセグメントディスプレイの画像であると判定し、読取部16に出力する。候補画像が複数存在する場合、判定部15は、それぞれの候補画像に対して、適合率の算出及び判定を行う。
判定部15は、具体的には、二値化部15a、論理演算部15b、適合率算出部15c、及び比較部15dを有する。
二値化部15aは、候補画像を二値化する。論理演算部15bは、二値画像とマスクとの論理積を計算する。論理積から得られた処理画像では、マスクにおいて白色で表され、且つ二値画像において白色で表されている領域のみが、白色で表される。
適合率算出部15cは、処理画像に対する二値画像の一致率を適合率として算出する。すなわち、処理画像において白色で表された領域の面積A1(白色で表されたピクセル数)に対する、二値画像において白色で表された領域の面積A2の割合(A2/A1)が、適合率として算出される。
比較部15dは、適合率を閾値と比較する。適合率が閾値以上の場合、読取部16に候補画像を出力する。適合率が閾値未満の場合、比較部15dは、その候補画像はセグメントディスプレイの画像では無いと判定し、例えば処理を終了する。
読取部16は、入力された候補画像から、セグメントディスプレイに表示された数値を読み取る。例えば、読取部16は、入力された候補画像から数字を切り出し、点灯しているセグメントを検出することで、数値を読み取る。読取部16は、例えば、読み取った数値を、モニタに表示させたり、データベースに出力したりする。
記憶部18は、読取システム1の処理に必要な情報や、処理の過程で生成されたデータを記憶する。例えば、記憶部18には、上述したマスクの他、判定が行われる際に比較される閾値等が記憶される。
図2及び図3を参照して、実施形態に係る読取システム1の動作について説明する。
図2は、実施形態に係る読取システムの動作を表すフローチャートである。
図3は、実施形態に係る読取システムにおける処理を例示する図である。
撮像部11は、セグメントディスプレイを撮影し、画像を取得する(図2のステップS11)。加工部12aは、入力画像を加工する(ステップS12a)。これにより、入力画像を縮小してグレイスケール化した加工画像と、入力画像をグレイスケール化のみした原寸画像と、が生成される。図3(a)は、加工画像の一例である。二値化部12bは、加工画像を二値化し、図3(b)に表したように、二値画像を生成する(ステップS12b)。輪郭抽出部12cは、二値画像の輪郭を抽出する(ステップS12c)。
第1選定部12dは、輪郭で囲まれた領域を選定する(ステップS12d)。これにより、例えば、図3(c)に表したように、枠Aで囲まれた領域が選定される。四角形抽出部12eは、選定された領域における四角形の抽出結果に基づき、原寸画像から四角形を抽出する(ステップS12e)。第2選定部12fは、抽出された四角形を選定し(ステップS12f)、候補画像として出力する。図3(d)は、候補画像として出力される四角形を表す。
変換部13は、図3(e)に表したように、歪み及び大きさを補正するよう候補画像を変換する。変換部13は、例えば、候補画像を射影変換することで、歪み及びサイズを補正する(ステップS13)。図3(h)は、マスクの例を表す。切出部14は、マスクのサイズに合わせて候補画像の一部を切り出す(ステップS14)。これにより、図3(f)に表した画像が得られる。
二値化部15aは、図3(g)に表したように、切り出された候補画像を二値化する(ステップS15a)。論理演算部15bは、二値画像とマスクの論理積を計算する(ステップS15b)。これにより、図3(i)に表した画像が得られる。適合率算出部15cは、図3(g)と図3(i)の画像を用いて、適合率を算出する(ステップS15c)。比較部15dは、適合率を予め設定された閾値と比較する(ステップS15d)。適合率が閾値以上の場合、読取部16は、その候補画像から、セグメントディスプレイの数値を読み取る(ステップS16)。
判定部15は、ステップS15a〜S15dが未だ行われていない、他の候補画像が無いか判定する(ステップS17)。他の候補画像がある場合、その候補画像について、ステップS15aが行われる。他の候補画像がない場合、処理を終了する。
実施形態の効果を説明する。
セグメントディスプレイを読み取る際には、上述したように、入力画像の中から、セグメントディスプレイが撮影された部分の候補となる候補画像が抽出される。従来は、例えば、抽出された候補画像に対して歪みなどの補正を適宜行い、候補画像からセグメントディスプレイの数値を読み取っていた。
しかし、候補画像には。例えば、セグメントディスプレイに似た表示器が含まれる場合がある。この場合、別の表示器の数値をセグメントディスプレイの数値として読み取ってしまい、誤検出が生じる可能性がある。
実施形態に係る読取システム1は、このような誤検出を抑制するために、判定部15を備える。判定部15は、候補画像と予め設定されたマスクとを用いて、候補画像にセグメントディスプレイが含まれる確度を示す適合率を算出する。そして、判定部15は、この適合率が予め設定された閾値以上である場合に、候補画像をセグメントディスプレイの画像であると判定する。
このような判定が行われることで、セグメントディスプレイである可能性がより高い候補画像に対してのみ読み取りを行うことができる。特に本実施形態では、読み取り対象のセグメントディスプレイに対応するマスクを予め用意しておき、このマスクを用いて候補画像の絞り込みを行う。このため、セグメントディスプレイに似た表示器や、別のセグメントディスプレイが入力画像に含まれる場合でも、読み取り対象のセグメントディスプレイのみをより精度良く選定でき、誤検出の可能性を大きく低減できる。
なお、図1に表した例では、実施形態に係る読取システム1が撮像部11を備えているが、読取システム1は撮像部11を備えていなくても良い。例えば、他の撮像装置で撮影された画像が読取システム1へ入力され、その入力画像から読取システム1によってセグメントディスプレイの数値が読み取られても良い。
また、読取システム1は、変換部13及び切出部14を備えていなくても良いが、読取の精度を向上させるためには、これらの構成を備えていることが望ましい。
例えば、変換部13により候補画像の歪みが補正されることで、適合率の精度を向上させることができる。これにより、セグメントディスプレイが撮影された候補画像をより正確に選別できるようになる。
切出部14により、マスクを用いて候補画像の一部が切り出されることで、読み取り対象以外の被写体を候補画像から除外できる。これにより、適合率の精度を向上させることができる。
なお、上述した説明では、変換部13は、第1処理において、候補画像が歪んでいると判定された場合に、候補画像の歪みを補正していた。この方法に代えて、変換部13は、第1処理において、候補画像が歪んでいると判定された場合に、候補画像の歪みに合わせて、マスクを歪ませても良い。この場合も、その後の判定部15による処理において、適合率の精度を向上させることができる。
また、図3では、7セグメントディスプレイに対応したマスクを用いて、7セグメントディスプレイに表示された数値を読み取る例を示した。しかし、実施形態に係る読取システム1で読み取り可能なセグメントディスプレイは、7セグメントディスプレイに限定されない。読み取り対象のセグメントディスプレイは、14セグメントディスプレイまたは16セグメントディスプレイであっても良い。
マスクとしては、複数のセグメントの少なくとも一部が点灯した、セグメントディスプレイの画像が用いられる。より望ましくは、全てのセグメントが点灯したセグメントディスプレイの二値画像がマスクとして用いられる。このようにすることで、読み取り対象のセグメントディスプレイの表示情報によらず、より精度良く、セグメントディスプレイが撮影された候補画像を選定できるようにしている。
なお、マスクとして、全てのセグメントが点灯した二値画像を用いる場合、セグメントが増えるほど、マスクにおける白色領域の面積が増加する。例えば、候補画像にノイズが多く含まれ、ノイズによる白色領域が多い場合は、候補画像がセグメントディスプレイを含まないにも拘わらず、候補画像とマスクとの適合率が高くなる可能性がある。このため、適合率と比較する閾値は、読み取るセグメントディスプレイにおけるセグメント数に応じて調整されることが望ましい。
例えば、7セグメントディスプレイの数値を読み取る場合、閾値を0.6以上とすることで、7セグメントディスプレイが写された候補画像を、より精度良く選別できる。
また、閾値が高いと、候補画像に7セグメントディスプレイが写されていても、7セグメントディスプレイの画像では無いと判定される可能性が高くなる。このため、閾値は0.8以下であることが望ましい。
すなわち、7セグメントディスプレイの数値を読み取る場合、閾値を0.6以上、0.8以下とすることで、数値の読み取りの精度を向上できる。
また、抽出部12における処理は、候補画像を抽出できれば、適宜変更可能である。例えば、入力画像のサイズが小さい場合、または入力画像が予め二値化されている場合などは、加工部12aまたは二値化部12bは不要である。また、入力画像から候補画像を抽出するための処理も適宜変更可能である。これらの変形例について、以下で説明する。
(第1変形例)
図4は、実施形態の第1変形例に係る読取システムの構成を表すブロック図である。
図1〜図3の例では、セグメントディスプレイの表示領域の枠が四角形であった。そのため、当該表示領域の形状に合わせて、抽出部12には、四角形抽出部12eが設けられていた。
表示領域の枠が円形の場合には、図4に表した読取システム2のように、抽出部12において、四角形抽出部12eに代えて、楕円抽出部12gが設けられる。楕円抽出部12gは、第1選定部12dによって選定された領域から楕円を抽出する。このとき、楕円抽出部12gは、抽出された楕円の座標を取得する。楕円抽出部12gは、原寸画像において、上記座標に対応する楕円の画像を抽出し、第2選定部12fに出力する。
第2選定部12fは、入力された楕円の画像を予め設定された条件と比較し、条件に適合する楕円を選定する。条件としては、例えば、楕円の扁平率、輝度の分布などが用いられる。第2選定部12fは、選定された楕円の画像を候補画像として変換部13に出力する。以降の処理は、図1〜図3で説明した例と同様である。すなわち、変換部13は、候補画像の歪みを補正し、切出部14は、候補画像の一部を切り出す。そして、判定部15による判定を経て、読取部16によってセグメントディスプレイの数値が読み取られる。
なお、一般的に、セグメントディスプレイの数値は、所定の方向に並んで配列されている。従って、セグメントディスプレイの表示領域の枠が円または楕円の場合でも、一般的に、セグメントディスプレイに表示される数値は、四角形に収まる。すなわち、表示領域の枠が円または楕円の場合でも、マスクの外形は、四角形に設定される。マスクの外形を四角形にすることで、マスクの全面積に対して数値が表示される面積の割合を高めることができる。この結果、候補画像におけるノイズ等が適合率に与える影響を低減でき、適合率の精度を向上させることができる。
(第2変形例)
図5は、実施形態の第2変形例に係る読取システムの構成を表すブロック図である。
図5に表した読取システム3は、読取システム1との比較において、抽出部12、変換部13、及び切出部14に代えて、抽出部21を備える。
読取システム3では、セグメントディスプレイの数値を読み取る前に、撮像部11により、読み取り対象のセグメントディスプレイのみを正面から撮影する。ここでは、セグメントディスプレイのみを正面から撮影した画像を、テンプレート画像と呼ぶ。
抽出部21は、特徴量抽出部21a、マッチング部21b、変換部21c、及び探索部21dを有する。
特徴量抽出部21aは、入力画像の特徴量を抽出する。また、特徴量抽出部21aは、記憶部18に記憶されたテンプレート画像を参照し、テンプレート画像の特徴量を抽出する。あるいは、予め、特徴量抽出部21aによって、テンプレート画像の特徴量が抽出されて記憶部18に記憶されていても良い。この場合、特徴量抽出部21aは、記憶部18に記憶されたテンプレート画像の特徴量を参照する。特徴量抽出部21aは、入力画像の特徴量及びテンプレート画像の特徴量を、マッチング部21bに出力する。
マッチング部21bは、入力画像の特徴量を、テンプレート画像の特徴量とマッチングさせるために必要な、入力画像の補正量を算出する。例えば、マッチング部21bは、入力画像において歪んでいるセグメントディスプレイを、正面から撮影された画像に近づけるために必要な補正量を算出する。マッチング部21bは、算出した補正量及び入力画像を、変換部13に出力する。
なお、特徴量同士をマッチング出来ない場合は、入力画像にセグメントディスプレイが含まれていない可能性が高い。従って、この場合、例えば、補正量を算出せずに処理を終了する。
変換部21cは、入力された補正量に基づき、入力画像を変換する。これにより、入力画像がテンプレート画像に対して歪んでいる場合には、その歪みが補正される。
探索部21dは、記憶部18に記憶されたテンプレート画像を参照する。そして、探索部21dは、入力画像から、テンプレート画像とマッチングする部分を探索する。探索部21dは、マッチングした部分を、候補画像として判定部15に出力する。
以降の判定部15及び読取部16における処理は、図1に表した読取システム1と同様である。
なお、特徴量抽出部21aによる特徴量の抽出は、例えば、KAZE、AKAZE(Accelerated KAZE)、またはSIFT(Scale-invariant feature transform)などを用いて行われる。マッチング部21bにおけるマッチングは、例えば、KNN(K Nearest Neighbor)、またはFLANN(Fast Library for Approximate Nearest Neighbors)などを用いて行われる。探索部21dによる探索は、例えば、画像間の類似度に基づくパターンマッチングを用いて行われる。
例えば、ある平面上に複数のセグメントディスプレイが設けられており、これらのセグメントディスプレイを撮影した場合、入力画像において、それらのセグメントディスプレイは同じ様に歪む。本変形例に係る読取システム3では、特徴量を用いた入力画像の変換、及びテンプレート画像を用いたマッチングが行われる。すなわち、入力画像の全領域を変換する。このため、それぞれの候補画像について歪みを補正していく必要が無く、同一平面上に複数のセグメントディスプレイが存在する場合等に、読取システム1に比べて処理を高速化できる。
(第3変形例)
図6は、実施形態の第3変形例に係る読取システムの構成を表すブロック図である。
図6に表した読取システム4は、読取システム1との比較において、抽出部12、変換部13、及び切出部14に代えて抽出部31を備える。抽出部31は、学習部31a、入力部31b、検出部31c、及び処理部31dを有する。
読取システム4では、ニューラルネットワークを用いて、入力画像からセグメントディスプレイが撮影された候補画像が抽出される。例えば、抽出部31には、事前に、教師データが入力され、ニューラルネットワークの学習が行われる。教師データは、例えば、セグメントディスプレイを含む歪んだ画像と、その画像においてセグメントディスプレイの位置を示すデータと、その画像の歪み量と、を含む。
学習部31aは、画像データが入力された際に、セグメントディスプレイが撮影された部分のデータに対してニューロンが反応(発火)し、且つ、その画像の歪み量に対応するニューロンが反応するよう、ニューラルネットワークを学習させる。学習部31aは、学習させたニューラルネットワークを記憶部18に記憶する。なお、学習部31aによる上記学習は、判定部15や読取部16による処理が実行される処理装置で行われても良いし、これとは異なる別の処理装置を用いて行われても良い。上記学習には、好ましくは、より高速な演算性能を有する処理装置が用いられる。
その後、撮像部11により、セグメントディスプレイの数値を読み取るために画像が取得され、画像が抽出部31に入力される。画像が入力されると、入力部31bは、記憶部18に記憶された学習済みのニューラルネットワークを参照する。そして、入力部31bは、このニューラルネットワークに、画像のデータを入力する。
ニューラルネットワークに画像データが入力されている間、ニューロンの反応があると、検出部31cはその反応を検出する。そして、検出部31cは、ニューロンが反応した画像の座標及び歪み量を検出し、処理部31dに出力する。
処理部31dは、入力された座標に基づき、入力画像から候補画像を抽出する。また、処理部31dは、入力された歪み量に基づいて、候補画像の歪みを補正する。処理部31dは、補正された候補画像を判定部15に出力する。
なお、候補画像の抽出と、歪みの補正と、が行われる順序は、適宜変更できる。例えば、処理部31dにおいて、入力画像の歪みが補正された後に、候補画像が抽出されても良い。
以降の判定部15及び読取部16における処理は、図1に表した読取システム1と同様である。
本変形例に係る読取システム3では、ニューラルネットワークを用いて画像の切り出しや補正を行う。このため、セグメントディスプレイの表示領域とその外枠とのコントラスト比が大きくなく、2値化画像から輪郭を抽出しにくい場合にも、より高精度に候補画像を抽出できる。従って、読取システム1に比べて、入力画像中のセグメントディスプレイの数値を、より高精度に読み取ることが可能となる。
図7は、実施形態に係る読取システムを実現するためのハードウェア構成を表すブロック図である。
例えば、実施形態に係る読取システムは、図7に表した読取装置5及び撮像装置6から構成される。読取装置5は、例えばコンピュータであり、ROM(Read Only Memory)51、RAM(Random Access Memory)52、CPU(Central Processing Unit)53、およびHDD(Hard Disk Drive)54を有する。
ROM51は、コンピュータの動作を制御するプログラムを格納している。ROM51には、コンピュータを、上述した実施形態における、抽出部、変換部、切出部、判定部、読取部、探索部などとして機能させるために必要なプログラムが格納されている。
RAM52は、ROM51に格納されたプログラムが展開される記憶領域として機能する。CPU53は、ROM51に格納された制御プログラムを読み込み、当該制御プログラムに従ってコンピュータの動作を制御する。また、CPU53は、コンピュータの動作によって得られた様々なデータをRAM52に展開する。HDD54は、上述した実施形態における記憶部18として機能し、読み取りに必要な情報や、読み取りの過程で得られた情報を記憶する。
読取装置5を用いて、ニューラルネットワークを利用した処理システム4を実現させる場合、読取装置5は、さらに、GPU(Graphics Processing Unit)や、ニューラルネットワークの処理に特化した専用チップを有していても良い。また、読取装置5は、HDD54に代えて、eMMC(embedded Multi Media Card)、SSD(Solid State Drive)、SSHD(Solid State Hybrid Drive)などを有していても良い。
撮像装置6は、被写体(セグメントディスプレイ)を撮影し、取得した画像を読取装置5へ送信する。撮像装置6は、例えば、カメラである。
出力装置7は、読取装置5から出力されたデータ(読み取られたセグメントディスプレイの数値)を、ユーザが認識できるように出力する。出力装置7は、例えば、モニタ、プリンタ、またはスピーカなどである。
読取装置5、撮像装置6、及び出力装置7は、例えば、有線又は無線で相互に接続される。または、これらはネットワークを介して相互に接続されていても良い。あるいは、読取装置5、撮像装置6、及び出力装置7の少なくとも2つが、1つの装置に組み込まれていても良い。例えば、読取装置5が、撮像装置6の画像処理部などと一体に組み込まれていても良い。
以上で説明した実施形態に係る読取システム及び読取方法を用いることで、セグメントディスプレイに表示された数値を、より高精度に読み取ることが可能となる。同様に、コンピュータを、読取システムとして動作させるためのプログラムを用いることで、セグメントディスプレイに表示された数値を、より高精度にコンピュータに読み取らせることが可能となる。
以上、本発明のいくつかの実施形態を例示したが、これらの実施形態は、例として提示したものであり、発明の範囲を限定することは意図していない。これら新規な実施形態は、その他の様々な形態で実施されることが可能であり、発明の要旨を逸脱しない範囲で、種々の省略、置き換え、変更などを行うことができる。これら実施形態やその変形例は、発明の範囲や要旨に含まれるとともに、特許請求の範囲に記載された発明とその均等の範囲に含まれる。また、前述の各実施形態は、相互に組み合わせて実施することができる。
1〜4 読取システム、 5 読取装置、 6 撮像装置、 7 出力装置、 11 撮像部、 12、21、31 抽出部、 13 変換部、 14 切出部、 15 判定部、 16 読取部、 18 記憶部

Claims (15)

  1. 入力画像からセグメントディスプレイが撮影された部分の候補となる候補画像を抽出する抽出部と、
    前記候補画像と予め設定されたマスクとを用いて、前記候補画像にセグメントディスプレイが含まれる確度を示す適合率を算出し、前記適合率が予め設定された閾値以上である場合に、前記候補画像をセグメントディスプレイの画像であると判定する判定部と、
    セグメントディスプレイの画像と判定された前記候補画像から、セグメントディスプレイに表示された数値を読み取る読取部と、
    を備えた読取システム。
  2. 前記マスクは、全てのセグメントが点灯したセグメントディスプレイの画像である請求項1記載の読取システム。
  3. 前記候補画像が歪んでいる場合に、前記候補画像を正面から撮影された画像に近づけるよう変換する第1処理と、
    前記候補画像のサイズが、予め設定された規定サイズと異なる場合に、前記候補画像の前記サイズを前記規定サイズに近づけるよう補正する第2処理と、
    を行う変換部をさらに備え、
    前記判定部は、変換された前記候補画像と前記マスクとを用いて前記適合率を算出する請求項1または2に記載の読取システム。
  4. 前記候補画像が歪んでいる場合に、前記候補画像の歪みに合わせて前記マスクを歪ませる第1処理と、
    前記候補画像のサイズが予め設定された規定サイズと異なる場合に、前記候補画像の前記サイズを前記規定サイズに近づけるよう補正する第2処理と、
    を行う変換部をさらに備え、
    前記判定部は、変換された前記候補画像と歪ませた前記マスクとを用いて前記適合率を算出する請求項1または2に記載の読取システム。
  5. 前記マスクの大きさ及び形状に基づいて、前記候補画像の一部を切り出す切出部をさらに備え、
    前記判定部は、切り出された前記候補画像を用いて前記適合率を算出する請求項1〜4のいずれか1つに記載の読取システム。
  6. 前記抽出部は、
    前記入力画像から輪郭を抽出し、
    前記輪郭で囲まれた領域の面積を算出し、
    前記面積が予め設定された閾値以上の場合、前記輪郭に基づいて、前記入力画像から所定の形状の画像を抽出し、
    予め設定された条件を満たす前記抽出された画像を、前記候補画像として出力する、
    請求項1〜5のいずれか1つに記載の読取システム。
  7. 前記抽出部は、前記入力画像から、予め用意された、読み取り対象のセグメントディスプレイのテンプレート画像とマッチングする部分を探索し、マッチングした前記部分を候補画像として抽出する請求項1または2に記載の読取システム。
  8. 前記抽出部は、
    前記入力画像から特徴量を抽出し、
    抽出された前記特徴量が、前記テンプレート画像の特徴量とマッチングするように、前記入力画像を補正し、
    補正された前記入力画像から、前記テンプレート画像とマッチングする前記候補画像を抽出する、
    請求項7記載の読取システム。
  9. 前記抽出部は、
    前記入力画像のデータを、予め学習されたニューラルネットワークに入力し、
    前記ニューラルネットワークの出力結果に基づいて、前記入力画像においてセグメントディスプレイが撮影された前記部分を検出し、前記候補画像として抽出する、
    請求項1または2に記載の読取システム。
  10. 前記抽出部は、前記ニューラルネットワークの前記出力結果に基づいて、さらに、前記候補画像の歪みを補正する請求項9記載の読取システム。
  11. 前記判定部は、
    前記候補画像を二値化し、
    二値化された前記候補画像と前記マスクとを重ね合わせて論理積を計算し、
    前記論理積から得られた画像と前記候補画像との一致率を前記適合率として算出する、
    請求項1〜10のいずれか1つに記載の読取システム。
  12. 前記マスクは、7セグメントディスプレイの二値画像であり、
    前記閾値は、0.6以上に設定される請求項1〜11のいずれか1つに記載の読取システム。
  13. 入力画像からセグメントディスプレイが撮影された部分の候補となる候補画像を抽出し、
    前記候補画像と予め設定されたマスクとを用いて、前記候補画像にセグメントディスプレイが含まれる確度を示す適合率を算出し、前記適合率が予め設定された閾値以上である場合に、前記候補画像をセグメントディスプレイの画像であると判定し、
    セグメントディスプレイの画像と判定された前記候補画像から、セグメントディスプレイに表示された数値を読み取る、読取方法。
  14. コンピュータに、
    入力画像からセグメントディスプレイが撮影された部分の候補となる候補画像を抽出させ、
    前記候補画像と予め設定されたマスクとを用いて、前記候補画像にセグメントディスプレイが含まれる確度を示す適合率を算出させ、前記適合率が予め設定された閾値以上である場合に、前記候補画像をセグメントディスプレイの画像であると判定させ、
    セグメントディスプレイの画像と判定された前記候補画像から、セグメントディスプレイに表示された数値を読み取らせる、
    プログラム。
  15. 請求項14のプログラムを記憶した記憶媒体。
JP2018026476A 2018-02-16 2018-02-16 読取システム、読取方法、プログラム、及び記憶媒体 Active JP6542406B1 (ja)

Priority Applications (5)

Application Number Priority Date Filing Date Title
JP2018026476A JP6542406B1 (ja) 2018-02-16 2018-02-16 読取システム、読取方法、プログラム、及び記憶媒体
CN201880088145.8A CN111656397B (zh) 2018-02-16 2018-09-25 读取系统、读取方法以及存储介质
PCT/JP2018/035334 WO2019159414A1 (ja) 2018-02-16 2018-09-25 読取システム、読取方法、及び記憶媒体
US16/925,390 US11455787B2 (en) 2018-02-16 2020-07-10 Reading system, reading device, reading method, and storage medium
US17/893,351 US11900664B2 (en) 2018-02-16 2022-08-23 Reading system, reading device, reading method, and storage medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2018026476A JP6542406B1 (ja) 2018-02-16 2018-02-16 読取システム、読取方法、プログラム、及び記憶媒体

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2019108678A Division JP6656453B2 (ja) 2019-06-11 2019-06-11 読取システム、読取装置、プログラム、及び記憶媒体

Publications (2)

Publication Number Publication Date
JP6542406B1 true JP6542406B1 (ja) 2019-07-10
JP2019144703A JP2019144703A (ja) 2019-08-29

Family

ID=67212229

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018026476A Active JP6542406B1 (ja) 2018-02-16 2018-02-16 読取システム、読取方法、プログラム、及び記憶媒体

Country Status (4)

Country Link
US (2) US11455787B2 (ja)
JP (1) JP6542406B1 (ja)
CN (1) CN111656397B (ja)
WO (1) WO2019159414A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2021022155A (ja) * 2019-07-26 2021-02-18 株式会社ミツトヨ デジタル表示読取装置及びプログラム

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6542406B1 (ja) * 2018-02-16 2019-07-10 株式会社東芝 読取システム、読取方法、プログラム、及び記憶媒体
JP6868057B2 (ja) * 2019-05-27 2021-05-12 株式会社東芝 読取システム、読取方法、プログラム、記憶媒体、及び移動体

Family Cites Families (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1074240A (ja) * 1996-08-30 1998-03-17 Fujitsu Ltd 文字位置検出方法
JPH11316794A (ja) * 1998-05-06 1999-11-16 Aisin Aw Seimitsu Kk セグメント情報読み取り判定方法
US7164431B1 (en) * 2001-05-08 2007-01-16 Pixelworks, Inc. System and method for mixing graphics and text in an on-screen display application
JP4670434B2 (ja) * 2005-03-31 2011-04-13 富士電機システムズ株式会社 メータの指示値読取システム
JP3998215B1 (ja) 2007-03-29 2007-10-24 国立大学法人山口大学 画像処理装置、画像処理方法及び画像処理プログラム
JP5658873B2 (ja) * 2009-11-13 2015-01-28 オリンパス株式会社 画像処理装置、電子機器、内視鏡システム及びプログラム
JP5530752B2 (ja) * 2010-02-25 2014-06-25 日本システムウエア株式会社 計器読み取り装置、方法、プログラム、および該ソフトウェアを格納したコンピュータ可読媒体
EP2740114B1 (en) * 2011-08-01 2018-09-12 Greenwave Systems PTE. LTD. Multiple and interchangeable meter reading probes
JP6260620B2 (ja) * 2013-06-17 2018-01-17 富士通株式会社 画像処理装置、画像処理方法、及び画像処理プログラム
JP6336406B2 (ja) * 2015-03-11 2018-06-06 富士フイルム株式会社 画像合成装置,画像合成方法ならびに画像合成プログラムおよびそのプログラムを格納した記録媒体
JP5997808B1 (ja) 2015-06-18 2016-09-28 株式会社Pfu 画像処理装置、日付識別装置、画像処理方法、および、プログラム
US10408647B2 (en) * 2016-02-15 2019-09-10 Olea Networks, Inc. Analysis of pipe systems with sensor devices
CN108062076B (zh) 2016-11-09 2020-10-27 株式会社东芝 数据收集系统、处理系统以及存储介质
US10198671B1 (en) * 2016-11-10 2019-02-05 Snap Inc. Dense captioning with joint interference and visual context
US10775871B2 (en) 2016-11-10 2020-09-15 Apple Inc. Methods and apparatus for providing individualized power control for peripheral sub-systems
EP3654244A4 (en) * 2017-07-31 2020-11-04 Shanghai United Imaging Healthcare Co., Ltd. METHOD AND SYSTEM FOR EXTRACTING A REGION OF INTEREST FROM VOLUME DATA
US10169679B1 (en) * 2017-10-13 2019-01-01 StradVision, Inc. Learning method and learning device for adjusting parameters of CNN by using loss augmentation and testing method and testing device using the same
JP6542406B1 (ja) * 2018-02-16 2019-07-10 株式会社東芝 読取システム、読取方法、プログラム、及び記憶媒体

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2021022155A (ja) * 2019-07-26 2021-02-18 株式会社ミツトヨ デジタル表示読取装置及びプログラム
JP7290498B2 (ja) 2019-07-26 2023-06-13 株式会社ミツトヨ デジタル表示読取装置及びプログラム

Also Published As

Publication number Publication date
CN111656397B (zh) 2023-11-03
JP2019144703A (ja) 2019-08-29
CN111656397A (zh) 2020-09-11
US20200342251A1 (en) 2020-10-29
US11900664B2 (en) 2024-02-13
US20220398824A1 (en) 2022-12-15
WO2019159414A1 (ja) 2019-08-22
US11455787B2 (en) 2022-09-27

Similar Documents

Publication Publication Date Title
WO2016054802A1 (en) Hierarchical interlinked multi-scale convolutional network for image parsing
CN105303156B (zh) 字符检测装置、方法及程序
US11900664B2 (en) Reading system, reading device, reading method, and storage medium
US11386640B2 (en) Reading system, reading method, and storage medium
CN112041906B (zh) 读取系统、读取方法、程序以及存储介质
JP6110174B2 (ja) 画像検出装置及び制御プログラム並びに画像検出方法
JP2019212157A (ja) 商品特定装置、プログラム及び学習方法
JP5027201B2 (ja) テロップ文字領域検出方法,テロップ文字領域検出装置およびテロップ文字領域検出プログラム
JP6656453B2 (ja) 読取システム、読取装置、プログラム、及び記憶媒体
JP6542407B1 (ja) 読取システム、読取方法、プログラム、及び記憶媒体
US11954865B2 (en) Image processing apparatus, image processing method, and storage medium for foreground extraction
JP6684947B2 (ja) 読取システム、読取装置、プログラム、及び記憶媒体
JP6276504B2 (ja) 画像検出装置及び制御プログラム並びに画像検出方法
JP6175904B2 (ja) 照合対象抽出システム、照合対象抽出方法、照合対象抽出プログラム
JP2019145182A5 (ja) 読取システム、読取装置、プログラム、及び記憶媒体
JP6148426B1 (ja) 画像処理装置、画像処理方法及び画像処理プログラム
JP6121768B2 (ja) 画像検出装置及び制御プログラム並びに画像検出方法
US20220284690A1 (en) Reading system, reading method, and storage medium
KR20210096817A (ko) 얼굴 식별 방법, 및 이를 이용하는 장치 및 프로그램
JP2005339398A (ja) 特徴抽出装置、特徴抽出方法、および、プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20190218

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20190218

A975 Report on accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A971005

Effective date: 20190225

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20190515

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20190612

R151 Written notification of patent or utility model registration

Ref document number: 6542406

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151