JP5554654B2 - 画像処理方法、携帯情報端末及びプログラム - Google Patents

画像処理方法、携帯情報端末及びプログラム Download PDF

Info

Publication number
JP5554654B2
JP5554654B2 JP2010159147A JP2010159147A JP5554654B2 JP 5554654 B2 JP5554654 B2 JP 5554654B2 JP 2010159147 A JP2010159147 A JP 2010159147A JP 2010159147 A JP2010159147 A JP 2010159147A JP 5554654 B2 JP5554654 B2 JP 5554654B2
Authority
JP
Japan
Prior art keywords
model
image
unit
angle
character
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2010159147A
Other languages
English (en)
Other versions
JP2012022474A (ja
Inventor
英生 鈴木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Electronics Inc
Original Assignee
Canon Electronics Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Electronics Inc filed Critical Canon Electronics Inc
Priority to JP2010159147A priority Critical patent/JP5554654B2/ja
Publication of JP2012022474A publication Critical patent/JP2012022474A/ja
Application granted granted Critical
Publication of JP5554654B2 publication Critical patent/JP5554654B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Character Input (AREA)
  • Studio Devices (AREA)

Description

本発明は文字認識機能を備えた画像処理方法、携帯情報端末及びプログラムに関する。
近年、撮像機能を備える携帯情報端末が多く流通している。そのため、カメラ機能による画像認識を応用した業務効率化の提案がされるようになった。
水道、ガス等の検針市場においては、メーターなどの数値入力にカメラ機能を使用して、文字認識による数値入力の自動化を行う試みがなされている。
学習したテンプレートを利用して、輪郭から3次元的な姿勢と平面内の回転角度を算出し3次元的な傾斜による歪みの補正と平面内の回転を補正し出力する特許文献1が知られる。
特許文献2に記されるように、ナンバープレートの文字認識では、撮影対象と撮影装置の撮影条件が既知の場合において、鉛直方向の角度と水平方向の角度が定まる。そのため撮像装置の設置条件のパラメータである鉛直方向の角度と水平方向の角度を補正し認識精度を向上させることが記されている。
特開平11−306282号公報 特開平06−274788号公報
上述した特許文献1では、携帯情報端末に応用するには撮影され得る角度で学習処理を行わなければならず手間がかかってしまう。特許文献2では、撮影条件の距離、角度が予め設置条件のパラメータとして決まっているものに対して認識精度を向上させるものであるため本体の移動のたびにパラメータの設定を変更する必要がある。
携帯情報端末等のカメラを用いる場合には、手持ちによる撮影角度のずれや、立ち位置により認識対象の写り方が変化するため、撮影画像から認識すべき領域を検知できず、文字認識が良好に行えないことがあった。
そのため本発明は、カメラが移動するような場合であっても撮影画像から認識対象の検出精度を向上させ文字認識を行いやすくした画像処理方法、画像処理方法を利用した携帯情報端末及びプログラムを提供することを目的とする。
上記の課題を解決するために、予め記憶している3Dモデルに対応した認識対象を含む画像をカメラで撮影し撮影画像を得る撮像工程と、前記撮像工程における前記カメラの重力に対する傾き角度を取得する角度取得工程と、前記3Dモデルを前記傾き角度に基づいた回転と鉛直軸周りに対応する回転方向の複数の値へ回転をさせる3Dモデル回転工程と、回転された前記3Dモデルから比較画像群を作成する作成工程と、前記撮影画像と前記比較画像群の一致検出を行い、前記撮影画像に写った前記認識対象の前記カメラに対する傾きを決定する一致検出工程と、一致検出した前記撮影画像に含まれる前記認識対象の文字領域を文字認識する文字認識工程とを有する画像処理方法を用いる。
また、上記の課題を解決するための携帯情報端末として、認識対象に対応した3Dモデルの情報を保持する3Dモデル保持部と前記認識対象を含む画像を撮影画像として得るカメラ部と、前記撮影画像を得た際の前記カメラの重力に対する傾き角度を取得する角度取得部と、前記3Dモデルを前記傾き角度に基づいた回転と鉛直軸周りに対応する回転方向の複数の値へ回転をさせる3Dモデル回転部と、回転された前記3Dモデルから比較画像群を作成する比較画像群作成部と、前記撮影画像と前記比較画像群の一致検出を行い、前記撮影画像に写った前記認識対象の前記カメラに対する傾きを決定する一致検出部と、一致検出した前記撮影画像に含まれる前記認識対象の文字領域を文字認識する文字認識部とを有する携帯情報端末。を使用することで解決する。
また、上記の課題を解決するためのプログラムとして、携帯情報端末のコンピュータを動作させるプログラムであって、予め記憶している3Dモデルに対応した認識対象を含む画像をカメラで撮影し撮影画像を得る撮像工程と、前記撮像工程における前記カメラの重力に対する傾き角度を取得する角度取得工程と、前記3Dモデルを前記傾き角度に基づいた回転と回転鉛直軸周りに対応する回転方向の複数の値へ回転させる3Dモデル回転工程と、回転された前記3Dモデルから比較画像群を作成する比較画像群作成工程と、前記撮影画像と前記比較画像群の一致検出を行い、前記撮影画像に写った前記認識対象の前記カメラに対する傾きを決定する一致検出工程と、一致検出した前記撮影画像に含まれる前記認識対象の文字領域を文字認識する文字認識工程とを有するプログラムを使用することで解決する。
本発明により、認識対象が予め定まっている場合に、手持ちによる認識対象とカメラ部の撮影角のずれや立ち位置による影響を抑え、認識対象の検出精度を向上させ適切な文字認識を行うことができる。また全ての角度について3Dモデルを回転させる場合に比べて、画像処理の負荷を減らすことができる。
本発明の携帯情報端末により、認識対象が予め定まっている場合に携帯情報端末のカメラを利用した手持ちによる撮影画像から認識対象に含まれる文字領域に適切な文字認識を行うことができる。
本発明の検針用の携帯情報端末は、認識対象が特定の型番のメーターであるため携帯情報端末のカメラを利用した手持ちによる撮影画像から認識対象に含まれる文字領域に適切な文字認識を行うことができ、適切な印刷出力を行うことができる。そのため検針業務の手間を減少させることができる。
本発明のプログラムにより、認識対象が予め定まっている場合に携帯情報端末のカメラを利用した手持ちによる撮影画像から認識対象に含まれる文字領域に適切な文字認識を行うことができる。
本発明の実施の形態に係る画像処理に関するフローチャート。 本発明の実施の形態に係る携帯情報端末100の構成の画像処理に関する構成図。 本発明の実施の形態に係る携帯情報端末100のハードウェア構成図。 (a)携帯情報端末100の正面図、(b)携帯情報端末100の背面図。 認識対象の一例であるメーター201。 カメラ部101をメーター201に対してθ度傾けた状態を横から見た時の、角度取得部102にかかる重力加速度gを示した図。 カメラ部101をメーター201に対して左右方向にγ度傾けた状態を背後から見た時の、角度取得部102にかかる重力加速度gを示した模式図。 1軸周りの角度εを3軸加速度センサーでは検出できないことを示した図。 一致検出における処理のモデル図。 最一致画像604における文字領域の範囲を示す座標を表した図。 画像切り出し処理を示したモデル図。 歪み補正の処理のモデル図。 に実施例1における処理のフローチャート。
以下に本発明の実施形態を、図面を参照して説明する。図1に本発明の実施の形態に係るフローチャートを示す。説明は後述する。
図2は本発明の実施形態に係る携帯情報端末100の構成の画像処理に関する構成図である。図2において、メモリ部110内の各部は画像処理に関するメモリ部110の本発明に関連する要素であり、画像処理部120内の各部は画像処理部120の本発明に関連する要素を表す。
角度取得部102は、カメラ部101が撮影した瞬間の重力加速度により認識対象とカメラ部101との取得可能な傾き角度を取得する。角度取得部102は本発明の実施形態では3軸加速度センサーが使用されるものとするが、カメラ部101の認識対象に対する傾き角度を取得できるものであれば、3軸加速度センサーに限らず、ジャイロスコープなどで代替してもよい。
3Dモデル保持部112は、メモリ部110の記憶領域内に存在する。3Dモデルとは認識対象を製造するために使われた設計情報や認識対象の外形や文字領域などを認識するために必要な特徴のある代表的な点を三次元上の点で表し、それら三次元の点を結んだベクトルデータで表した情報を用いる。
図3は本発明の実施の形態に係る携帯情報端末100のハードウェア構成を示す構成図である。携帯情報端末100は、本発明を適用しうる文字認識機能を備えた携帯情報端末100である。カメラ部101は、携帯情報端末100のカメラ部101で取り込んだ画像を、制御部104に入力する。ビデオアダプタ部106は、携帯情報端末100の各構成の表示装置への入力情報を伝達し、操作入力部103は、携帯情報端末100へ操作者からの入力情報を制御部104に伝達する。
制御部104は、CPUなどで構成される。メモリ部110は、BIOSなどを格納したROM、処理の一時保存を行うRAM、不揮発性記憶媒体であるHDD、小型軽量性に優れたフラッシュメモリや、SSDなどが特に好ましく用いられる。三次元のグラフィック情報を使用する際は、グラフィック専用のメモリを使用してもよいが、GPUをCPU内に格納しているものが好ましい。
メモリ部110は、制御部104の処理に関する様々な記憶を行い、制御部104に対するプログラムの格納や、処理の一時保存などを行う。携帯情報端末100も、通常のパーソナルコンピュータと同様にOSがインストールされている。OSやアプリケーションプログラム(アプリ)もメモリ部110に格納され、必要によって読み出され制御部104によって携帯情報端末100の各機能を動作させている。図1における画像処理部120の処理は、メモリ部110に格納されたアプリを利用して制御部104が行う。撮影角度取得部102は、制御部104からの命令に従い操作入力部103の操作入力によりカメラ部101が撮影画像を取得した際のカメラ部101の地平面に対する角度を記憶しメモリ部110内部の撮影角度保持部113に記憶する。ビデオアダプタ部106で出力される内容は、メモリ部110に格納されているもの、カメラ部101で撮像した画像や各種処理の選択画面などであり各々制御部104により処理し表示を行う。
本発明の実施形態で用いられる認識対象に対応した3Dモデルもメモリ部110の3Dモデル情報保持部112に保存されている。3Dモデルの回転や一致検出、一致検出の判定、画像処理や文字認識も、制御部104が、メモリ部110に格納されたアプリを利用して行う。図2の画像処理部120の機能は、制御部104の演算能力を使用し、メモリ部110の記憶領域を利用して処理を行う。制御部104の処理によるため画像処理部120は、制御部104の一部機能として表している。プリンタ出力部105は、遠隔のプリンタやプリンタ133へ印刷する情報を出力する。また、本実施の形態では、画像処理等についてアプリでの動作を例示したが、専用のハードウェアや画像処理回路を用いることもできる。
図2における撮影画像保持部111、3Dモデル保持部112、角度保持部113、各々の情報は携帯情報端末100に備えられたメモリ部110に記憶される。
図4(a)は本実施の形態に係る携帯情報端末100の正面図であり、図4(b)は携帯情報端末100の背面図である。携帯情報端末100の正面には携帯情報端末100に出力された各種情報を表示する表示部131と携帯情報端末100へ各種入力を行う入力キー132があり、タッチディスプレイを採用している場合は、表示装置と入力装置が張り合わされている。文字認識結果から伝票を出力するプリンタ部133を画面上部に設けている。
携帯情報端末100の背面には、カメラ部101、携帯情報端末100の構成を例示しているが、これら入出力機器がどのような位置関係であってもよく、プリンタ部133が、筐体内でなく無線通信で接続されていてもよい。プリンタ部133を表示部131の上部に配置することで、印刷物は、表示部131の上方へ排紙される。印刷物の印刷面は表示部131との表示面と同じ方向へ排紙される。このため操作者は、表示部131による撮影画像の確認と印刷物の印刷結果の確認を同時に行える。
検針用の携帯情報端末であるハンディーターミナル等では、その場での印刷出力や無線通信による読取データの出力ができることが好ましい。印刷される内容は、文字認識の認識結果を数値として認識し、使用量を計算した請求書などがある。また、認識対象が特定の型番のメーターであって、側面を含む外形の特徴、文字表示部がフォントの定まった数字のみで構成されている場合にさらに認識率の向上が望める。認識対象に使用されているフォントを記憶しておき、数字のみの認識を行う場合、認識対象に含まれる外形線で数字と読み間違える可能性のあるものを3Dモデルに記録し、撮影画像の文字認識を行う領域から除外することで、認識率を高めることができる。
表示部131には、カメラ部101の撮影領域にある画像を表示している。本発明の実施にあたって、カメラ部101で撮影された撮影画像には、3Dモデル保持部112に記憶された3Dモデルに対応した認識対象が記憶されている必要がある。そのため、撮影範囲を確認しながら撮影を行い易いように、カメラ部101と表示部131が異なる面に設けられた端末が好ましい。
図5は認識対象の一例であるメーター201とメーター201の文字領域202の図である。文字領域を含んだ認識対象であるメーター201は4桁の文字領域202を有する。本発明の実施形態では、文字領域は4桁の数字であるが、領域が複数である場合や、文字が漢字やアルファベットである場合も本発明の思想を適用することができる。
(センサーで取得できる傾き角度の説明)
図6〜8を用いて3軸加速度センサーにより、どのように認識対象との撮影角度の関係を検知するかを説明する。本発明の実施形態において、撮影角度は、カメラ部101と認識対象の角度関係を表し、カメラ部101の地平面に対する角度は、傾き角度、3Dモデルを回転させた角度は、回転角度と呼ぶ。特定の値を取らない何れかの軸に対しての回転方向については、傾きと呼ぶ。
文字領域を含んだ認識対象は、カメラの撮影できる範囲内に納めて撮影される。角度取得部102は計測可能な軸を3つ持っており、携帯情報端末100のカメラ部101をメーター201に正対させた時を基準に考えて、左右方向の軸をx軸、上下方向の軸をy軸、奥行き方向の軸をz軸とする。
カメラ部101をx軸周り回転方向に傾きθ、z軸周り回転方向に傾きγ、y軸周り回転方向に傾きεに各々傾けて認識対象の撮影を行った場合に、検出可能な角度と検出不能な角度があることを以下に説明する。
図6は、メーター201に対してカメラ部101を奥行き方向にθ傾け、カメラ部101の傾き方向にメーター201がある状態を横から見た時の、角度取得部102にかかる重力加速度gを示した図である。
奥行き方向にのみ傾けている状態ではx軸に重力加速度はかからず、y軸とz軸にのみ重力加速度がかかる。y軸の測定値をyyとし、z軸の測定値をzzとするとそれぞれ次の値となる。
カメラ部101は奥行き方向にθ傾いている。図6では、角度取得部102よりも下に位置している場合を例示する。
yy=g・sinθ
zz=g・cosθ
これから、奥行き方向の傾きθは次の式により導かれる。
θ=sin―1(yy/g)=cos―1(zz/g)
図7は、カメラ部101をメーター201に対して左右方向にγ傾けた状態を背後から見た時の、角度取得部102にかかる重力加速度gを示した模式図である。
左右方向の軸xについても、同様の方法で導き出すことが可能である。
これから、左右方向の傾きγは次の式により導かれる。
γ=sin―1(yy/g)
一方、角度取得部102を使用したとしても、図8に示すように、y軸周りの傾きεは検出できない。これは、重力加速度gが鉛直方向に一定に働いているため、鉛直方向を軸として鉛直軸周りに回転させたとしても、重力加速度gから得られる値は変わらない。これより、携帯情報端末100をいずれかの方向へ傾けても一軸周りの重力加速度から得られる値は変化しない。そのため、3軸加速度センサーでは、いずれかの一軸周りの傾きは測定できない。
そこで、本発明の実施形態では、カメラの傾き角度を測定できない軸をy軸とし、y軸周りの傾きεについては、画像処理部120を用いて、各種画像処理工程を用いて推定または決定を行う。
撮影画像には認識対象が入っているため、背後からの撮影を考慮する必要は無い。そのため正面から左右90度がその対象範囲とする。
メーター201は地平面に対して鉛直に設置されているものとする。認識対象は、鉛直に設置されておらずとも、3Dモデルの基準となる画像の傾きと認識対象の設置位置の傾きが対応してさえすればよい。
3Dモデル保持部112はメーター201の配管を含んだ外形、凹凸領域、数値や文字領域に対応した位置情報を含んだ3Dモデルが保持されている。3Dモデルは認識に必要な情報を含んでいればよく、これらの実施の形態に制限されるものではない。3Dモデル保持部112に、予め認識対象に対応する3Dモデルを登録することで、適宜設定可能であり様々な形状に対応可能である。
本発明の実施形態における3Dモデルはメーター201の外形の頂点座標と、各頂点間を結ぶ情報、文字領域202の範囲を示すデータの集合で構成されているものである。正面から撮影を行って、加速度センサーがy軸について重力加速度gの値を検出した場合に、撮影された画像と3Dモデルの基準の傾きで輪郭を比較するとずれ量がなく一致する。
S11(撮像工程)
認識対象に対応した3Dモデルの情報を保持する3Dモデル保持部112から文字認識を行いたい認識対象を操作入力部132により選択する。カメラ部101の機能を利用して、予め記憶している3Dモデルに対応した認識対象を含む画像を撮影する。携帯情報端末100での撮像を行う際は、表示部131に表示を行いながら、撮影を行う。カメラ部101は認識対象であるメーター201を撮影し撮影画像保持部111に出力する。
S12(角度取得工程)
認識対象であるメーター201を撮影し撮影画像保持部111に出力し、カメラ部101の撮影画像を取得した際の地平面に対する傾きは、加速度センサーにより、重力加速度から計算する。傾きθについて傾き角度θ1、傾きγについて傾き角度γ1であったとき、角度取得部102は傾き角度θ1と傾き角度γ1を3軸加速度センサーに加わった重力加速度からの計算により取得し、角度保持部113へ保存する。
S13(3Dモデル回転工程)
3Dモデル回転部121は3Dモデル保持部112に保持された3Dモデルの情報と、角度保持部113に保持されている撮影された瞬間のカメラ部101の傾き角度θ1と、傾き角度γ1を利用して3Dモデルを回転補正する。
y軸周りの傾き角度ε1は検出できない。撮影を行った画像に認識対象は含まれているため、y軸周りの傾きεを正面から見て左右に5度刻みでそれぞれ最大90度回転させる。そのため0度から180度までの範囲内36段階で3Dモデルを回転させる。
3Dモデル回転部121では、3Dモデルが保持している頂点座標の一つ一つに対して、パラメータとして傾き角度θ1、傾き角度γ1を与え、傾きεについては0度から180度まで36個となる複数の値を与える。傾き角度θ1、傾き角度γ1の位置からカメラ部101がメーター201を撮影したときに得られる画像に対応した状態の3Dモデルを得る。座標変換には頂点の移動や回転に一般的に使用する変換行列であるアフィン変換を用いる。
S14(比較画像群を作成する作成工程)
比較画像群作成部122では、3Dモデル回転部121が36通りの変換を行った3Dモデルから頂点間を結ぶ線をラスタライズすることで輪郭線を取り出し、比較画像群603を作成する。
S15(一致検出工程)
図9は一致検出部123における処理のモデル図である。一致検出部123では、一致検出を行い易くするために、撮影画像保持部111に保持されている撮影画像601にエッジ抽出アルゴリズムを使用して撮影画像輪郭画像602を生成する。
一致検出部123で使用するエッジ抽出アルゴリズムとしてキャニー法を選択する。キャニー法はノイズに対する耐性が強いエッジ抽出アルゴリズムであり、撮影画像601から輪郭を抽出するのに適切である。図8の撮影画像601のように、ノイズや背景が含まれている場合、キャニー法を用いて、撮影画像601のエッジを検出すると撮影画像601から認識対象や背景などの輪郭が強調された撮影画像輪郭画像602が得られる。
次に先に作成した撮影画像輪郭画像602と比較画像群作成部122によって作成された36枚の輪郭線の集合である比較画像群603とを、パターン認識アルゴリズムによって撮影画像輪郭画像602から比較画像群603に含まれる輪郭から最も輪郭線の近似する輪郭を検出し、撮影画像輪郭画像602に含まれる輪郭線からの認識対象であるメーター201の輪郭を認識する。
一致検出部123で使用するパターン認識アルゴリズムとして、ラスターベクトル変換と特徴点抽出を利用した、ベクトルデータの比較によって行う。
ベクトルデータで一致検出を行うことにより、認識対象輪郭画像602と比較画像群603の大きさが違った場合においても正しい比較結果を得ることが出来る。
この一致検出の処理により、比較画像群603の中で最も適切な輪郭の検出により撮影画像保持部111に保持されている認識対象の撮影画像601に対するずれ量が分かる。この処理により、比較画像群603の図に示すように、角度によって外形が変化する。メーター201の側面も認識対象とすることで、特徴のある形状を一致検出に利用することができる。
最一致画像604が確定すれば、その生成に使用した回転角度のε1を取得することが出来る。3Dモデルを回転させるのに使用した回転角度θ1、γ1、ε1を得ることができる。その結果、最一致画像604と撮影画像601とのずれ量がなければ、メーター201をカメラ部101が撮影した撮影角度は回転角度θ1、γ1、ε1と一致する。この回転角度は、撮影画像601に写ったメーター201のカメラ部101に対する傾きに対応する。
また、この一致検出の処理により、比較画像群603の中の最一致画像604と回転させた3Dモデルから得た輪郭とのオフセット情報605を出力する。オフセット情報605dx=x座標のズレ、dy=y座標のズレ、dz=拡大比率と一致検出で決定した回転角度が一致検出部123から一致検出判定部124と文字領域決定部125に出力される。
S16(一致検出の判定工程)
一致検出判定部124は、最一致画像604に使用された回転角度とずれ量を文字領域決定部125と歪み補正部126へ出力し、撮影画像601に写った認識対象の傾きは補正が必要かをオフセット情報、回転角度の値から判定する。文字認識するのに十分な程度の値であれば、文字認識部127へ撮影画像601の一致検出によりメーター201の領域であるとされた画像のS19の文字認識工程へ進む。歪み補正を行わなければ、正常な文字認識結果を得られない場合は、S17の文字領域決定工程へ進む。ここで判定の基準として、3Dモデル保持部121に保存された文字領域内の情報により、漢字であるか、数字であるか、どのようなフォントであるかや、文字領域が複数あるかなどの様々な認識対象の条件と文字認識アルゴリズムの条件により適宜設定可能である。3Dモデルごとに、予め3つの回転角度、3つのずれ量の各々の値に臨界値を設け、そのいずれか一つの値が臨界値を超えた場合に、文字領域決定部125と歪み補正部126へ、文字領域の決定を行うように命令を発し、S17へ進む。
S17(文字領域決定工程)
文字領域決定部125は、一致検出部123で最一致画像604に使用された3Dモデルの回転角度とオフセット情報605を一致検出判定部124から得る。決定された回転角度とオフセット情報と3Dモデル保持部112に保持しているメーター201の3Dモデルから、文字認識の対象となる領域の位置情報を用いて、最一致画像604から求めた文字領域202に対応する画像を切り出して歪み補正部126に出力する。
図10は最一致画像604における文字領域202の範囲を示す座標を表した図である。
文字領域202の範囲を示す座標は4点で構成され、それぞれの座標は、3Dモデルが保持していた頂点座標を、決定された回転角度である角度θ1、角度γ1、角度ε1を用いてアフィン変換したのちに、画像上に投射した位置であり、それぞれを(x1,y1)(x2,y2)(x3,y3)(x4,y4)とする。
図9では、4点にかこまれた範囲は長方形で表示されているが、決定された撮影角度によって形が変化するため、長方形になるとは限らない。
切り出し範囲は、この文字領域202の範囲を示す座標にオフセット値を掛け合わせたものとなる。
切り出し範囲を示す点を(xc1,yc1)(xc2,yc2)(xc3,yc3)(xc4,yc4)とすると。
その座標はそれぞれ次にようになる。
(xc1,yc1)=((x1+dx)*dz,(y1+dy)*dz)
(xc2,yc2)=((x2+dx)*dz,(y2+dy)*dz)
(xc3,yc3)=((x3+dx)*dz,(y3+dy)*dz)
(xc4,yc4)=((x4+dx)*dz,(y4+dy)*dz)
図11は、文字領域決定部125の処理のモデル図である。切り出し範囲を示す点を(xc1,yc1)(xc2,yc2)(xc3,yc3)(xc4,yc4)を囲み、それ以外を無効領域とした切り出しマスク801が生成され、撮影画像601に切り出しマスク801を適応し切り出し処理を行うと切り出し後画像802が生成される。
切り出し後画像802には文字領域に相当する部分のみ切り出されていることがわかる。
S18(歪み補正工程)
図12は、歪み補正の処理内容を説明した図である。切り出し後画像802の文字領域に相当する部分を拡大したものが数値表示部画像901である。
数値表示部画像901をみると、画像に歪みが存在し、歪み量が一定以上である場合では文字認識精度を低下させる可能性がある。
歪み補正部126はこの歪みを補正し、補正済み文字領域画像902を作成する。
歪みを補正するには、文字領域202内に位置する離散的座標の一点が、数値表示部画像901のどの位置に相当するかを導く必要がある。
この位置は、画像切り出しに使用した座標(x1,y1)(x2,y2)(x3,y3)(x4,y4)を算出したのと同様に、アフィン変換を使用すればよい。
図12では、文字領域202を横640ドットx縦240ドット離散画像であると仮定した場合に、補正済み文字領域画像902を構成する画素が数値表示部画像901を構成するいずれかの画素に相当することを示している。
図13では、画素の選択が最近傍法を利用したアルゴリズムによって、行なわれることを示しているが、近傍画素の情報を利用して線形補完法やバイキュービック法などを適応してもよい。
全ての補正が完了した画像が図12内の補正済み文字領域画像902である。
文字認識に最適な歪みの補正された画像に変換されていることがわかる。
S19(文字認識工程)
文字認識に適した補正済み文字領域画像902、または、一致検出判定部124で特定された撮影画像601の最一致画像604に対応した領域の文字領域に文字認識部127が文字認識を行う。
文字認識部127は補正済み文字領域画像902を認識対象とすることにより、文字列を含んだ認識対象の3Dモデルを保持している場合であれば、文字領域の検出精度を向上させ文字認識の精度を向上させることが可能となる。
また、加速度センサーで重力に対する傾き角度θ1、傾き角度γ1を決定した後に、傾きεに対応させて3Dモデルを逐次回転させて切り出し、一致画像を得ることでも同様な効果を得ることができる。そのため、3Dモデルを逐次回転させて切り出して、比較する場合も比較画像群を作成しているとみなせる。
本発明の実施形態において、傾きεの代表的な値として、0度から180度まで5度ずつ36段階の値を用いたが、段階を細かくし、一致検出の精度を上げることや、およそ撮影される範囲として、45度から135度を90段階選択するなど、これらの値は適宜変更可能である。
本発明の実施形態において、傾きεのみ不定の値として扱ったが、1軸加速度センサーを用いて、2軸周りの傾きが検知できない場合、比較画像群を2軸周りの傾きに対して作成し、一致検出を行ってもよい。
本発明の実施形態において、文字領域の歪み補正は一般的な補正処理を行ったが、認識対象の一致検出が行いやすい輪郭である場合、傾きεの間隔を細かくすることでカメラ部101の決定された撮影角度とオフセット情報は精度が高くなる。その場合に、歪み補正部126で、決定された撮影角度とオフセット情報を使用して歪みのある文字領域の歪みを補正し、文字認識部127に出力することで補正の効果を向上させることができる。
また、本発明の実施形態において輪郭の検出にキャニー法を用いたが、背面が白である場合などは2値化を行うことでも輪郭を抽出することができる。背景の写り込みが少なく、認識対象の輪郭がはっきりしていれば、画像処理を行わずとも一致検出することができる。
認識対象が面であっても、奥行きを短く設定することで3Dモデルとして扱い、本発明の思想を適用できるが、三次元形状の認識対象について好適に用いられる。撮影角度によって外形が変化してしまう場合、側面も外形として認識することにより、角度ごとに輪郭線は多様に変化する。変化の大きい領域を比較することで、輪郭線の比較を行うことにより一致検出効率が高まる。また、背後に壁がある場合や、配置位置が人目につきにくい位置にあり、正面から撮影することが難しい可能性が高い業務用の検針用携帯情報端末において有益に使用することができる。
本発明の実施形態では傾きεの作成間隔は等間隔であるが、3Dモデルによっては、三次元形状の外形が大きく変化する角度を設定することによって、検出効率を高めることもできる。
本発明は実施形態に限らず適宜変更を加え応用をすることができる。本発明の実施形態では、鉛直方向に水平に設置してある物体のみを認識対象としたが、認識対象が傾いていたとしても、3Dモデルがその傾きに対応して保存されている場合は本発明の思想を応用することができる。
図13に実施例1における処理のフローチャートを示す。本実施例では、本実施の形態と同様な構成で、図13の一致検出部123で、最一致画像が複数選択された場合や最一致画像が選択されなかった場合の処理を示す。S105からS109、が本発明の実施形態と異なる処理を行う。S105での処理を一致検出された複数の比較画像と異なる角度にさらに比較画像群を作成し輪郭を比較し一致検出を行うことに変更した実施例である。
(第二の比較画像群を作成する作成工程)
S105で、傾きεの値が85度と90度が比較画像として選択された場合、S106において、一致検出部123は、比較画像群作成部122にエラーを返す。
S107において比較画像群作成部122は、86.5度から89.5度まで、0.5度ずつ3Dモデル回転部121により3Dモデル保持部112に記憶された3Dモデルを回転させる。
S108において、回転された3Dモデル比較画像群作成部122よりに10枚の第二の比較画像群を再度作成し、S109へ進む。S109において、一致検出部123は、最一致画像604を決定し、オフセット情報、回転角度を一致検出判定部124と文字領域決定部125へ出力を行う。以下は本発明の実施形態と同様な処理を行う。
本実施例においても、傾きεの角度作成間隔は任意であり、検知された二つの比較画像の間で、第二の比較画像群を作成する回転角度εの角度作成間隔は任意の角度を設定可能である。
また、最初の比較画像群を作成する工程、つまり第一の比較画像群を作成する作成工程において任意の設定値として間隔を大きくとってしまった場合には、第二の比較画像群が一致検出の精度向上に役立つ。第二の比較画像群を作成するのに使用する回転角度の値として、第一の比較画像群に使用した角度の間をとって第二の比較画像群を作成するなど様々な応用例が考えられる。
本実施例において、二度目の比較画像検知で、傾きεについてより精度を高めた最一致画像604を得ることができる。
また最初は、傾きεの間隔を大きくとって比較画像群を作成し、一致検出部123が、2つの値について、近似していると判断させ、再度最一致に近い比較画像群を最一致の可能性の高い回転角度εの範囲で作成することで、処理の高速化をはかることができる。
100 携帯情報端末
101 カメラ部
102 角度取得部
104 制御部
110 メモリ部
112 3Dモデル保持部
120 画像処理部
121 3Dモデル回転部
122 比較画像群作成部
123 一致検出部
201 メーター
202 文字領域
601 撮影画像
603 比較画像群
604 最一致画像
802 切り出し後画像
901 文字領域画像
902 補正済み文字領域画像

Claims (13)

  1. 予め記憶している3Dモデルに対応した認識対象を含む画像をカメラで撮影し撮影画像を得る撮像工程と、
    前記撮像工程における前記カメラの重力に対する傾き角度を取得する角度取得工程と、
    前記3Dモデルを前記傾き角度に基づいた回転と鉛直軸周りに対応する回転方向の複数の値へ回転をさせる3Dモデル回転工程と、
    回転された前記3Dモデルから比較画像群を作成する作成工程と、
    前記撮影画像と前記比較画像群の一致検出を行い、前記撮影画像に写った前記認識対象の前記カメラに対する傾きを決定する一致検出工程と、
    一致検出した前記撮影画像に含まれる前記認識対象の文字領域を文字認識する文字認識工程とを有する画像処理方法。
  2. さらに、前記文字領域の歪み補正工程を有することを特徴とした請求項1に記載の画像処理方法。
  3. 前記歪み補正工程は、前記認識対象の傾きを利用して、歪み補正を行うことを特徴とする請求項2に記載の画像処理方法。
  4. 前記一致検出工程において、前記撮影画像と一致検出を行った回転された前記3Dモデルから作成した一致画像に用いられた3Dモデルの回転角度を出力し、
    前記3Dモデルは、前記文字領域に対応した位置情報を含み、さらに、前記回転角度を利用して前記3Dモデルの前記位置情報から前記文字領域を求める文字領域決定工程を有すること
    を特徴とした請求項1から請求項3のいずれか一項に記載の画像処理方法。
  5. 前記一致検出工程において、拡大比率を算出し、前記文字領域決定工程で前記回転角度に加えて、前記拡大比率も利用することを特徴とする請求項4に記載の画像処理方法。
  6. 認識対象に対応した3Dモデルの情報を保持する3Dモデル保持部と
    前記認識対象を含む画像を撮影画像として得るカメラ部と、
    前記撮影画像を得た際の前記カメラの重力に対する傾き角度を取得する角度取得部と、
    前記3Dモデルを前記傾き角度に基づいた回転と鉛直軸周りに対応する回転方向の複数の値へ回転をさせる3Dモデル回転部と、
    回転された前記3Dモデルから比較画像群を作成する比較画像群作成部と、
    前記撮影画像と前記比較画像群の一致検出を行い、前記撮影画像に写った前記認識対象の前記カメラに対する傾きを決定する一致検出部と、
    一致検出した前記撮影画像に含まれる前記認識対象の文字領域を文字認識する文字認識部とを有する携帯情報端末。
  7. さらに、前記文字領域の歪み補正部を有することを特徴とした請求項6に記載の携帯情報端末。
  8. 前記歪み補正部は、前記認識対象の傾きを利用して、歪み補正を行うことを特徴とする請求項7に記載の携帯情報端末。
  9. 前記一致検出部において、前記撮影画像と一致検出を行った回転された前記3Dモデルから作成した一致画像に用いられた3Dモデルの回転角度を出力し、
    前記3Dモデルは、前記文字領域に対応した位置情報を含み、さらに、前記回転角度を利用して前記3Dモデルの前記位置情報から前記文字領域を求める文字領域決定部を有することを
    特徴とした請求項6から請求項8のいずれか一項に記載の携帯情報端末。
  10. 前記一致検出部において、拡大比率を算出し、前記文字領域決定部で前記回転角度に加えて、前記拡大比率も利用することを特徴とする請求項9に記載の携帯情報端末。
  11. さらに、前記認識対象は、特定の型番のメーターであり、前記文字認識部の認識結果を計算し印刷出力を行うプリンタ出力部を備えた検針用の請求項6から請求項10のいずれか一項に記載の携帯情報端末。
  12. 携帯情報端末のコンピュータを動作させるプログラムであって、
    予め記憶している3Dモデルに対応した認識対象を含む画像をカメラで撮影し撮影画像を得る撮像工程と、
    前記撮像工程における前記カメラの重力に対する傾き角度を取得する角度取得工程と、
    前記3Dモデルを前記傾き角度に基づいた回転と鉛直軸周りに対応する回転方向の複数の値へ回転させる3Dモデル回転工程と、
    回転された前記3Dモデルから比較画像群を作成する比較画像群作成工程と、
    前記撮影画像と前記比較画像群の一致検出を行い、前記撮影画像に写った前記認識対象の前記カメラに対する傾きを決定する一致検出工程と、
    一致検出した前記撮影画像に含まれる前記認識対象の文字領域を文字認識する文字認識工程とを有するプログラム。
  13. さらに、第二の比較画像群を作成する作成工程を備え、
    前記一致検出で最一致画像が決定されなかった場合、第二の比較画像群を作成することを特徴とした請求項12に記載のプログラム。
JP2010159147A 2010-07-13 2010-07-13 画像処理方法、携帯情報端末及びプログラム Active JP5554654B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2010159147A JP5554654B2 (ja) 2010-07-13 2010-07-13 画像処理方法、携帯情報端末及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2010159147A JP5554654B2 (ja) 2010-07-13 2010-07-13 画像処理方法、携帯情報端末及びプログラム

Publications (2)

Publication Number Publication Date
JP2012022474A JP2012022474A (ja) 2012-02-02
JP5554654B2 true JP5554654B2 (ja) 2014-07-23

Family

ID=45776729

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010159147A Active JP5554654B2 (ja) 2010-07-13 2010-07-13 画像処理方法、携帯情報端末及びプログラム

Country Status (1)

Country Link
JP (1) JP5554654B2 (ja)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5928228B2 (ja) * 2012-07-31 2016-06-01 カシオ計算機株式会社 被写体検出装置、被写体検出方法及びプログラム
JP6128458B2 (ja) 2012-09-04 2017-05-17 パナソニックIpマネジメント株式会社 撮像装置および画像処理方法
JP6135848B2 (ja) 2012-09-04 2017-05-31 パナソニックIpマネジメント株式会社 撮像装置、画像処理装置および画像処理方法
KR102084161B1 (ko) * 2013-05-08 2020-03-03 삼성전자주식회사 이미지를 보정하는 전자 장치 및 그 제어 방법
JP6837880B2 (ja) 2017-03-15 2021-03-03 株式会社東芝 画像処理装置、画像処理システム、画像処理方法、およびプログラム
CN109769091B (zh) * 2019-02-22 2020-09-18 维沃移动通信有限公司 一种图像拍摄方法及移动终端
JP7093321B2 (ja) * 2019-03-19 2022-06-29 株式会社Third 計器読取システム
JP6899108B1 (ja) * 2020-11-12 2021-07-07 株式会社センシンロボティクス 計器指示値読取方法及び管理サーバ、計器指示値読取システム、プログラム
CN113518180B (zh) * 2021-05-25 2022-08-05 宁夏宁电电力设计有限公司 一种用于电力作业车的车载摄像头安装方法

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH087078A (ja) * 1994-06-21 1996-01-12 Nec Corp 検針用携帯端末装置
JP3957888B2 (ja) * 1997-08-20 2007-08-15 株式会社リコー 撮像装置及び撮像画像合成方法
JPH11306282A (ja) * 1998-04-17 1999-11-05 Nippon Telegr & Teleph Corp <Ntt> 文字列領域抽出方法及び装置
JP3276949B2 (ja) * 1999-02-15 2002-04-22 株式会社メディックエンジニアリング 3次元有向体の定位方法及び画像処理装置
JP4352214B2 (ja) * 2003-04-23 2009-10-28 清水建設株式会社 3次元位置姿勢の画像推定方法
JP2007011665A (ja) * 2005-06-30 2007-01-18 Matsushita Electric Ind Co Ltd 検針システム
JP5109294B2 (ja) * 2006-06-19 2012-12-26 三菱電機株式会社 3次元位置補正装置

Also Published As

Publication number Publication date
JP2012022474A (ja) 2012-02-02

Similar Documents

Publication Publication Date Title
JP5554654B2 (ja) 画像処理方法、携帯情報端末及びプログラム
JP6176598B2 (ja) 寸法測定プログラム、寸法測定装置、及び、寸法測定方法
US9589333B2 (en) Image correction apparatus for correcting distortion of an image
CN107103315B (zh) 用于在图像信号中捕获文档的交互式用户接口
JP4183669B2 (ja) 電子透かし埋め込み装置と方法ならびに電子透かし抽出装置と方法
JP6083747B2 (ja) 位置姿勢検出システム
JP5480777B2 (ja) オブジェクト表示装置及びオブジェクト表示方法
JP7255718B2 (ja) 情報処理装置、認識支援方法およびコンピュータプログラム
JP5002144B2 (ja) 三次元計測用投影装置及びシステム
JP5773436B2 (ja) 情報端末装置
JP4010754B2 (ja) 画像処理装置と画像処理方法及びコンピュータ読み取り可能な記録媒体
JP2010287174A (ja) 家具シミュレーション方法、装置、プログラム、記録媒体
JP2004040395A (ja) 画像歪み補正装置、方法及びプログラム
CN111307039A (zh) 一种物体长度识别方法、装置、终端设备和存储介质
CN109558844A (zh) 基于图像归一化提升自定义模板识别率的方法及设备
JP3690581B2 (ja) 位置検出装置及びその方法、平面姿勢検出装置及びその方法
JP2009277027A (ja) 画像における顔の器官の画像に対応する器官領域の検出
WO2005096130A1 (ja) 撮像装置の指示位置検出方法および装置、撮像装置の指示位置検出用プログラム
JP2005267257A (ja) 手書き情報入力システム
CN113306308A (zh) 基于高精度视觉定位的便携式打印复印机的设计方法
JP2005332177A (ja) 3次元情報処理装置、3次元情報処理方法、及び3次元情報処理プログラム
JP2002204342A (ja) 画像入力装置および記録媒体、並びに画像合成方法
CN102843479A (zh) 文件扫描方法、文件扫描装置及便携式电子装置
CN109558846A (zh) 基于ocr模板归一化提升自定义模板识别率方法及设备
JP4444684B2 (ja) 対象物の撮影画像の処理方法、画像表示システム、プログラム、および、記録媒体

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20130710

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20130710

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20140418

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140509

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140529

R150 Certificate of patent or registration of utility model

Ref document number: 5554654

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250