JP2020091748A - 端末装置、プログラム、画像管理方法 - Google Patents

端末装置、プログラム、画像管理方法 Download PDF

Info

Publication number
JP2020091748A
JP2020091748A JP2018229396A JP2018229396A JP2020091748A JP 2020091748 A JP2020091748 A JP 2020091748A JP 2018229396 A JP2018229396 A JP 2018229396A JP 2018229396 A JP2018229396 A JP 2018229396A JP 2020091748 A JP2020091748 A JP 2020091748A
Authority
JP
Japan
Prior art keywords
character recognition
frame image
unit
frame
terminal device
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2018229396A
Other languages
English (en)
Inventor
後藤 聡
Satoshi Goto
聡 後藤
亮介 小井戸
Ryosuke Koido
亮介 小井戸
正太 名手
Shota Nate
正太 名手
達也 平山
Tatsuya Hirayama
達也 平山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
ISP KK
Toppan Edge Inc
Original Assignee
ISP KK
Toppan Forms Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ISP KK, Toppan Forms Co Ltd filed Critical ISP KK
Priority to JP2018229396A priority Critical patent/JP2020091748A/ja
Publication of JP2020091748A publication Critical patent/JP2020091748A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Character Discrimination (AREA)
  • Character Input (AREA)

Abstract

【課題】データ量が増大してしまうことを抑えつつ、文字情報を取得した基となる画像を把握することができる端末装置を提供する。【解決手段】帳票を連続して撮像するカメラから得られる複数のフレーム画像を取得するフレーム画像取得部と、前記複数のフレーム画像のそれぞれについて文字認識処理を行う文字認識部と、前記文字認識部によって得られた文字認識結果と、当該文字認識結果が得られたフレーム画像とを出力する認識データ管理部と、を有する。【選択図】図1

Description

本発明は、端末装置、プログラム、画像管理方法に関する。
携帯電話やスマートフォン等の端末装置によって運転免許証等の各種証明書を撮像して得られた撮像データと、当該撮像データを文字認識することで得られる文字情報とを用いて、各種申し込み手続を電子的に行なうことが行なわれている。端末装置のカメラで撮像して文字認識するものとしては、例えば、特許文献1に記載された携帯端末装置がある。この特許文献1の携帯端末装置においては、読み取り対象の文書を連続して撮像される間に得られる複数の文書画像について文字認識を行い、読み取り対象の項目名に対応する値を取得している。
特許第6364051号公報
しかしながら、上述の技術において、文書画像から文字情報を取得することで、各種申し込み手続を電子的に行うことができるが、申し込み手続に用いられた文字情報が、どのような文書画像から得られた文字情報であったかを確認することができない。例えば、文書画像に含まれる文字について誤りなく文字認識処理が行われて、文字情報が得られていたか否かを後から確認できた方が好ましい場合がある。
また、一般に、端末装置にて文字認識処理を行う場合には、ユーザにシャッターボタンを押してもらうことで撮像された画像データを対象として文字認識処理が行われるが、特許文献1のように、シャッターボタンを押すことなく撮像されている場合、例えば文字認識処理を行うために撮像された動画データを残すようにすると、データ量が増大してしまう。
本発明は、このような事情に鑑みてなされたもので、その目的は、データ量が増大してしまうことを抑えつつ、文字情報を取得した基となる画像を把握することができる端末装置、プログラム、画像管理方法を提供することにある。
(1)上述した課題を解決するために、本発明の一態様である端末装置は、帳票を連続して撮像するカメラから得られる複数のフレーム画像を取得するフレーム画像取得部と、前記複数のフレーム画像のそれぞれについて文字認識処理を行う文字認識部と、前記文字認識部によって得られた文字認識結果と、当該文字認識結果が得られたフレーム画像とを出力する認識データ管理部と、を有する。
(2)また、本発明の一態様である端末装置は、前記文字認識結果が得られたフレーム画像のうち保存条件を満たすフレーム画像を選択する選択部を有し、前記認識データ管理部は、前記文字認識結果と、前記選択部によって選択されたフレーム画像とを出力する。
(3)また、本発明の一態様であるプログラムは、コンピュータを、上記(1)または(2)に記載の端末装置として動作させるためのプログラムであって、前記コンピュータを前記端末装置が備える各部として機能させるためのプログラムである。
(4)また、本発明の一態様である画像管理方法は、フレーム画像取得部が、帳票を連続して撮像するカメラから得られる複数のフレーム画像を取得し、文字認識部が、前記複数のフレーム画像のそれぞれについて文字認識処理を行い、認識データ管理部が、前記文字認識部によって得られた文字認識結果と、当該文字認識結果が得られたフレーム画像とを出力する。
以上説明したように、この発明によれば、帳票を連続して撮像するカメラから得られる複数のフレーム画像のうち、文字認識部によって得られた文字認識結果と、当該文字認識結果が得られたフレーム画像とを出力するようにした。これにより、データ量が増大してしまうことを抑えつつ、文字情報を取得した基となる画像を把握することができる。
この発明の一実施形態による帳票データ管理システム1の構成を示す概略ブロック図である。 帳票データ記憶部201に記憶される情報の一例を示す図である。 端末装置10の動作を説明するフローチャートである。 表示部102に表示される画面の一例を示す図である。
以下、本発明の一実施形態による端末装置を用いた帳票データ管理システムについて図面を参照して説明する。図1は、この発明の一実施形態による帳票データ管理システム1の構成を示す概略ブロック図である。
帳票データ管理システム1は、1つまたは複数の端末装置10と帳票データ管理装置20とがネットワーク30を介して接続される。この図において端末装置10は一例として1つだけ図示してある。
端末装置10は、例えば、カメラを内蔵したスマートフォン、携帯電話、携帯情報端末(PDA)、タブレットPC等のうちいずれかを用いることができる。端末装置10は、帳票データ管理装置20または他のサーバからダウンロードした所定のアプリケーションソフトウェアを実行することで、帳票の撮像を行なって撮像データを生成して生成されたデータを帳票データ管理装置20に送信し、銀行の口座開設や、各種保険の申し込み、各種サービスの会員登録等の手続を電子的に行なうことができる。
ここで、帳票は、例えば、運転免許証、保険証(健康保険証)、住民票等の公的機関が発行した書面や、上述の手続のサービスを行なうにあたり利用可能として指定された書面(例えば、電気やガスや水道等の料金の支払証明書、クレジット支払明細書など)であって、手続を申し込みするユーザの氏名や住所等が記載され、これら氏名や住所が正しいことを証明可能な書面である。また、書面としては、生命保険証券、自動車保険証券、健康診断票、名刺等を用いることも可能である。このような帳票を端末装置10によって撮像し、文字認識処理を行なって、帳票から文字情報を取得することで、この文字情報を利用して各種申込手続等を電子的に行なうことができる。
例えば、この文字情報を利用することで、ユーザは、氏名や住所等の入力が必要な項目について自分自身で入力する必要がなく、得られた文字情報を確認して間違いが無いか否かを確認して、帳票データ管理装置20に送信し、各種申込手続を進めることができる。また、ユーザによってタッチパネルやキーボード等を介して入力された氏名等の文字列と文字認識処理結果の文字情報とが一致するか否かの判定を行なうことで、ユーザの氏名等の入力情報が正しいかを判定するようにしてもよい。
端末装置10は、カメラ101、表示部102、フレーム画像取得部103、記憶部104、文字認識部105、選択部106、認識データ管理部107、通信部108、及び制御部109を含んで構成され、ネットワーク30を介して帳票データ管理装置20と通信を行なう機能を有する。
カメラ101は、光学系であるレンズを介して撮像素子(例えばCCD(固体撮像素子))によって光を受光し、帳票等の被写体について、秒間10から30フレームのフレームレートで撮像を連続して行うことで、各フレームにおける撮像データをフレーム画像として生成する。すなわち、ユーザは、帳票を撮像するあたり、端末装置10のアプリケーションプログラムを起動する指示を入力し、プレビュー画面を見ながら、撮影対象の帳票が撮像範囲内に収まるように端末装置10を移動させることで、シャッターボタンを押すことなく、毎秒10から30フレームのフレーム画像を得るように操作することができる。この場合、ユーザは、シャッターボタンを押す必要がないため、いわゆる動画を撮影している感覚で撮影すればよく、また、特別な操作をする必要がない。
表示部102は、例えば液晶表示装置やタッチパネル等であり、カメラ101によって生成されたフレーム画像をプレビュー画面に表示する機能、各種情報を表示する機能を有する。
フレーム画像取得部103は、カメラ101から得られる複数のフレーム画像を取得する。ここで取得されるフレーム画像は、カメラ101によって生成されたフレーム画像のそれぞれであってもよいし、文字認識部105の文字認識処理の速度に応じて、一部のフレーム画像を抜粋して取得するようにしてもよい。
また、フレーム画像取得部103は、取得したフレーム画像を記憶部104のフレーム画像記憶部1041に記憶する。
記憶部104は、各種情報を記憶する。このフレーム画像記憶部1041は、フラッシュメモリ、ハードディスク、RAM等のメモリの少なくとも1つを用いて構成することができる。記憶部104には、フレーム画像記憶部1041とアプリケーション記憶部1042とが設けられている。
フレーム画像記憶部1041は、フレーム画像取得部103が取得したフレーム画像を記憶する。
アプリケーション記憶部1042は、帳票データ管理装置20または他のサーバからダウンロードした所定のアプリケーションソフトウェアを記憶する。このアプリケーションソフトウェアは、後述する制御部109によって読み出されて実行されることで、本実施形態における文字認識処理やフレーム画像の管理に関する機能を実行することができる。
文字認識部105は、フレーム画像記憶部1041に記憶されたフレーム画像について文字認識処理を行う。ここでは、文字認識部105は、フレーム画像記憶部1041に記憶されたフレーム画像を対象として文字認識処理をしてもよいし、フレーム画像取得部103から直接フレーム画像を得て、文字認識処理を行ってもよい。
また、文字認識部105は、フレーム画像記憶部1041に記憶されたフレーム画像を対象として文字認識処理を行う場合、例えば、第1フレーム画像がフレーム画像記憶部1041に記憶された後、次のフレーム画像である第2フレーム画像がフレーム画像取得部103によってフレーム画像記憶部1041に書き込まれる間に、文字認識部105は、第1フレーム画像を対象とした文字認識処理を実行して終了することができる。例えば、文字認識部105は、フレームレートが20fpsである場合、1つのフレーム画像に対する文字認識処理の速度が50ミリ秒未満程度で文字認識処理を行うことができる。また、カメラ101によってフレーム画像が生成されるフレームレートに対応する速度よりも文字認識部105の文字認識処理が遅い場合(フレームレートが20fpsであって、1つのフレーム画像に対する文字認識処理の速度が50ミリ秒を超える場合)には、フレーム画像取得部103は、カメラ101によって生成されるフレーム画像のうち、数枚おきにフレーム画像記憶部1041に記憶するようにしてもよい。これにより、文字認識部105が実施する文字認識処理を超えて必要以上にフレーム画像を記憶する必要がなくなり、記憶部104の記憶領域を削減することができる。
ただし、記憶部104の記憶領域を十分に確保できる場合、フレーム画像取得部103は、カメラ101によって生成される都度、フレーム画像記憶部1041に記憶するようにし、文字認識部105が、フレーム画像記憶部1041に記憶されたフレーム画像の中から、文字認識処理をする対象のフレーム画像を抽出して文字認識するようにしてもよい。
文字認識部105によって行われる文字認識処理は、公知のOCR処理を行うものであってよく、例えば、取得(抜粋)される画像(BMP、JPEG等)の明るさ、ハイライトを調整して白黒二値化し、レイアウト解析し、罫線を除去し、文字を切り出し、パターン辞書、フォント辞書等を用いて文字認識し、文字認識された値を出力する。この出力される値としては、例えば、文字列を表す情報である。また、値としては、テキストデータを用いるようにしてもよい。また、文字認識部105は、認識された各文字の外接矩形の座標を出力することもできる。
ここで、申し込み手続によっては、撮影する対象の帳票が予め決められている場合がある。例えば、自動車運転免許証が撮影対象の帳票として定められている場合がある。このような場合、自動車運転免許証は、書式が決まっているため、帳票からカメラ101までの距離が一定範囲に収まるようにして撮像した場合、どの項目が画像のどの位置(座標)にあるかについて、特定することが可能である。そのため、文字認識部105は、申し込み手続に応じた定義情報を記憶するようにしてもよい。この定義情報は、項目名と、その項目名が存在しうる座標の範囲を対応づけたデータである。この定義情報を参照することで、文字認識部105は、特定の座標の範囲に記載された文字列について氏名、住所等の項目を特定した上で、その座標の範囲を対象として得られた値(文字列)を項目とともに取得することができる。
選択部106は、文字認識結果が得られたフレーム画像のうち保存条件を満たすフレーム画像を選択する。ここでいう保存とは、帳票から文字認識によって得られた値(文字列)について、その文字認識を行った対象の画像を文字認識処理がどのような画像を基におこなわれたかを証拠(根拠)として記憶装置に記憶しておくことである。この記憶先となる記憶装置は、この実施形態において、帳票データ管理装置20である場合について説明するが、ネットワーク30に接続された他のサーバの記憶装置であってもよい。また、端末装置10の記憶部104に記憶しておき、帳票データ管理装置20から参照要求を端末装置10に送信し、端末装置10が、この参照要求を受信した場合に、フレーム画像を帳票データ管理装置20に送信するようにしてもよい。
また、保存条件とは、フレーム画像とそのフレーム画像から得られた文字情報とについて、保存するか否かを判定に用いられる条件である。この実施形態においては、文字認識処理は、フレーム画像が得られる毎に実施されるため、フレーム画像とそのフレーム画像に対する文字情報の組を複数得ることができる。そこで、フレーム画像と文字情報の組の全てを保存することもできるが、保存しておくことが好ましいフレーム画像を選択し、そのフレーム画像と文字情報の組を保存することができる。これにより、後から確認する対象のフレーム画像が増大してしまうことを低減することができる。
ここで、保存条件は任意の条件を用いることができるが、例えば、下記のいずれか1つまたは複数の条件の組み合わせを用いることができる。
(a)文字認識処理によって文字情報を得ることができたフレーム画像であること
文字認識処理によって文字情報が得られなかったフレーム画像については、保存対象から除外することで、不要な画像を保存する必要がなくなり、データ量が増大してしまうことを抑えることができる。例えば動画データそのものを保存する場合に比べてデータ量を大幅に低減することができる。
(b)帳票全体が撮影範囲内に収まるフレーム画像であること
帳票全体が撮影範囲内にあるか否かについては、例えば、帳票の外周が撮影範囲内にあるか否かを判定することで検出することができる。帳票の外周は、帳票が置かれた背景(例えば、帳票がテーブルに置かれた場合には、テーブルの画像)との画素値の差が所定以上である場合に、外周であると検出することができる。
帳票の外周が撮影範囲に収まっている場合には、帳票の全体がフレーム画像として得られているため、読み取り対象となる項目のそれぞれについて、フレーム画像に含まれた状態で保存することができる。すなわち、読み取り対象となる項目のうち一部の項目が撮像範囲から外れてしまっている場合には、後から読み取り対象となった項目の画像を後から確認することができないため、そのような画像を除外することができる。
また、帳票全体が撮影範囲にあるか否かについては、帳票の複数の頂点のうちいずれか2点が撮影範囲に収まるフレーム画像を用いることもできる。帳票の外周は一般に矩形状であるため、その帳票の4つの頂点のうち、例えば、対角線上に位置する頂点が撮影範囲に収まるように撮像された場合には、帳票の全体が撮影範囲に収まるように撮像されている。これにより、読み取り対象の項目についていずれもフレーム画像に収まる。
(c)帳票の中央部分が撮影範囲の中央部分にあるフレーム画像であること
帳票の中央部分が撮影範囲の中央にあるようにして撮影されている場合、帳票にある複数の読み取り対象の項目について、1つのフレーム画像内に収まっている可能性が高い。そのため、読み取り対象の項目が複数あったとしても、それら複数の読み取り対象の項目が1つのフレーム画像に含まれるようにして撮像されている可能性が高い。例えば、帳票の読み取り対象となる複数の項目が、帳票の中央から近い位置にいずれも配置されている場合には、帳票の中央近傍の項目が撮影範囲の中央に位置するようにして文字認識が行われると、たいていの場合、他の項目も撮像領域に入る。また、申し込み手続によっては、撮像対象としての帳票の種別が決まっており、その種別が予め解ることで、読み取り対象の項目の座標位置を予め把握することができ、また、撮像する際の帳票からカメラ101までの距離の範囲も決まっている(例えば数十センチメートルの範囲)ため、所定の項目が撮像範囲の中央に配置された状態で撮像されていれば、他の項目についても撮影範囲に収まっていると推定することができる。
(d)文字認識処理にて取得する対象の項目のうち、所定の項目について1つのフレーム画像から文字情報を得ることができたフレーム画像であること
ここで所定の項目としては、例えば、3つの項目等、項目の数としてもよいし、「氏名」と「生年月日」等、項目そのものが指定されていてもよい。
例えば、読み取り対象の項目が複数ある場合、その項目毎に異なるフレーム画像から文字認識を行うと、複数のフレーム画像を保存する必要が生じるため、保存する対象のフレーム画像の数が増大する。
例えば、項目の数を用いる場合、複数の項目が1つのフレーム画像に写った状態のフレーム画像を保存することができ、保存するフレーム画像の数を低減することができる。
また、例えば、「氏名」、「住所」、「生年月日」が順に並んで配置された帳票を対象として文字認識処理をする場合、「氏名」と「生年月日」とが1つのフレーム画像に収まっている場合には、「氏名」と「生年月日」との間に「住所」が写っていることとなる。そのため、特定の項目を対象とすることで、必要な項目が写っているフレーム画像を保存することができる。
(e)いくつかのフレーム画像で特定の複数の項目について文字情報が得られること
帳票の外周がカメラの撮像範囲に収まらないサイズであって、帳票の紙面に沿ってカメラを移動させつつ撮像する場合、撮像範囲が異なるようにして帳票が連続的に撮像される。このような場合、1つのフレーム画像で特定の複数の項目が得られないために複数のフレーム画像を必要となる。そのため特定の複数の項目について文字情報を得るために用いられた複数のフレーム画像が保存する。
(f)ユーザによって選択されたフレーム画像であること
いくつかのフレーム画像のうち、特定の項目が撮影範囲の中央に位置するように撮像されたフレーム画像や、必要な項目の全てが写っているフレーム画像を選択してもらう。
このように、保存条件は複数あるが、例えば、条件(c)と条件(d)を組み合わせて用いる場合には、例えば、3つの項目について文字情報を得ることができ、かつ、その3つの項目のうち所定の項目が撮像範囲の中央に位置するフレーム画像を保存対象とすることができる。
また、保存する対象のフレーム画像は、カメラ101によって撮像された撮影範囲内のデータであればよい。例えば、カメラ101によって撮影された領域のそのままのサイズであってもよいし、フレーム画像から文字認識を行った領域を切り出して保存するようにしてもよい。
認識データ管理部107は、文字認識部105によって得られた文字認識結果と、当該文字認識結果が得られたフレーム画像とを出力する。この出力は、例えば、通信部108によってネットワーク30を介して帳票データ管理サーバ出力する。
また、認識データ管理部107は、文字認識結果と、選択部106によって選択されたフレーム画像とを出力することもできる。
通信部108は、端末装置10の外部の機器(例えば、帳票データ管理装置20)と通信を行う。また、通信部108は、認識データ管理部107の制御のもと、ユーザ識別情報、フレーム画像、文字情報を帳票データ管理装置20に送信する。
制御部109は、端末装置10内の各部を制御する。また、制御部109は、カメラ101によって帳票を撮像する場合に、撮影ガイド枠を表示部102の表示画面に表示させることもできる。この撮影ガイド枠は、帳票に対する文字認識処理を行うにあたり、撮像画像に重畳させるようにして表示される矩形状の図形である。この撮影ガイド枠は、帳票を撮影する際に、帳票の外周の端部が、この撮影ガイド枠の内周に収まる程度であって、撮影ガイド枠に近い位置となるように撮影された場合に、文字認識処理による文字認識精度が高くなるようなサイズに設定される。例えば、帳票とカメラ101との距離が離れすぎていると、帳票に記載された文字等のサイズも小さくなり、正しく文字認識を行うことができなくなり、一方で、近すぎると、焦点が合わなくなったり、あるいは、文字認識したい対象の文字列がカメラの撮像領域内に収まらない場合がある。そこで、このよう撮影ガイド枠を表示することで、ユーザに対し、端末装置10に対する帳票の相対位置をどのようにすればよいかを直感的に認識してもらうことができ、文字認識率が低下してしまわないようにし、かつ、ユーザにとって撮影しやすい環境を提供することができる。また、帳票の輪郭部分(上端、下端、左端、右端)撮影ガイド枠の上部側と下部側、左側と右側の直線部分にそれぞれ平行となるように、端末装置10を帳票の紙面と平行な面において回転させることで、カメラ101の撮像領域(フレーム画像)に対する帳票の文字列が並ぶ方向の傾きを低減させることができる。
また、ここでは、撮影ガイド枠を表示するだけでなく、「確認カードが枠線に収まるように位置を合わせて下さい」等のメッセージも表示するようにしてもよい。
帳票データ管理装置20は、帳票データ記憶部201を有し、例えば、Webサーバとしてネットワーク30に接続される。
図2は、帳票データ記憶部201に記憶される情報の一例を示す図である。
帳票データ記憶部201は、ユーザ識別情報、帳票識別情報、帳票画像、文字情報とを対応付けて記憶する。
ユーザ識別情報は、ユーザを個別に識別する情報である。ユーザ識別情報は、例えば、端末装置10の電話番号、端末装置10の個体識別番号等を用いてもよいし、端末装置10を用いて帳票データ管理装置20にログインをして手続等の申し込みをする場合には、ログインする際のユーザIDを用いてもよい。
帳票識別情報は、端末装置10から送信されるフレーム画像を個別に識別することが可能な情報であり、例えば、端末装置10から受信した際に、帳票データ管理装置20が個別の識別情報を割り当てて、帳票画像とともに記憶するようにしてもよい。
帳票画像は、端末装置10から送信されたフレーム画像である。
文字情報は、フレーム画像に対して文字認識処理を行うことで得られた情報であり、項目と項目に対する値を含む。項目は氏名、住所等の項目の名称であり、値は、文字認識によって得られた結果であり、たとえば、文字、数字、記号等である。
次に、上述の端末装置10の動作について図3、図4を用いて説明する。図3は、端末装置10の動作を説明するフローチャート、図4は、表示部102に表示される画面の一例を示す図である。ここでは、読み取る対象の帳票として、自動車運転免許証と同じ程度の大きさであり、公的機関によって発行された通知カードを対象とした場合について説明する。
端末装置10の制御部109は、帳票文字認識モードが起動されると、カメラ101を起動する(ステップS101)。カメラ101は、起動すると、撮像範囲にある物体を撮像し、フレーム画像を生成する。例えば、フレームレートが20fpsである場合には、50ミリ秒毎にフレーム画像が生成される。表示部102は、カメラ101によってフレーム画像が生成される毎に順次表示する。表示部102には、例えば、あるフレーム画像において、図4の符号500に示すような画面が表示される。ここでは、表示部102は、撮像領域全体の画像を表示するとともに、制御部109は、表示部102に撮影ガイド枠(符号510)を表示させる。
表示部102に撮影ガイド枠及びフレーム画像が表示されることで、ユーザは、読み取り対象の帳票がカメラの撮像範囲あるいは撮影ガイド枠に収まるように、帳票に対する端末装置10の位置を移動させる。例えば、帳票の書面に沿って、帳票の上端側、下端側、左端側、右端側等への移動、帳票の書面に対するカメラ101までの距離を近づける、あるいは遠ざけるような移動、カメラの撮像範囲に対する帳票の傾きを無くすような回転方向への移動等が行われる。
フレーム画像取得部103は、カメラ101によって生成されたフレーム画像を取得して(ステップS102)、フレーム画像記憶部1041に記憶する。フレーム画像記憶部1041にフレーム画像が記憶されると、文字認識部105は、フレーム画像記憶部1041に記憶されたフレーム画像を読み出し、このフレーム画像を対象として文字認識処理を行う(ステップS103)。
文字認識部105は、定義情報を読み出す。ここでは、申し込み手続に応じて読み取り対象の帳票の種別が決まっているため、その種別に応じた定義情報を読み出す。そして、文字認識部105は、定義情報を用いて文字認識処理を実行する。これにより、取得したい対象の項目毎に文字列を抽出することが可能である。
次に文字認識部105は、文字認識処理によって読み取りが成功したか否かを判定する(ステップS104)。例えば、文字認識部105は、読み取り対象の項目に対する文字列が記載された領域から文字を抽出することができたか否かを判定する。文字の抽出をすることができなかった場合、文字認識部105は、読み取りが成功しなかったと判定し、その文字認識の対象となったフレーム画像をフレーム画像記憶部1041から削除する。フレーム画像を削除すると、制御部109は、処理をステップS102に移行する。
文字認識部105は、文字の読み取りが成功した場合、文字認識処理によって得られた値と、得られた項目とを、文字認識処理を行ったフレーム画像に対応づけてフレーム画像記憶部1041に記憶する(ステップS104)。
次に、選択部106は、フレーム画像記憶部1041に記憶された情報を参照し、保存条件を満たすフレーム画像があるか否かを判定する(ステップS106)。この保存条件は、任意の保存条件を用いることができるが、例えば、申し込み手続に応じて保存条件が予め決められていてもよい。
保存条件を満たすフレーム画像がない場合、制御部109は、処理をステップS102に移行する。
ここで、選択部106は、保存条件を満たしていないと判定されたフレーム画像とその文字情報とをフレーム画像記憶部1041から削除するようにしてもよい。
一方、保存条件を満たすフレーム画像がある場合、認識データ管理部107は、フレーム画像記憶部1041に記憶された情報のうち、保存条件を満たすと判定されたフレーム画像とこのフレーム画像から得られた文字情報を、ユーザ識別情報とともに通信部108によって帳票データ管理装置20に送信する(ステップS107)。
認識データ管理部107は、フレーム画像等のデータを帳票データ管理装置20に送信した後は、フレーム画像記憶部1041に記憶されたフレーム画像や文字情報を削除するようにしてもよい。
帳票データ管理装置20は、端末装置10から受信したフレーム画像とこのフレーム画像から得られた文字情報とユーザ識別情報とを帳票データ記憶部201に記憶する。
上述した実施形態によれば、保存条件を満たすフレーム画像を選択し、文字情報とともに保存するようにしたので、保存するデータ量が増大してしまうことを抑えつつ、文字情報を取得した基となる画像を把握することができる。また、保存条件を満たすフレーム画像を選択した上で、帳票データ管理装置20に送信するようにしたので、端末装置10から帳票データ管理装置20に送信するデータの通信量も増大しないように低減することができる。
なお、上述した実施形態において、フレーム画像取得部103、文字認識部105、選択部106、認識データ管理部107、通信部108、制御部109等の各部の機能をCPU(中央処理装置)等の処理装置若しくは専用の電子回路で構成するようにしてもよい。
上述した実施形態における端末装置10をコンピュータで実現するようにしてもよい。その場合、この機能を実現するためのプログラムをコンピュータ読み取り可能な記録媒体に記録して、この記録媒体に記録されたプログラムをコンピュータシステムに読み込ませ、実行することによって実現してもよい。なお、ここでいう「コンピュータシステム」とは、OSや周辺機器等のハードウェアを含むものとする。また、「コンピュータ読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、ROM、CD−ROM等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置のことをいう。さらに「コンピュータ読み取り可能な記録媒体」とは、インターネット等のネットワークや電話回線等の通信回線を介してプログラムを送信する場合の通信線のように、短時間の間、動的にプログラムを保持するもの、その場合のサーバやクライアントとなるコンピュータシステム内部の揮発性メモリのように、一定時間プログラムを保持しているものも含んでもよい。また上記プログラムは、前述した機能の一部を実現するためのものであってもよく、さらに前述した機能をコンピュータシステムにすでに記録されているプログラムとの組み合わせで実現できるものであってもよく、FPGA(Field Programmable Gate Array)等のプログラマブルロジックデバイスを用いて実現されるものであってもよい。
以上、この発明の実施形態について図面を参照して詳述してきたが、具体的な構成はこの実施形態に限られるものではなく、この発明の要旨を逸脱しない範囲の設計等も含まれる。
1 帳票データ管理システム
10 端末装置
20 帳票データ管理装置
30 ネットワーク
101 カメラ
102 表示部
103 フレーム画像取得部
104 記憶部
105 文字認識部
106 選択部
107 認識データ管理部
108 通信部
109 制御部
1041 フレーム画像記憶部
1042 アプリケーション記憶部

Claims (4)

  1. 帳票を連続して撮像するカメラから得られる複数のフレーム画像を取得するフレーム画像取得部と、
    前記複数のフレーム画像のそれぞれについて文字認識処理を行う文字認識部と、
    前記文字認識部によって得られた文字認識結果と、当該文字認識結果が得られたフレーム画像とを出力する認識データ管理部と、
    を有する端末装置。
  2. 前記文字認識結果が得られたフレーム画像のうち保存条件を満たすフレーム画像を選択する選択部を有し、
    前記認識データ管理部は、
    前記文字認識結果と、前記選択部によって選択されたフレーム画像とを出力する
    請求項1記載の端末装置。
  3. コンピュータを、請求項1または請求項2に記載の端末装置として動作させるためのプログラムであって、前記コンピュータを前記端末装置が備える各部として機能させるためのプログラム。
  4. フレーム画像取得部が、帳票を連続して撮像するカメラから得られる複数のフレーム画像を取得し、
    文字認識部が、前記複数のフレーム画像のそれぞれについて文字認識処理を行い、
    認識データ管理部が、前記文字認識部によって得られた文字認識結果と、当該文字認識結果が得られたフレーム画像とを出力する
    画像管理方法。
JP2018229396A 2018-12-06 2018-12-06 端末装置、プログラム、画像管理方法 Pending JP2020091748A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2018229396A JP2020091748A (ja) 2018-12-06 2018-12-06 端末装置、プログラム、画像管理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2018229396A JP2020091748A (ja) 2018-12-06 2018-12-06 端末装置、プログラム、画像管理方法

Publications (1)

Publication Number Publication Date
JP2020091748A true JP2020091748A (ja) 2020-06-11

Family

ID=71013818

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018229396A Pending JP2020091748A (ja) 2018-12-06 2018-12-06 端末装置、プログラム、画像管理方法

Country Status (1)

Country Link
JP (1) JP2020091748A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7204852B1 (ja) 2021-09-30 2023-01-16 アニコム ホールディングス株式会社 ペット保険査定支援装置、ペット保険査定支援システム、ペット保険査定支援方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005055969A (ja) * 2003-08-06 2005-03-03 Hitachi Ltd 携帯情報端末
JP2005216102A (ja) * 2004-01-30 2005-08-11 Toshiba Solutions Corp 携帯情報端末及び携帯情報端末による画像処理方法
JP2012205089A (ja) * 2011-03-25 2012-10-22 Toshiba Corp 情報処理装置、情報処理方法、及び情報処理プログラム
JP2015504220A (ja) * 2012-01-09 2015-02-05 クアルコム,インコーポレイテッド Ocrキャッシュ更新
JP2018125658A (ja) * 2017-01-31 2018-08-09 キヤノン株式会社 カメラ機能を有する携帯可能な情報処理装置、その表示制御方法、及びプログラム
JP2018159978A (ja) * 2017-03-22 2018-10-11 株式会社東芝 情報処理装置、方法及びプログラム

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005055969A (ja) * 2003-08-06 2005-03-03 Hitachi Ltd 携帯情報端末
JP2005216102A (ja) * 2004-01-30 2005-08-11 Toshiba Solutions Corp 携帯情報端末及び携帯情報端末による画像処理方法
JP2012205089A (ja) * 2011-03-25 2012-10-22 Toshiba Corp 情報処理装置、情報処理方法、及び情報処理プログラム
JP2015504220A (ja) * 2012-01-09 2015-02-05 クアルコム,インコーポレイテッド Ocrキャッシュ更新
JP2018125658A (ja) * 2017-01-31 2018-08-09 キヤノン株式会社 カメラ機能を有する携帯可能な情報処理装置、その表示制御方法、及びプログラム
JP2018159978A (ja) * 2017-03-22 2018-10-11 株式会社東芝 情報処理装置、方法及びプログラム

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7204852B1 (ja) 2021-09-30 2023-01-16 アニコム ホールディングス株式会社 ペット保険査定支援装置、ペット保険査定支援システム、ペット保険査定支援方法
WO2023054397A1 (ja) * 2021-09-30 2023-04-06 アニコム ホールディングス株式会社 ペット保険査定支援装置、ペット保険査定支援システム、ペット保険査定支援方法
JP2023051063A (ja) * 2021-09-30 2023-04-11 アニコム ホールディングス株式会社 ペット保険査定支援装置、ペット保険査定支援システム、ペット保険査定支援方法

Similar Documents

Publication Publication Date Title
US9729744B2 (en) System and method of border detection on a document and for producing an image of the document
JP6856091B2 (ja) 10指指紋カード入力装置、10指指紋カード入力方法、及び記憶媒体
JP2010218061A (ja) 画像処理装置
CN110869944A (zh) 使用移动设备读取测试卡
JP6574921B1 (ja) 画像処理システム、画像処理方法、及びプログラム
CN105574428A (zh) 审批装置、审批系统以及审批方法
US8646691B2 (en) Apparatus and method for using machine-readable codes
US20160350622A1 (en) Augmented reality and object recognition device
JP5788447B2 (ja) 保険証券の情報取得システム
JP2020091748A (ja) 端末装置、プログラム、画像管理方法
JP7076216B2 (ja) 撮像制御装置、撮像制御方法、及びプログラム
CN105100616B (zh) 一种图像处理方法及电子设备
JP2012205089A (ja) 情報処理装置、情報処理方法、及び情報処理プログラム
JP2019220069A (ja) カード番号認識装置およびカード番号認識方法
JP7131637B2 (ja) 物体とn次元シンボルとを関連付けるシステム
JP2017097859A (ja) 情報処理装置と、その処理方法及びプログラム
JP2019120984A (ja) 帳票データ管理装置、帳票データ管理方法
US10437528B2 (en) Content management system, content management method, and recording medium
JP6565763B2 (ja) 撮影装置、撮影システム、及び撮影プログラム
JP2019120983A (ja) 撮像制御装置および撮像制御方法
JP6235105B1 (ja) 情報処理装置、情報処理方法、およびプログラム
JP6705984B2 (ja) 情報処理装置と、その処理方法及びプログラム
JP6875061B2 (ja) 画像判定システム、画像判定方法、画像判定プログラム、画像判定プログラムを記録する記録媒体
CN109831482A (zh) 营业执照办理系统、方法、用户终端和服务器
JP2019091318A (ja) 情報処理装置、及びプログラム

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190115

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20211206

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20221209

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20221220

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20230209

A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A711

Effective date: 20230210

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20230220

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20230210

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20230221

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230418

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20230516