JP2022055011A - Information processing device, information processing method, and program - Google Patents
Information processing device, information processing method, and program Download PDFInfo
- Publication number
- JP2022055011A JP2022055011A JP2020162350A JP2020162350A JP2022055011A JP 2022055011 A JP2022055011 A JP 2022055011A JP 2020162350 A JP2020162350 A JP 2020162350A JP 2020162350 A JP2020162350 A JP 2020162350A JP 2022055011 A JP2022055011 A JP 2022055011A
- Authority
- JP
- Japan
- Prior art keywords
- document
- image
- similarity
- past
- storage area
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Abstract
Description
本開示は、書類サイズを決定する情報処理の技術に関する。 The present disclosure relates to information processing techniques for determining document size.
2015年9月の電子帳簿保存法の改正により、規定の解像度を満たせばスマートフォンまたはデジタルカメラ等が、領収書や請求書といった国税関係書類の読み取り及び電子保存を行うことができる装置の対象となった。一方、国税関係書類を受領者(つまり帳簿保存義務者)以外の者が読み取りを行う場合、電子帳簿保存法の規定によれば、大きさに関する情報の保存を行う必要がある。 Due to the revision of the Electronic Bookkeeping Law in September 2015, smartphones or digital cameras, etc., that meet the specified resolution will be subject to devices that can read and electronically store national tax-related documents such as receipts and invoices. rice field. On the other hand, when a person other than the recipient (that is, the person who is obliged to keep the books) reads the national tax-related documents, it is necessary to save the information on the size according to the provisions of the Electronic Bookkeeping Law.
特許文献1では、撮影した画像から取得した書類領域の画素数サイズが、書面の実際のサイズに対応する基準の画素数サイズ以上か否かを確認し、その確認結果をユーザーに知らせる技術が開示されている。 Patent Document 1 discloses a technique for confirming whether or not the pixel number size of the document area acquired from the captured image is equal to or larger than the standard pixel number size corresponding to the actual size of the document, and notifying the user of the confirmation result. Has been done.
しかしながら、特許文献1では、スマートフォンやデジタルカメラ等で読み取った書類画像の画素数サイズが既定の解像度を満たしたか否かの判定をするに過ぎない。つまり、実際の書類サイズの推定は行うことができない。このため受領者以外の者が書類画像を撮影する場合、国税関係書類の横にメジャーなどサイズが測定できるものを置いて、そのメジャーと書類とを合わせて撮影する必要があり煩雑である。 However, Patent Document 1 merely determines whether or not the pixel number size of the document image read by a smartphone, a digital camera, or the like satisfies a predetermined resolution. That is, the actual document size cannot be estimated. For this reason, when a person other than the recipient takes a picture of a document, it is necessary to place a measure or the like that can measure the size next to the national tax-related document and take the picture together with the measure, which is complicated.
そこで本開示は、撮影した書類のサイズを容易に決定することを目的とする。 Therefore, it is an object of the present disclosure to easily determine the size of the photographed document.
本開示の一態様に係るプログラムは、コンピュータを、書類を撮影することによって得られた撮影画像を取得する取得手段と、前記撮影画像と、記憶領域に記憶されている少なくとも1つ以上の過去書類画像と、の類似度をそれぞれ決定する第一決定手段と、前記第一決定手段で決定した前記類似度が一定値以上の前記過去書類画像の書類サイズの値を前記書類の書類サイズとして決定する第二決定手段と、として機能させることを特徴とする。 In the program according to one aspect of the present disclosure, a computer obtains a photographed image obtained by photographing a document, the photographed image, and at least one or more past documents stored in a storage area. The document size of the past document image whose similarity is equal to or greater than a certain value is determined as the document size of the document, and the first determining means for determining the similarity between the image and the image. It is characterized by functioning as a second determination means.
本開示によれば撮影した書類のサイズを容易に決定することができる。 According to the present disclosure, the size of the photographed document can be easily determined.
以下、本開示の実施形態について、図面を参照して説明する。なお、以下の実施形態は本開示を限定するものではなく、また、本実施形態で説明されている特徴の組み合わせの全てが本開示の解決手段に必須のものとは限らない。なお、同一の構成については、同じ符号を付して説明する。 Hereinafter, embodiments of the present disclosure will be described with reference to the drawings. It should be noted that the following embodiments do not limit the present disclosure, and not all combinations of features described in the present embodiment are essential for the means of solving the present disclosure. The same configuration will be described with the same reference numerals.
実施形態の説明に先立って、書類サイズの取得に関する補足説明をする。1998年7月から施行されている電子帳簿保存法(正式には「電子計算機を使用して作成する国税関係帳簿書類の保存方法等の特例に関する法律(平成10年法律第25号)」)が、2005年4月に一部改正された。改正後、3万円未満の領収書や請求書等はあらかじめ所轄の税務署長の承認を受けていれば電子保存の対象となっている。 Prior to the description of the embodiment, a supplementary explanation regarding the acquisition of the document size will be given. The Electronic Bookkeeping Law, which has been in force since July 1998 (formally, "Law Concerning Special Provisions for Saving National Tax-related Book Documents Created Using Electronic Computers (Act No. 25 of 1998)") , Partially revised in April 2005. After the revision, receipts and invoices of less than 30,000 yen will be subject to electronic storage if the approval of the tax office chief in charge is obtained in advance.
2015年9月にさらに改正があり、読み取りを行う装置について「原稿台と一体となったもの」に限定する要件が廃止され、スマートフォンやデジタルカメラ等も利用可能となった。国税関係書類の読み取りを行う場合、大きさに関する情報の保存を行う必要がある(書類がA4以下で受領者等が読み取りを行う場合には不要)。しかしながら、スマートフォンやデジタルカメラ等を用いる場合、カメラと各種センサーから書類サイズを大まかに推定することは可能なものの、スキャナ相当の精度で書類サイズの決定を行うことは難しい。 There was a further revision in September 2015, and the requirement to limit the reading device to "integrated with the manuscript stand" was abolished, and smartphones, digital cameras, etc. became available. When reading national tax-related documents, it is necessary to save information on the size (not necessary when the documents are A4 or smaller and the recipient etc. reads them). However, when using a smartphone, a digital camera, or the like, although it is possible to roughly estimate the document size from the camera and various sensors, it is difficult to determine the document size with an accuracy equivalent to that of a scanner.
そこで以下では、撮影した書類画像と類似した過去書類画像を用いることで、読み取った書類のサイズをより高い精度で決定する実施形態を説明する。 Therefore, in the following, an embodiment in which the size of the read document is determined with higher accuracy by using the past document image similar to the captured document image will be described.
<実施形態1>
本実施形態に係る情報処理装置の一例として、モバイル端末を例に説明する。モバイル端末は、携帯通信端末の一例であり、無線通信機能などを実装しており自由な場所で利用できる端末である。
<Embodiment 1>
As an example of the information processing apparatus according to the present embodiment, a mobile terminal will be described as an example. A mobile terminal is an example of a mobile communication terminal, and is a terminal that is equipped with a wireless communication function and can be used in any place.
図1は、モバイル端末の外観の一例を示す図である。図1(a)はモバイル端末100の表側のモバイル端末前面部101を示す。モバイル端末前面部101にはタッチパネル102が備わっている。タッチパネル102は、ディスプレイ等の表示部の一例であり、出力(表示)と入力との2つの機能を備えている。図1(b)は、図1(a)のモバイル端末100の裏側のモバイル端末背面部103を示す。モバイル端末背面部103は画像を取り込むためのカメラ104を備える。図1(c)は、モバイル端末100のカメラ104で画像を撮影する対象の被写体105を示す。本実施形態では、モバイル端末100のユーザーは、被写体105を後述のモバイルアプリを通じて撮影することによって、モバイル端末100において後述する処理が開始される。本実施形態で説明する被写体105は、例えば、領収書や請求書などの紙文書である。後述のモバイルアプリは、被写体105の画像を取り込み、タッチパネル102にその画像を出力することができる。
FIG. 1 is a diagram showing an example of the appearance of a mobile terminal. FIG. 1A shows the
図2は、モバイル端末100のハードウェアの構成の一例を示す図である。モバイル端末100は、CPU201、RAM202、ROM203、Input/Outputインターフェース204、NIC205、及びカメラユニット206を有する。CPU(Central Processing Unit)201は、モバイルアプリの各種プログラムを実行し、様々な機能を実現するユニットである。RAM(Random Access Memory)202は、各種の情報を記憶するユニットである。また、RAM202は、CPU201の一時的な作業記憶領域としても利用されるユニットである。ROM(Read Only Memory)203は、各種のプログラム等を記憶するユニットである。例えば、CPU201は、ROM203に記憶されているプログラムをRAM202にロードしてプログラムを実行する。また、CPU201はフラッシュメモリ、HDD(Hard Disk Drive)又はSSD(Solid State Disk)といった外部記憶装置に記憶されているプログラムに基づき処理を実行する。これにより、図3に示されるようなモバイル端末100において機能するソフトウェア構成及び後述するシーケンスの各ステップの処理が実現される。なお、モバイル端末100の機能及び後述するシーケンスに係る処理の全部又は一部については専用のハードウェアを用いて実現してもよい。
FIG. 2 is a diagram showing an example of the hardware configuration of the
Input/Outputインターフェース204は、タッチパネル102に対して、表示データの送信及びタッチパネル102から送信される入力情報の受信を行う。NIC(Network Interface Card)205は、モバイル端末100をネットワーク(不図示)に接続するためのユニットである。NIC205は概念的なものであって、無線でネットワークに接続しても良い。カメラユニット206は、カメラ104と接続し被写体105の画像をモバイル端末100に取り込む。バス207は、上述した各ユニット間で送受信を行うためのデータ通信路である。
The Input /
図3は、モバイル端末100のソフトウェア構成の一例を示す図である。以下、本実施形態におけるモバイル端末100のおけるソフトウェア構成について説明する。図3に示される各ソフトウェア(アプリケーション)における機能(モジュール部)を実現するプログラムは、モバイル端末100のROM203等に記憶されている。
FIG. 3 is a diagram showing an example of the software configuration of the
モバイル端末100のユーザーは、モバイル端末100のOSのインストール機能を利用することによって、モバイルアプリケーション(以下、モバイルアプリとよぶ)302のダウンロードとインストールが可能である。また、モバイルアプリ302はCPU201によって実行可能である。モバイルアプリ302は、カメラユニット206を介して取り込んだ被写体105の画像に対する各種のデータ処理を行う。モバイルアプリ302は、複数のモジュール部を有する。具体的には、モバイルアプリ302は、メイン制御部303、情報表示部304、操作情報取得部305、画像解析部306、OCR部307、記憶部308、DB部309、座標処理部310、及び画像特徴量抽出部311を有する。
The user of the
メイン制御部303は、モバイル端末100用のモバイルアプリ302を制御し、後述する各モジュール部303~311に対する指示、表示制御、及び管理を行う。情報表示部304は、メイン制御部303からの指示に従い、モバイルアプリ302のユーザインタフェース(UI)をユーザーに提供する。
The
図4は、モバイルアプリ302のUI(携帯端末用のUI)を提供する画面の一例を示す図である。モバイル端末画面400は、モバイル端末100のタッチパネル102に表示される。また、モバイル端末画面400における表示領域401には、カメラ104を介して取り込んだ画像が表示される。操作情報取得部305は、画像等に対するユーザーによる操作を、表示されたUIを介して受け付ける。なお、モバイルアプリ302のUIの形態(位置、大きさ、範囲、配置、表示内容など)は、図に示す形態に限定されるものではなく、任意の構成を採用することができる。
FIG. 4 is a diagram showing an example of a screen that provides a UI (UI for a mobile terminal) of the
再び図3に戻り、モバイルアプリ302の各モジュール部の説明を行う。操作情報取得部305は、情報表示部304により表示されたモバイルアプリ302のUIに対するユーザー操作の情報を取得し、取得した情報をメイン制御部303に通知する。例えば、表示領域をユーザーが手で触れると、操作情報取得部305は、触れられた画面上の位置の情報を感知し、感知した位置の情報をメイン制御部303に送信する。
Returning to FIG. 3 again, each module portion of the
画像解析部306は、カメラユニット206を介して取得した画像、すなわち、カメラ104を用いて撮影された画像を解析して、レイアウト情報を生成する。レイアウト情報には、画像から抽出された矩形領域とその種別(文字、図形、線、表など)とが含まれる。さらに画像解析部306は、カメラ入力画像に対して紙面検出処理や歪み補正処理を行う。また、カメラユニット206は、単にスチール撮影を行えるだけでなく、高速で静止画を取得できる動画撮影機能、または連写機能も備える。
The
OCR部307は、画像解析部306で抽出した矩形領域に対して、OCR(光学文字認識)処理を行う。記憶部308は、操作情報取得部305により取得された値、すなわち、モバイルアプリ302のUIを介してユーザーにより入力された値を保存する。また、記憶部308は、後述するDB部309で管理されるデータなどを記憶する。
The
DB部309はデータベース機能を有し、過去に撮影した書類に対応する矩形領域の座標情報、画像の特徴量、画像処理後の画像などを管理する。座標処理部310は、画像の位置特定処理や、データベースへ座標情報を登録する際の座標変換処理を行う。座標処理部310は、後述する画像特徴量抽出部311によって抽出された画像の特徴量(以下、画像特徴量という)を用いて、画像の位置特定処理を行う。
The
画像特徴量抽出部311は、カメラによって撮影された画像に対して、画像特徴量の抽出処理を行う。画像特徴量とは、画像内の特徴的な箇所を特定するための情報であり、例えば全体画像内における局所画像の対応位置を特定するために用いられる。画像特徴量を抽出する方法としてはSIFT、SURF、HOGなどの決定方法が挙げられる。抽出された画像特徴量は、位置を特定するためと画像間の類似度決定に用いられる。
The image feature
図5は、モバイルアプリ302の処理フローである。以下、モバイルアプリ302を用いて被写体を撮影して得られた画像から書類サイズを決定する処理を説明する。前述のように、図5に示すフローチャートは、モバイル端末100のモバイルアプリ302が実行する処理である。すなわち、ROM203に格納されたモバイルアプリ302のプログラムをCPU201がRAM202に展開して実行することで実現される。
FIG. 5 is a processing flow of the
本フローは、モバイル端末100にて被写体105を撮影し、得られた画像をモバイルアプリ302が取得することによって開始することとする。なお、各処理の説明における記号「S」は、当該フローチャートにおけるステップであることを意味する。S501において、メイン制御部303はカメラユニット206から被写体105を含む撮影画像を取得する。S502において、メイン制御部303は画像解析部306に対してS501で取得した撮影画像の解析を指示する。画像解析部306は撮影画像から、ゆがみ補正を行った後、書類部分の抽出を行う。また画像解析部306は必要に応じて色味補正や二値化処理を行っても良い。またメイン制御部303は撮影画像を画像特徴量抽出部311に入力し、画像特徴量抽出部311は抽出した画像特徴量をRAM202に一時的に記憶する。
This flow is started by taking a picture of the subject 105 with the
S503において、メイン制御部303はカメラユニット206から撮影時のフォーカス値を取得する。フォーカス値は、例えば0.0(近接撮影時)から1.0(無限遠撮影時)で表される。
In S503, the
S504において、メイン制御部303はS501~S503で決定した撮影画像のパラメータ群(書類部分の画像、書類部分の画素数、及び画像特徴量)と、DB部309に記憶されている過去に撮影した画像のパラメータ群と、から類似度を決定する。画像間の類似度決定方法として、色ヒストグラムを用いた方法、画像特徴量の距離で比較する方法、または機械学習を用いた方法が挙げられる。具体的な類似度決定の流れとして画像特徴量の距離から類似度を求める方法を例に挙げる。この場合まず、文字認識結果を含む特徴量から、例えばタイトル、日付、金額などの各項目の領域を特定する。次に、撮影画像と、DBに登録されている画像との間で、特定した各項目の領域同士の距離を比較し、距離が近いほど、類似度が高いと判定する、という流れとなる。また、複数の方法を採用することで精度を高めても良い。
In S504, the
また、書類部分の画素数とS503で取得したフォーカス値を用いることによって、類似度決定の精度を高めても良い。具体的には特徴の似た2つの異なるサイズの書類がある場合、単に画像を基に類似度を決定すると、類似度が高いと誤判定されてしまう。このような誤判定を防ぐために、書類部分の画素数とS503で取得したフォーカス値から、大まかな書類サイズを推定する。推定した書類サイズも類似度決定の追加パラメータとすることで特徴の似た異なるサイズの書類の類似度決定精度を向上させることができる。ここで補足すると、上述したような類似度決定は、手書き文字を考慮して類似度を決定してもよいし、手書き文字を除いた状態で類似度を決定してもよい。また、フォーカス値から推定した書類サイズを追加パラメータにしない場合、S503の処理は不要であり、その場合はS504へ遷移する。 Further, the accuracy of determining the similarity may be improved by using the number of pixels of the document portion and the focus value acquired in S503. Specifically, when there are two documents of different sizes with similar characteristics, if the similarity is simply determined based on the image, it will be erroneously determined that the similarity is high. In order to prevent such an erroneous determination, a rough document size is estimated from the number of pixels of the document portion and the focus value acquired in S503. By using the estimated document size as an additional parameter for determining the similarity, it is possible to improve the accuracy of determining the similarity of documents having similar characteristics and different sizes. Supplementally, in the similarity determination as described above, the similarity may be determined in consideration of the handwritten characters, or the similarity may be determined in a state where the handwritten characters are excluded. Further, if the document size estimated from the focus value is not used as an additional parameter, the processing of S503 is unnecessary, and in that case, the process proceeds to S504.
S505において、メイン制御部303はS504で類似度を決定した過去の書類画像(以下、過去書類画像という)の中から、一定値(所定の閾値)以上の類似度を持つ過去書類画像があるか判定する。一定値以上の類似度を持つ過去書類画像があった場合、S507に遷移する。一方で、一定値以上の類似度を持つ過去書類画像がなかった場合S506に遷移する。S506において、メイン制御部303は情報表示部304に対して図4の書類サイズ登録画面を表示するよう指示する。図4の書類サイズ登録画面では、撮影した書類部分の画像を撮影画像表示領域401に表示し、書類サイズの入力スペースをサイズ入力領域402に表示している。ユーザーは撮影画像表示領域401で撮影した書類を確認したのち、サイズ入力領域に任意の書類サイズを入力し、登録ボタン403を押下することによって書類サイズの決定(登録)を行うことができる。
In S505, is there a past document image having a similarity of a certain value (predetermined threshold value) or more from the past document images (hereinafter referred to as past document images) whose similarity is determined by the
S507において、メイン制御部303は類似度の最も高い過去書類画像に対応する書類サイズと過去書類画像とをDB部309から取得する。本実施形態では書類サイズ決定のために、類似度が最も高い過去書類画像の書類サイズを取得したが、これに限らず一定値以上の類似度をもつ過去書類画像であれば、任意の基準でDB部309から取得しても構わない。S508において、メイン制御部303はS507で取得した類似度の最も高い過去書類画像に対応する書類サイズと過去書類画像を用いて類似書類が存在した場合の書類サイズ登録画面を表示するよう情報表示部304に指示する。類似書類が存在した場合にS508で表示される書類サイズ登録画面のことを第一登録画面ともいう。また、図4のように、類似書類が存在しない場合にS506で表示される書類サイズ登録画面のことを第二登録画面という。
In S507, the
図6は、撮影画像との類似度が所定の閾値よりも高くなった過去書類画像が存在した場合に、類似度が最も高い過去書類画像のサイズ情報に基づいて表示される書類サイズ登録画面(第一登録画面)である。図6の撮影画像表示領域601では、S501で入力した画像ではなく、S501で入力した画像に対して類似度が最も高い過去書類画像を表示する。また、サイズ入力領域602には、S507で取得した類似度の最も高い過去書類画像に対応する書類サイズが予め入力された状態にしておく。ここで、撮影画像表示領域601に表示されている画像は、サイズ入力領域602に入力されている推定サイズの推定元の画像である旨の説明を画面上に表示する。このとき、ユーザーが撮影画像と、過去書類画像と、がどの程度類似していたのか認識するために、画面上に類似度を表示してもよい。また、ユーザーは予め入力された書類サイズの変更を行うことができる。ユーザーは登録ボタン603にて書類サイズの決定(登録)を行うことができる。つまり、予め入力された書類サイズが正しいとユーザーが判断して登録ボタン603を押下すると、予め入力された書類サイズで、撮影画像の書類サイズが決定される。ユーザーが書類サイズの変更を行った後に登録ボタン603が押下されると、変更後の書類サイズで、撮影画像の書類サイズが決定される。
FIG. 6 is a document size registration screen displayed based on the size information of the past document image having the highest similarity when there is a past document image having a similarity with the captured image higher than a predetermined threshold value (FIG. 6). First registration screen). In the captured
登録ボタン403及び603が押下された場合、S509においてメイン制御部303は撮影した画像と、サイズ入力領域402及び602で入力されたサイズと、を対応付けてDB部309に登録する。この時、その他のパラメータ群をDB部309に登録しても良い。
When the
以上の処理により、撮影した書類のサイズを容易に決定することができる。また、DB部309に過去書類画像が増えるほど、書類サイズ決定のための類似画像が増えるため精度を増すことができる。加えて、撮影の際にメジャー等の長さを測定するための道具を用意する必要をなくすことができる。
By the above processing, the size of the photographed document can be easily determined. Further, as the number of past document images increases in the
<実施形態2>
実施形態1では、類似度の最も高い過去書類画像に対応する書類サイズをS508で表示していた。しかし、S504で行う類似度決定は誤差があり得るため、必ずしも常に適切な決定ができるとは限らない。そこで、実施形態2では、実施形態1で示したモバイル端末100及びモバイルアプリ302において、候補となる類似度の近い過去書類画像が複数存在した場合の処理方法を追加した実施形態を説明する。
<Embodiment 2>
In the first embodiment, the document size corresponding to the past document image having the highest degree of similarity is displayed in S508. However, since the similarity determination performed in S504 may have an error, it is not always possible to make an appropriate determination. Therefore, in the second embodiment, an embodiment in which a processing method is added when a plurality of past document images having similar similarities as candidates exist in the
図7は、候補となる類似度の近い過去書類画像が複数存在した場合のモバイルアプリ302の処理フローである。なお、図7のうち図5と同じステップ番号の箇所は実施形態1と同様の処理を行っている。つまり、図7のS501~S504において、上述した図5と同様に、撮影によって書類画像を取得し、取得した撮影画像に画像認識処理を行い、類似度決定に必要なパラメータ群を取得する。取得したパラメータ群に基づき書類サイズ撮影画像と過去書類画像との類似度を決定する。
FIG. 7 is a processing flow of the
S701において、メイン制御部303は類似度の高い過去書類画像が存在するか判定する。このとき、最も類似度が高い過去書類画像と、最も類似度が高い過去書類画像に近しい類似度の過去書類画像と、が存在する場合、複数の過去書類画像を書類サイズ決定のための候補と判定する。最も類似度が高い過去書類画像に近しい類似度とは、当該最も高い類似度からの差が所定の範囲内の類似度のことである。所定の範囲は、適宜設定することができる。S702において、メイン制御部303はDB部309から候補と判定された過去書類画像と、その過去書類画像に対応する書類サイズと、を取得する。候補と判定された過去書類画像が複数存在する場合にはそれぞれに対応する書類サイズと過去書類画像を取得する。S703において、候補と判定された過去書類画像が複数存在する場合S704へ、複数存在しない場合にはS508へ遷移する。
In S701, the
図8は、同一書類選択画面である。S704において、メイン制御部303は情報表示部304に対して同一書類選択画面の表示を指示する。同一書類選択画面では、S702で取得した複数の過去書類画像を書類サイズ決定のための候補画像として同一書類候補表示領域801に表示し、選択可能状態とする。ユーザーが同一書類であると選択した過去書類画像を類似書類とし、S508の処理に移る。図8に示すように、類似度の高い過去書類画像が複数存在し同一書類候補表示領域801に入りきらない場合でもタッチパネル102をスライド操作した場合に他の類似度の高い過去書類画像を表示するようにしても良い。
FIG. 8 is the same document selection screen. In S704, the
以上の処理により、類似度が高い過去書類画像が複数存在した場合であっても、ユーザーが候補画像を選択可能とすることによって、撮影した書類のサイズを容易に決定することができる。 By the above processing, even when there are a plurality of past document images having a high degree of similarity, the size of the photographed document can be easily determined by allowing the user to select a candidate image.
<その他の実施形態>
上記の実施形態ではスマートフォンを使用した場合の書類サイズ決定を例に挙げたが、これに限らず、例えばデジタルカメラで撮った撮影画像をPCにて処理する形態のものであってもよい。また、画像のデータベース機能を有するDB部は情報処理装置の内部ではなく、クラウドサーバーのような外部サーバーが有する形態であってもよい。この形態の場合、端末への負荷軽減や、データ消失の恐れがなくなる等のメリットがある。加えて、より多くの帳票が登録することが可能となるため、類似度の精度も高めることができる。
<Other embodiments>
In the above embodiment, the document size determination when a smartphone is used is given as an example, but the present invention is not limited to this, and for example, a photographed image taken by a digital camera may be processed by a PC. Further, the DB unit having the image database function may not be inside the information processing device but may be in the form of an external server such as a cloud server. In the case of this form, there are merits such as reduction of the load on the terminal and eliminating the risk of data loss. In addition, since more forms can be registered, the accuracy of similarity can be improved.
また、本発明は、以下の処理を実行することによっても実現される。即ち、上述した実施形態の機能を実現するソフトウェア(プログラム)を、ネットワーク又は各種記憶媒体を介してシステム或いは装置に供給し、そのシステム或いは装置のコンピュータ(又はCPUやMPU等)がプログラムを読み出して実行する処理である。 The present invention is also realized by executing the following processing. That is, software (program) that realizes the functions of the above-described embodiment is supplied to the system or device via a network or various storage media, and the computer (or CPU, MPU, etc.) of the system or device reads the program. This is the process to be executed.
Claims (19)
書類を撮影することによって得られた撮影画像を取得する取得手段と、
前記撮影画像と、記憶領域に記憶されている少なくとも1つ以上の過去書類画像と、の類似度をそれぞれ決定する第一決定手段と、
前記第一決定手段で決定した前記類似度が一定値以上の前記過去書類画像に対応付けて前記記憶領域に記憶されている書類サイズの値を、前記書類の書類サイズとして決定する第二決定手段と、
として機能させることを特徴とするプログラム。 Computer,
An acquisition method for acquiring captured images obtained by photographing documents, and
A first-determining means for determining the degree of similarity between the captured image and at least one or more past document images stored in the storage area.
The second determination means for determining the value of the document size stored in the storage area in association with the past document image having the similarity of a certain value or more determined by the first determination means as the document size of the document. When,
A program characterized by functioning as.
前記第一決定手段で決定した前記類似度が一定値以上の前記過去書類画像に対応付けて前記記憶領域に記憶されている書類サイズの値を第一登録画面に表示させる表示制御手段としてさらに機能させ、
前記第二決定手段は、所定の操作があった場合に、前記第一登録画面に表示されている前記書類サイズの値を、前記書類の書類サイズとして決定する
ことを特徴とする請求項1乃至3にいずれか一項に記載のプログラム。 The computer
Further functions as a display control means for displaying the value of the document size stored in the storage area in association with the past document image whose similarity is equal to or higher than a certain value determined by the first determination means on the first registration screen. Let me
The second determination means is characterized in that, when a predetermined operation is performed, the value of the document size displayed on the first registration screen is determined as the document size of the document. The program described in any one of Section 3.
前記書類サイズの値に加えて、前記書類サイズの値に対応付けられて前記記憶領域に記憶されている前記過去書類画像を前記第一登録画面に表示させる
ことを特徴とする請求項4に記載のプログラム。 The display control means is
The fourth aspect of claim 4 is characterized in that, in addition to the document size value, the past document image associated with the document size value and stored in the storage area is displayed on the first registration screen. Program.
ユーザーからの操作に応じて前記第一登録画面に表示されている前記書類サイズの値を変更し、その後、前記所定の操作があった場合、前記変更した値を前記書類の書類サイズとして決定する
ことを特徴とする請求項4または5に記載のプログラム。 The second determination means is
The value of the document size displayed on the first registration screen is changed according to the operation from the user, and then, when the predetermined operation is performed, the changed value is determined as the document size of the document. The program according to claim 4 or 5.
前記記憶領域に記憶されている前記過去書類画像のうちで前記類似度が一定値以上の前記過去書類画像が複数存在する場合には当該複数の過去書類画像のうち一つの過去書類画像の選択を受け付ける選択画面を表示させ、
第二決定手段は、
前記選択画面にて選択された前記過去書類画像の書類サイズの値を前記撮影画像の前記書類の書類サイズとして決定する
ことを特徴とする請求項4または5に記載のプログラム。 The display control means is
When there are a plurality of the past document images having the similarity of a certain value or more among the past document images stored in the storage area, the past document image of one of the plurality of past document images is selected. Display the acceptance selection screen and display
The second decision method is
The program according to claim 4 or 5, wherein the value of the document size of the past document image selected on the selection screen is determined as the document size of the document of the photographed image.
前記類似度が一定値以上の前記過去書類画像がない場合には、書類サイズの入力を受け付ける第二登録画面を表示させ、
第二決定手段は、前記第二登録画面にて受け付けた前記書類サイズを、前記書類の前記書類サイズとして決定する
ことをさらに含む請求項4または5に記載のプログラム。 The display control means is
If there is no past document image whose similarity is above a certain value, a second registration screen that accepts document size input is displayed.
The program according to claim 4 or 5, further comprising determining the document size received on the second registration screen as the document size of the document.
書類を撮影することによって得られた撮影画像を取得する取得手段と、
前記撮影画像と、記憶領域に記憶されている少なくとも1つ以上の過去書類画像と、の類似度をそれぞれ決定する第一決定手段と、
前記第一決定手段で決定した前記類似度が一定値以上の前記過去書類画像に対応付けて前記記憶領域に記憶されている書類サイズの値を、登録画面に表示させる表示制御手段と、
として機能させることを特徴とするプログラム。 Computer,
An acquisition method for acquiring captured images obtained by photographing documents, and
A first-determining means for determining the degree of similarity between the captured image and at least one or more past document images stored in the storage area.
A display control means for displaying the value of the document size stored in the storage area in association with the past document image having a similarity of a certain value or more determined by the first determination means on the registration screen.
A program characterized by functioning as.
前記撮影画像と、記憶領域に記憶されている少なくとも1つ以上の過去書類画像と、の類似度をそれぞれ決定するステップと、
決定した前記類似度が一定値以上の前記過去書類画像に対応付けて前記記憶領域に記憶されている書類サイズの値を、前記書類の書類サイズとして決定するステップと、
を有することを特徴とする制御方法。 The steps to acquire the captured image obtained by capturing the document, and
A step of determining the degree of similarity between the captured image and at least one or more past document images stored in the storage area, respectively.
A step of determining the value of the document size stored in the storage area in association with the determined past document image having a similarity of a certain value or more as the document size of the document.
A control method characterized by having.
前記撮影画像と、記憶領域に記憶されている少なくとも1つ以上の過去書類画像と、の類似度をそれぞれ決定する第一決定手段と、
前記第一決定手段で決定した前記類似度が一定値以上の前記過去書類画像に対応付けて前記記憶領域に記憶されている書類サイズの値を、前記書類の書類サイズとして決定する第二決定手段と、
を有することを特徴とする情報処理装置。 An acquisition method for acquiring captured images obtained by photographing documents, and
A first-determining means for determining the degree of similarity between the captured image and at least one or more past document images stored in the storage area.
The second determination means for determining the value of the document size stored in the storage area in association with the past document image having the similarity of a certain value or more determined by the first determination means as the document size of the document. When,
An information processing device characterized by having.
前記撮影画像と、記憶領域に記憶されている少なくとも1つ以上の過去書類画像と、の類似度をそれぞれ決定するステップと、
決定した前記類似度が一定値以上の前記過去書類画像に対応付けて前記記憶領域に記憶されている書類サイズの値を、登録画面に表示させるステップと、
を有することを特徴とする制御方法。 The steps to acquire the captured image obtained by capturing the document, and
A step of determining the degree of similarity between the captured image and at least one or more past document images stored in the storage area, respectively.
A step of displaying the value of the document size stored in the storage area in association with the determined past document image having a similarity of a certain value or more on the registration screen.
A control method characterized by having.
前記撮影画像と、記憶領域に記憶されている少なくとも1つ以上の過去書類画像と、の類似度をそれぞれ決定する第一決定手段と、
前記第一決定手段で決定した前記類似度が一定値以上の前記過去書類画像に対応付けて前記記憶領域に記憶されている書類サイズの値を、登録画面に表示させる表示制御手段と、
を有することを特徴とする情報処理装置。 An acquisition method for acquiring captured images obtained by photographing documents, and
A first-determining means for determining the degree of similarity between the captured image and at least one or more past document images stored in the storage area.
A display control means for displaying the value of the document size stored in the storage area in association with the past document image having a similarity of a certain value or more determined by the first determination means on the registration screen.
An information processing device characterized by having.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020162350A JP2022055011A (en) | 2020-09-28 | 2020-09-28 | Information processing device, information processing method, and program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020162350A JP2022055011A (en) | 2020-09-28 | 2020-09-28 | Information processing device, information processing method, and program |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2022055011A true JP2022055011A (en) | 2022-04-07 |
Family
ID=80997794
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020162350A Pending JP2022055011A (en) | 2020-09-28 | 2020-09-28 | Information processing device, information processing method, and program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2022055011A (en) |
-
2020
- 2020-09-28 JP JP2020162350A patent/JP2022055011A/en active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107979709B (en) | Image processing apparatus, image processing system, control method, and computer readable medium | |
JP5896245B2 (en) | How to crop a text image | |
JP6971789B2 (en) | Information processing equipment, programs and information processing methods | |
WO2014086287A1 (en) | Text image automatic dividing method and device, method for automatically dividing handwriting entries | |
US10136011B2 (en) | Automatic scanning of document stack with a camera | |
JP5754653B2 (en) | Image control apparatus and program | |
JP7102103B2 (en) | Portable information processing equipment and methods and programs using the information processing equipment | |
CN102982160A (en) | Professional notebook convenient for electronization and automatic classification method of electronic documents of professional notebook | |
CN111950557A (en) | Error problem processing method, image forming apparatus and electronic device | |
JP2019012361A (en) | Information processor, program, and method for information processing | |
JP6574921B1 (en) | Image processing system, image processing method, and program | |
WO2014086272A1 (en) | Professional notebook convenient for electronization and method for adding same into electronic calendar | |
US10586099B2 (en) | Information processing apparatus for tracking processing | |
US10452943B2 (en) | Information processing apparatus, control method of information processing apparatus, and storage medium | |
JP2018046337A (en) | Information processing device, program and control method | |
JP6574920B1 (en) | Image processing system, image processing method, and program | |
JP6669390B2 (en) | Information processing apparatus, information processing method, and program | |
JP2015142226A (en) | Image processing apparatus, image processing method and computer program | |
US11436733B2 (en) | Image processing apparatus, image processing method and storage medium | |
WO2014086266A1 (en) | Professional notebook convenient for electronization and method for displaying electronic thumbnail thereof | |
JP2022055011A (en) | Information processing device, information processing method, and program | |
US20220269396A1 (en) | Dynamic targeting of preferred objects in video stream of smartphone camera | |
JP6540597B2 (en) | INFORMATION PROCESSING APPARATUS, INFORMATION PROCESSING METHOD, AND PROGRAM | |
JP6639257B2 (en) | Information processing apparatus and control method therefor | |
US9521270B1 (en) | Changing in real-time the perspective of objects captured in images |