JP7040000B2 - 画像処理装置および画像処理プログラム - Google Patents

画像処理装置および画像処理プログラム Download PDF

Info

Publication number
JP7040000B2
JP7040000B2 JP2017249294A JP2017249294A JP7040000B2 JP 7040000 B2 JP7040000 B2 JP 7040000B2 JP 2017249294 A JP2017249294 A JP 2017249294A JP 2017249294 A JP2017249294 A JP 2017249294A JP 7040000 B2 JP7040000 B2 JP 7040000B2
Authority
JP
Japan
Prior art keywords
date information
control unit
manuscript
date
character string
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2017249294A
Other languages
English (en)
Other versions
JP2019114193A (ja
Inventor
健太郎 金田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Seiko Epson Corp
Original Assignee
Seiko Epson Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Seiko Epson Corp filed Critical Seiko Epson Corp
Priority to JP2017249294A priority Critical patent/JP7040000B2/ja
Priority to US16/226,034 priority patent/US10936896B2/en
Priority to EP18215839.4A priority patent/EP3506155A1/en
Priority to CN201811591937.5A priority patent/CN109960684A/zh
Publication of JP2019114193A publication Critical patent/JP2019114193A/ja
Priority to US17/248,322 priority patent/US11749008B2/en
Application granted granted Critical
Publication of JP7040000B2 publication Critical patent/JP7040000B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • G06F40/126Character encoding
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/416Extracting the logical structure, e.g. chapters, sections or page numbers; Identifying elements of the document, e.g. authors
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/153Segmentation of character regions using recognition of characters or words
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/10Office automation; Time management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/412Layout analysis of documents structured with printed lines or input boxes, e.g. business forms or tables

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Character Input (AREA)
  • Processing Or Creating Images (AREA)

Description

本発明は、原稿の読み取りにより生成された文書画像データを処理する画像処理装置および画像処理プログラムに関する。
特定フォームの原稿を読み取ることにより生成された画像データに対し、ファイル名を自動生成する情報処理端末装置において、予めフォームごとに指定されている複数の認識箇所の指定データを認識処理し、認識された前記複数箇所の文字列を、区切り文字を介して連結することによりファイル名を生成する構成が開示されている(特許文献1参照)。
特開2008‐71050号公報
文書画像データを文字認識処理したとき、複数の日付情報が抽出されることがある。複数の日付情報が抽出されたとき、どの日付情報が、当該文書画像データの原稿の発行日を示しているのかを判別することが難しかった。
本発明は上述の課題に鑑みてなされたものであり、文書画像データに対する文字認識により複数の日付情報が抽出されたとき、原稿の発行日を適切に選択する画像処理装置および画像処理プログラムを提供する。
本発明の態様の1つは、画像処理装置は、原稿の読み取りにより生成された文書画像データを取得し、文字認識により前記文書画像データに含まれている文字列を認識する制御部を備え、前記制御部は、前記文字列の中から複数の日付情報を抽出した場合に、前記複数の日付情報の中の時刻情報を含む日付情報を前記原稿の発行日として選択する。
当該構成によれば、画像処理装置は、文書画像データに含まれている文字列の中から複数の日付情報を抽出した場合には、時刻情報を含む日付情報が含まれていれば、当該時刻情報を含む日付情報を前記発行日として選択する。これにより、文書画像データに対する文字認識により複数の日付情報が抽出されたとき、その中から原稿の発行日を適切に選択することができる。
本発明の態様の1つは、前記制御部は、時刻情報を含む日付情報を選択しなかった場合、前記文書画像データに基づいて前記原稿の種類を判別し、前記原稿の種類に応じて前記複数の日付情報の中から前記原稿の発行日としての日付情報を選択するとしてもよい。
当該構成によれば、画像処理装置は、文書画像データに含まれている文字列の中から抽出した複数の日付情報の中に、時刻情報を含む日付情報が無かった場合等、何らかの理由により時刻情報を含む日付情報を選択しなかった場合に、原稿の種類に応じて複数の日付情報の中から原稿の発行日を適切に選択することができる。
本発明の態様の1つは、前記制御部は、前記文書画像データに含まれている文字列に基づいて前記原稿の種類を判別するとしてもよい。また、前記制御部は、前記文書画像データが示す前記原稿のサイズに基づいて前記原稿の種類を判別するとしてもよい。
これら構成によれば、画像処理装置は、文書画像データに基づいて原稿の種類を適切に判別することができる。
本発明の態様の1つは、前記制御部は、前記原稿の種類がレシートである場合には、前記複数の日付情報の中で古い日付情報を優先して選択するとしてもよい。
レシートには、レシートの発行日以外にも、例えば、商品のキャンペーン、広告、ポイントの有効期限等に関する様々な日付情報が記載されていることがある。このような状況においても、より古い日付情報を優先して選択することで、原稿(レシート)の発行日を適切に選択することができる。
本発明の態様の1つは、前記制御部は、前記原稿の種類が宿泊施設のレシートである場合には、前記複数の日付情報の中で新しい日付情報を優先して選択するとしてもよい。
宿泊施設のレシートには、基本的にチェックインの日付情報やチェックアウトの日付情報が記載されているが、そのような状況において複数の日付情報の中で新しい日付情報を優先して選択することで、チェックアウトの日付を原稿(宿泊施設のレシート)の発行日として選択することができる。
本発明の態様の1つは、前記制御部は、期間を限定する文字列とともに記述された日付情報は選択肢から除外するとしてもよい。
期間を限定する意味の文字列とともに記述された日付情報は、原稿の発行日に該当する可能性は低いため、そのような日付情報は選択しないようにすることで、不適切な日付情報を原稿の発行日に選択することを回避できる。
本発明の態様の1つは、前記制御部は、前記文書画像データの生成日時よりも新しい日付情報は選択肢から除外するとしてもよい。
文書画像データの生成日時よりも新しい日付情報は、原稿の発行日に該当することは有り得ないため、そのような日付情報は選択しないようにすることで、不適切な日付情報を原稿の発行日に選択することを回避できる。
本発明の態様の1つは、前記制御部は、前記発行日を含んだファイル名を前記文書画像データのファイル名として表示部に表示させるとしてもよい。
当該構成によれば、画像処理装置は、文書画像データに含まれている文字列の中から抽出した日付情報であって、原稿の発行日としての日付情報を含んだファイル名をユーザーに提示する。よって、ユーザーは、提示された(表示部に表示された)ファイル名を承認するだけで、文書画像データを、原稿の発行日を含んだファイル名を付けて保存することができる。
本発明の技術的思想は、画像処理装置というカテゴリー以外によっても実現される。例えば、原稿の読み取りにより生成された文書画像データに対する処理をコンピューターに実行させる画像処理プログラムであって、文字認識により前記文書画像データに含まれている文字列を認識する制御機能を実行させ、前記制御機能は、前記文字列の中から複数の日付情報を抽出した場合に、前記複数の日付情報の中の時刻情報を含む日付情報を前記原稿の発行日として選択するプログラムを、発明として把握することができる。また、このような画像処理プログラムによる処理に相当する方法の発明や、当該プログラムを記憶したコンピューター読み取り可能な記憶媒体も発明として成り立つ。
画像処理装置の構成を簡易的に示す図。 ファイル保存処理を示すフローチャート。 ファイル保存設定画面の一例を示す図。 ステップS130の詳細を示すフローチャート。 図5AはステップS120の一つの変形例を示す図、図5BはステップS120の別の変形例を示す図。 発行日決定表示処理を示すフローチャート。 スキャンデータ管理画面の一例を示す図。
以下、各図を参照しながら本発明の実施形態を説明する。なお各図は、本実施形態を説明するための例示に過ぎない。
1.装置構成の概略的説明:
図1は、本実施形態にかかる画像処理装置10の構成を簡易的に示している。画像処理装置10は、原稿を光学的に読み取って読取結果としての所定のフォーマットの画像データを生成し当該画像データを外部へ出力する読取装置(スキャナー30)と、通信可能に接続する。スキャナー30は、公知の製品を含めてスキャナーとして機能する装置であればよい。
画像処理装置10は、例えば、パーソナルコンピューター(PC)、スマートフォン、タブレット型端末、携帯電話機、或いはそれらと同程度の処理能力を有する情報処理装置によって実現される。また、本実施形態にかかる制御部11を実現可能なハードウェアを画像処理装置と呼んでもよい。
画像処理装置10は、例えば、制御部11、表示部12、操作受付部13、通信インターフェイス(IF)14、記憶部15等を備える。制御部11は、例えば、プロセッサー(例えばCPU11a。ASICやASICとCPU等の協働であってもよい)、ROM11b、RAM11c等を有する1つ又は複数のICや、その他のメモリー等を適宜含んで構成される。記憶部15は、例えば、ハードディスクドライブ(HDD)やフラッシュメモリー等の不揮発性の記憶装置である。記憶部15は、制御部11の一部であってもよい。
制御部11では、プロセッサー(CPU11a)が、ROM11bや記憶部15等に保存されたプログラムに従った演算処理を、RAM11c等をワークエリアとして用いて実行することにより、画像処理装置10の挙動を制御する。制御部11はプログラムの1つとしてプログラムAを搭載しており、プログラムAに従って、データ取得部20、ファイル名生成部21、表示制御部22等といった各機能を実現する。プログラムAは、原稿の読み取りにより生成された文書画像データに対する処理をコンピューターに実行させる画像処理プログラムである。また、プログラムAは、文書画像データの保存や管理を実行するためのアプリケーションである。
通信IF14は、公知の通信規格を含む所定の通信プロトコルに準拠して有線あるいは無線で外部と通信を実行するIFである。図1の例では、画像処理装置10は、通信IF14を介してスキャナー30と接続している。むろん、画像処理部10は、通信IF14あるいは不図示の別の通信IFを介して、外部のネットワークに接続することも可能であり、制御部11(プログラムA)は、例えば、前記ネットワーク(ローカルエリアネットワークやインターネット通信網等)を通じて外部のサーバー(不図示)に、スキャナー30から取得した文書画像データをアップロードすることも可能である。
表示部12は、視覚的情報を表示するための手段であり、例えば、液晶ディスプレイ(LCD)や、有機ELディスプレイ等により構成される。表示部12は、ディスプレイと、当該ディスプレイを駆動するための駆動回路とを含む構成であってもよい。操作受付部13は、ユーザーによる操作を受け付けるための手段であり、例えば、物理的なボタンや、タッチパネルや、マウスや、キーボード等によって実現される。むろん、タッチパネルは、表示部12の一機能として実現されるとしてもよい。また、表示部12および操作受付部13を含めて操作パネル等と呼ぶことができる。
表示部12、操作受付部13、記憶部15等の図1に示した一部の構成は、画像処理装置10に外付けされた周辺機器であってもよい。また、図1に示した画像処理装置10とスキャナー30とを含んだシステムを1つの発明として捉えることも可能である。あるいは、画像処理装置10とスキャナー30とは、実態としてそれら全体が1つの装置に含まれていてもよい。画像処理装置10とスキャナー30とが1つの装置に含まれている場合、そのような構成(1つの装置)を、読取装置等と呼ぶことができる。また、画像処理装置10とスキャナー30とを含む構成(1つの装置)は、プリンター(コピー機)やファクシミリ等としての複数の機能を併せ持った複合機であってもよい。
2.ファイル名表示を伴うファイル保存処理:
図2は、制御部11がプログラムAに従って実行するファイル保存処理をフローチャートにより示している。
先ず、スキャナー30は、ユーザーが任意にセットした原稿を読み取ることにより画像データを生成する。本実施形態では、ユーザーがスキャナー30に読み取らせる原稿は、少なくとも文字が記載された原稿であるとする。原稿は、例えばレシートや請求書や契約書等である。スキャナー30は、原稿の読取結果としての画像データ(文書画像データ)を、画像処理装置10へ送信する。制御部11は、通信IF14を介してスキャナー30へ原稿の読取開始を指示し、スキャナー30は、制御部11からの当該読取開始の指示に従って原稿の読み取りを開始するとしてもよい。
制御部11(データ取得部20)は、上述のようにスキャナー30から送信された文書画像データを、通信IF14を介して取得する(ステップS100)。なお、データ取得部20は、スキャナー30から直接に文書画像データを取得(受信)するのではなく、スキャナー30から文書画像データが転送された転送先としての記憶部(例えば、記憶部15)から当該文書画像データを取得するとしてもよい。
制御部11(ファイル名生成部21)は、ステップS100で取得した文書画像データを対象として、文字認識(OCR:Optical Character Recognition/Reader)を実行することにより、文書画像データに含まれている文字列を認識する(ステップS110)。この場合、文書画像データに含まれている文字列と認識可能な対象を文字データ(テキストデータ)に変換する。文字認識処理は、公知の技術であるため、これ以上の説明は省略する。
ステップS120では、ファイル名生成部21は、ステップS110において認識した文書画像データに含まれている文字列(以下、データ内文字列)から、予め登録された特定文字列を検索する。特定文字列とは、テーブルTに登録済みの文字列である。テーブルTは、画像処理装置10内の記憶部(例えば、記憶部15)に記憶されている。ただし、テーブルTは、外部のサーバーに記憶されており、画像処理装置10は、前記ネットワークを通じて前記サーバーにアクセスすることでテーブルTを適宜参照するとしてもよい。
特定文字列は、基本的には、原稿の種類(原稿がどのような用途・趣旨の書類であるか)を示す言葉である。例えば、テーブルTには、特定文字列として“invoice”、“bill”、“contract”等、原稿内の文書に含まれていることが想定される言葉であって原稿の種類を端的に表す言葉が予め複数登録されている。テーブルTには、更に、プログラムAを実行する制御部11が過去にファイル名として入力を受け付けた文字列が特定文字列の一種として登録されていてもよい。つまり、プログラムAを実行する制御部11は、ユーザーが操作受付部13等を操作してファイル名入力欄(図3の符号43参照。)に入力したファイル名に含まれる言葉(例えば、原稿の発行元の店舗や施設や会社の名称)を、テーブルTに登録することにより、テーブルTにおける特定文字列の登録数を増やすことができる。
ステップS130では、ファイル名生成部21は、データ内文字列から日付情報を抽出する。つまり、ファイル名生成部21は、日付を表していると判別できる所定桁数の数字や、そのような数字と例えばスラッシュ“/”や、漢字の“年”、“月”、“日”等を含んだ文字列を、日付情報として抽出する。図2では、日付情報の抽出(ステップS130)は、特定文字列の検索(ステップS120)の次に実行される態様としているが、これらステップS120,S130は、処理順が逆でもよいし、制御部11の処理能力によっては並行実施されるとしてもよい。
ステップS130の詳細については、図4等を用いて後述する。
ステップS140では、ファイル名生成部21は、ステップS100で取得した文書画像データを保存する際に付けるファイル名を、ステップS120,S130の結果を用いて生成する。この場合、ファイル名生成部21は、ステップS120における検索でデータ内文字列から検出した特定文字列と、ステップS130においてデータ内文字列から抽出した日付情報とを含んだファイル名を生成する。具体的には、ファイル名生成部21は、特定文字列を接頭辞とし、日付情報を接尾辞とし、これら特定文字列と日付情報とをアンダーバー“_”や、ハイフン“-”等で結んだファイル名を生成する。例えば、ステップS120における検索でデータ内文字列から特定文字列として“invoice”を検出し、ステップS130において日付情報として“09/30/17”を抽出した場合には“invoice_2017/09/30”といったファイル名を生成することが可能である。
ステップS150では、制御部11(表示制御部22)は、ステップS140で生成したファイル名を表示部12に表示させる。
図3は、表示制御部22がステップS150で表示部12に表示させるファイル保存設定画面40の一例を示している。ファイル保存設定画面40は、原稿画像表示欄41、フォルダー設定欄42、ファイル名入力欄43等を含んでいる。原稿画像表示欄41には、ステップS100で取得した文書画像データに基づく画像IM、つまり原稿が表示され、ユーザーは、スキャナー30に読み取らせた原稿を、原稿画像表示欄41を通じて視認することができる。
フォルダー設定欄42は、ステップS100で取得した文書画像データの保存先としてのフォルダー(例えば、記憶部15内のフォルダー)を設定するための入力欄である。ユーザーは、操作受付部13等を操作してフォルダー設定欄42に任意のフォルダー(既存のフォルダーあるいは新たに作成したフォルダー)を設定することができる。
ファイル名入力欄43は、ステップS100で取得した文書画像データに付けるファイル名を設定するための入力欄である。ユーザーは、操作受付部13等を操作してファイル名入力欄43に任意のファイル名を文字入力することで、ファイル名を設定することができる。ただし本実施形態では、図3に例示するように、表示制御部22は、ファイル名入力欄43の近傍にファイル名候補欄44を表示させる。ファイル名候補欄44は、ファイル名の設定履歴に基づくファイル名を表示するための第1欄44aと、ステップS140で生成されたファイル名を表示するための第2欄44bとを含んでいる。第1欄44aには、例えば、過去(直近)にファイル名入力欄43で設定された(ファイル保存に際してファイル名として実際に採用された)ファイル名が表示される。第2欄44bには、ステップS140で生成されたファイル名、例えば、上述したような“invoice_2017/09/30”が表示される。
表示制御部22は、ファイル名候補欄44から選択されたファイル名をファイル名入力欄43に設定する。つまり、ユーザーは、ファイル名候補欄44からファイル名を選択する操作(ファイル名候補欄44に表示されているファイル名のクリックまたはタップ等)を行うだけで、当該選択したファイル名をファイル名入力欄43に設定することができる。
制御部11は、ファイル保存設定画面40に対するユーザーの入力に従って、ファイル名を決定する(ステップS160)。具体的には、制御部11は、ファイル保存設定画面40における所定ボタン(図3の例では、OKボタン45)への操作を検知すると、その時点でファイル名入力欄43に設定しているファイル名を、ステップS100で取得した文書画像データのファイル名に決定する。すなわちユーザーは、ステップS140で自動的に生成されたファイル名を、ファイル名候補欄44(第2欄44b)で視認し、これを選択して承認する(OKボタン45を押す)だけで、スキャナー30に読み取らせた原稿のスキャンデータ(文書画像データ)にファイル名を付けることができる。
そして、制御部11は、ステップS100で取得した文書画像データを、ステップS160で決定したファイル名を付したファイルとして保存する(ステップS170)。この場合、前記所定ボタン(OKボタン45)が操作された時点でフォルダー設定欄42で設定されているフォルダーにファイルを保存する。このようなステップS160およびステップS170は、ほぼ同時に実行される。以上で、図2のフローチャートが終了する。
なお、表示制御部22が、ステップS150で表示部12に表示させるステップS140で生成されたファイル名は1つとは限らない。ステップS120における特定文字列の検索結果によっては、データ内文字列から複数の特定文字列の検索に成功する場合がある。そのため、ステップS140では、ファイル名生成部21は、ステップS120における検索でデータ内文字列から検出した特定文字列毎に、特定文字列を含んだファイル名を生成する。そして、ステップS150では、それぞれ異なる特定文字列を含んだ複数のファイル名が表示され得る。図3の例では、ファイル名候補欄44(第2欄44b)には、2つのファイル名“invoice_2017/09/30”および“bill_2017/09/30”が表示されている。これは、ステップS120において、データ内文字列から“invoice”および“bill”という2つの特定文字列が検出された事例を表している。
ステップS120における特定文字列の検索結果によっては、データ内文字列から特定文字列が1つも検出されない場合がある。このような場合、ファイル名生成部21は、ステップS140では、特定文字列を含んだファイル名を生成できないため、ファイル名を生成しないとしてもよいし、特定文字列は含まないがステップS130で抽出した日付情報を含んだファイル名を生成するとしてもよい。同様に、ステップS130における日付情報の抽出結果によっては、データ内文字列から日付情報が1つも抽出されない場合がある。このような場合、ファイル名生成部21は、ステップS140では、日付情報を含んだファイル名を生成できないため、ファイル名を生成しないとしてもよいし、日付情報は含まないがステップS120の検索により検出した特定文字列を含んだファイル名を生成するとしてもよい。このような例外的事例まで考慮すると、ステップS150では、ファイル名候補欄44の第2欄44bには、日付情報は含まないが特定文字列を含んだファイル名が表示されたり、特定文字列は含まないが日付情報を含んだファイル名が表示されたり、ファイル名が1つも表示されなかったりする可能性がある。
3.ステップS130の詳細:
図4は、ステップS130の詳細をフローチャートにより示している。ステップS130では、制御部11は、先ず、データ内文字列からの日付情報の抽出を実行する(ステップS131)。プログラムAに従って図4のフローチャートを実行する制御部11を、日付情報抽出部あるいは発行日選択部、等と呼ぶことが出来る。
ステップS132では、制御部11は、ステップS131でデータ内文字列から抽出した日付情報に対して予め定めた除外条件を適用し、除外条件に該当する日付情報は、日付情報から除外する(ステップS133以降の処理で日付情報として扱わない)。除外条件は種々考えられるが、本実施形態では、期間を限定する文字列(以下、期間限定用キーワード)とともに記述されていることを、除外条件の1つとする。期間限定用キーワードとは、例えば、“until”、“expire”、“before”等の、期間を限定する意味の単語である。原稿としてのレシート等においては、原稿の発行日以外にも、例えば、商品のキャンペーン、広告、ポイントの有効期限等に関する様々な日付情報が記載されていることが往々にしてある。そして、原稿の発行日に該当しないこれら日付情報は、期間限定用キーワードを伴っていることが多い。
期間限定用キーワードは、例えば、上述の特定文字列とは別にテーブルTに予め登録されているとする。制御部11は、データ内文字列において期間限定用キーワードとともに記述されている日付情報は、これを日付情報から除外する。データ内文字列において期間限定用キーワードとともに日付情報が記述されているとは、例えば、期間限定用キーワードと日付情報とが、データ内文字列における1行内あるいは連続する2行内に存在している場合等を指す。
また本実施形態では、ステップS100で取得した文書画像データの生成日時よりも新しい日付情報であることを、除外条件の1つとする。文書画像データの生成日時は、例えば、文書画像データのプロパティ情報により判別可能である。原稿は、これが発行された後に、スキャナー30により読み取られて、文書画像データが生成される。従って、文書画像データの生成日時よりも新しい(未来の)日付を指す日付情報は、原稿の発行日に該当することは有り得ない。そのため、制御部11は、データ内文字列から抽出した日付情報のうち文書画像データの生成日時よりも新しい日付情報については、これを日付情報から除外する。
ステップS133では、制御部11は、データ内文字列から複数の日付情報を抽出したか否かを判定する。つまり、ステップS131でデータ内文字列から抽出に成功した日付情報であって、ステップS132で除外条件を適用した結果、除外せずに残った日付情報が複数在るか否かを判定する。制御部11は、ステップS133では、データ内文字列から複数の日付情報を抽出したと判定した場合は(ステップS133においてYes)、ステップS134へ進み、データ内文字列から複数の日付情報を抽出しなかったと判定した場合は(ステップS133においてNo)、ステップS130(図4)を終了する。
ステップS133において「No」と判定してステップS130を終えたということは、データ内文字列から日付情報を1つ抽出した場合と、データ内文字列から日付情報を1つも抽出できなかった場合とのいずれかである。ステップS130の結果、データ内文字列から日付情報を1つ抽出した場合には、当該抽出した日付情報を含んだファイル名が生成され(ステップS140)、表示部12に表示される(ステップS150)。ステップS130の結果、データ内文字列から日付情報を1つも抽出できなかった場合のステップS140以降の処理は上述した通りである。
ステップS134では、制御部11は、データ内文字列から抽出した複数の日付情報の中に時刻情報を含む日付情報が含まれているか否かを判定する。データ内文字列から抽出した複数の日付情報の中に、例えば、“09/30/17. 08:28pm”というように、使用されている記号や数字の組合せ等から時刻情報と判別できる文字列“08:28pm”とともに(例えば、1行内あるいは連続する2行内に)記述された日付情報が有れば、制御部11は、時刻情報を含む日付情報有りと判定し(ステップS134においてYes)、ステップS135へ進む。一方、時刻情報を含む日付情報有りと判定しなかった場合(ステップS134においてNo)、ステップS136へ進む。
ステップS135では、制御部11は、データ内文字列から抽出した複数の日付情報のうち上述のように時刻情報を含む日付情報を選択し、ステップS130(図4)を終了する。原稿(例えば、レシート等)においては、日までではなく時刻まで詳細に記載した日付情報は、原稿の発行日を指している可能性が非常に高い。そのため、本実施形態では、データ内文字列から複数の日付情報を抽出できた場合、時刻情報を含んでいる日付情報を優先して選択する。ステップS135における日付情報の選択は、ステップS130における日付情報の抽出を確定する処理である。従って、ステップS130をステップS135で終えた場合には、ステップS135で選択した日付情報が、ステップS130で抽出した日付情報としてステップS140以降で扱われる。なお、ステップS130で抽出した日付情報が、時刻情報を含んだ日付情報であったとしても、制御部11は、ステップS150では、時刻情報まで表示部12に表示させる必要は無い(図3の第2欄44b参照)。
制御部11は、データ内文字列から抽出した複数の日付情報の中に時刻情報を含む日付情報が複数有る場合には、それら時刻情報を含む複数の日付情報を全てステップS135で選択してもよい。ただし、原稿に記載された複数の日付情報の中で古い日付情報が当該原稿の発行日である可能性が高いという実情に鑑みて、ステップS135では、データ内文字列から抽出した複数の日付情報の中に時刻情報を含む日付情報が複数有る場合には、それら時刻情報を含む複数の日付情報のうち、示す日時がより古い日付情報を選択すればよい。
ステップS136では(時刻情報を含む日付情報を選択しなかった場合は)、制御部11は、ステップS100で取得した文書画像データに基づいて原稿の種類を判別する。文書画像データに基づく原稿種類の判別方法は、主に2通りである。
1つは、文書画像データが示す原稿サイズ(原稿の縦横の長さ)に基づく判別方法である。原稿サイズは、文書画像データのプロパティ情報に含まれている。あるいは、原稿サイズが文書画像データのプロパティ情報に含まれていない場合であっても、制御部11は、文書画像データの画素数と解像度(1インチあたりの画素数)とに基づいて原稿サイズを把握することができる。制御部11は、文書画像データが示す原稿サイズが、所定のレシートサイズに該当する場合、原稿の種類はレシートであると判別する。レシートは、多くの場合、比較的小さく、かつ長尺状の紙であるため、制御部11は、レシートサイズの範囲(縦横それぞれの長さの範囲)を予め規定しておき、規定したレシートサイズの範囲に原稿サイズが該当する場合に、原稿の種類はレシートであると判別する。
ただし、制御部11は、文書画像データが示す原稿サイズが、いわゆるレターサイズに該当する場合には、原稿の種類は第2種のレシートと判別する。上述のレシートサイズの範囲は、レターサイズとは異なるサイズの範囲を規定している。よって、制御部11は、原稿サイズが上述のレシートサイズの範囲に該当する場合には原稿の種類は第1種のレシートと判別し、原稿サイズがレターサイズに該当する場合には原稿の種類は第2種のレシートと判別する、と言える。ちなみに、第2種のレシートとしては、ホテル等の宿泊施設が発行したレシートが想定される。
もう1つの、文書画像データに基づく原稿種類の判別方法は、データ内文字列に基づく判別方法である。制御部11は、データ内文字列から、例えば、“hotel”という言葉や、その他の宿泊施設に関連する所定のキーワードの検索に成功した場合、原稿の種類は第2種のレシートと判別する。その他にも、制御部11は、データ内文字列における上述した特定文字列の検索結果に応じて、原稿の種類が第1種のレシートであることや、請求書や契約書等であることを判別(推測)することができる。
ステップS137では、制御部11は、データ内文字列から抽出した複数の日付情報の中から、ステップS136で判別した原稿の種類に応じて日付情報を選択し、ステップS130(図4)を終了する。ステップS137における日付情報の選択も、ステップS130における日付情報の抽出を確定する処理である。従って、ステップS130をステップS137で終えた場合には、ステップS137で選択した日付情報が、ステップS130で抽出した日付情報としてステップS140以降で扱われる。
ステップS137の具体例について説明する。制御部11は、原稿の種類に応じて、データ内文字列から抽出した複数の日付情報の中から、より古い日付情報又は、より新しい日付情報のどちらかを選択する。原稿の種類がレシート(第1種のレシート)である場合には、制御部11は、複数の日付情報の中で古い日付情報を優先して選択する。これは、上述したようにレシートには、商品のキャンペーン、広告、ポイントの有効期限等に関する日付(レシートの発行日よりも未来の日付)が記載されていることがあり、このようなレシートの発行日よりも未来の日付を選択することを避けるためである。一方、原稿の種類が第2種のレシートである場合には、制御部11は、複数の日付情報の中で新しい日付情報を優先して選択する。これは、宿泊施設のレシートには、基本的にチェックインの日付情報やチェックアウトの日付情報が記載されているが、より新しい日付情報を優先して選択することで、実際に原稿が発行された日付、つまりチェックアウトの日付を選択できるからである。なお、制御部11は、ステップS136において、原稿の種類が第1種のレシート、第2種のレシートのいずれにも該当しないと判別した場合は、ステップS137では、複数の日付情報の中でより古い日付情報を優先して選択すればよい。
これまでの説明から判るように、ステップS130(図4)を終えた時点でデータ内文字列から抽出されている日付情報は、原稿の発行日を示す可能性が高い日付情報である。換言すると、制御部11は、データ内文字列から原稿の発行日を示す日付情報を選択して抽出する。なお、データ内文字列から抽出できた日付情報が1つである場合(ステップS133において「No」の判定をしてステップS130を終えた場合)、制御部11は、当該抽出した日付情報を原稿の発行日とみなす。従って、制御部11は、ステップS130において、データ内文字列の中から日付情報を抽出することにより原稿の発行日を選択すると言える。また、ステップS130を終えた時点でデータ内文字列から抽出されている日付情報は、上述の除外条件(ステップS132参照)に該当しない日付情報である。つまり、ステップS130では、制御部11は、期間限定用キーワードとともに記述された日付情報は最終的に抽出する選択肢から除外し、また、文書画像データの生成日時よりも新しい日付情報は最終的に抽出する選択肢から除外する。これにより、原稿の発行日に該当する可能性が極めて低い不適切な日付情報を原稿の発行日として選択することを回避できる。ステップS132は、図4のフローチャートにおいて必須ではないが、これを実行した方が、より適切に原稿の発行日を選択することができる。
4.まとめ:
このように本実施形態によれば、画像処理装置10は、原稿の読み取りにより生成された文書画像データを取得し(ステップS100)、文字認識により文書画像データに含まれている文字列(データ内文字列)を認識する制御部11を備える。制御部11は、データ内文字列の中から、予めテーブルTに登録された特定文字列を検索し(ステップS120)、検索により検出した特定文字列を含んだファイル名を文書画像データのファイル名として表示部12に表示させる(ステップS140,S150)。当該構成によれば、制御部11は、前記検索により検出した特定文字列を含んだファイル名をユーザーに提示する。よって、ユーザーは、提示された(表示部12に表示された)ファイル名を承認する所定の操作を行うだけで、文書画像データに適切なファイル名を設定することができる。また当該構成によれば、原稿における文書のフォームや原稿のサイズを問わず、原稿にとって適切なファイル名(特定文字列を含んだファイル名)を提示し、ユーザーの手間を大きく減らすことができる。
また本実施形態によれば、テーブルTには、例えば“invoice”、“bill”、“contract”等の、原稿(レシート、請求書、契約書等)のデータ内文字列に含まれていることが想定される言葉であって原稿の種類を端的に表す言葉や、過去にユーザーがファイル名として入力した文字列が、特定文字列として登録されている。この結果、制御部11は、データ内文字列からの特定文字列の検索を行うことにより、原稿の種類や過去のユーザーによるファイル命名の傾向を反映した適切なファイル名をユーザーに提示し、文書画像データに対する適切な名付けを容易化させることができる。また、このような原稿の種類や過去のユーザーによるファイル命名の傾向を反映した適切なファイル名が文書画像データに付けられて保存されることで、後に、ユーザーが記憶部15等に保存済みのファイルを検索する際に、所望のファイルを容易に見つけることが可能となる。
また本実施形態によれば、制御部11は、データ内文字列の中から日付情報を抽出し(ステップS130)、表示させるファイル名に当該抽出した日付情報を含ませる(ステップS140,S150)。当該構成によれば、制御部11は、データ内文字列からの前記検索により検出した特定文字列だけでなく、データ内文字列から抽出した日付情報つまり原稿の発行日を含んだ、より適切なファイル名をユーザーに提示し、文書画像データに対する名付けを容易化させることができる。
さらに本実施形態によれば、制御部11が実行するステップS130では、データ内文字列の中から複数の日付情報を抽出した場合に、複数の日付情報の中の時刻情報を含む日付情報を原稿の発行日として選択する。つまり、制御部11は、データ内文字列の中から複数の日付情報を抽出した場合(ステップS133においてYes)、複数の日付情報の中から前記発行日を選択する。このとき、優先事項として、複数の日付情報の中に時刻情報を含む日付情報が含まれている場合には(ステップS134においてYes)、時刻情報を含む日付情報を選択する(ステップS135)。これにより、データ内文字列から複数の日付情報が抽出されたとき、原稿の発行日に該当する可能性が相対的に高い日付情報を、原稿の発行日として選択することができる。
また本実施形態によれば、制御部11は、時刻情報を含む日付情報を選択しなかった場合(ステップS134においてNo)、文書画像データに基づいて原稿の種類を判別し(ステップS136)、原稿の種類に応じて前記複数の日付情報の中から日付情報を選択する(ステップS137)。これにより、データ内文字列の中から抽出した複数の日付情報の中に、時刻情報を含む日付情報が無かったり、時刻情報を含む日付情報が有ったとしてもそれが前記除外条件に該当したりする場合であっても、原稿の種類に応じて複数の日付情報の中から原稿の発行日を適切に選択することができる。
5.変形例:
本実施形態は上述した態様に限られず、種々の変形例を含み得る。以下では、本実施形態に含まれる変形例を複数説明する。
図5Aは、ステップS120(図2)の一つの変形例を示している。また図5Bは、ステップS120(図2)の別の変形例を示している。図5Aの例では、ステップS120は、ステップS121,S122,S123の各ステップを含んでいる。また、図5Bの例では、ステップS120は、ステップS121,S123の各ステップを含んでいる。ステップS121は、これまでに説明したステップS120と同じ処理である。
図5Aの例においては、制御部11は、ステップS121の実行後、ステップS121における特定文字列の検索の結果、データ内文字列から特定文字列を検出できたか否かにより処理を分岐する(ステップS122)。つまり、制御部11は、データ内文字列から特定文字列を1つ以上検出できた場合には(ステップS122においてYes)、ステップS120を終了し、次のステップ(図2の例ではステップS130)に進む。一方、制御部11は、データ内文字列から特定文字列を1つも検出できなかった場合には(ステップS122においてNo)、ステップS123に進み、ステップS123を終えてから次のステップ(図2の例ではステップS130)に進む。
ステップS123では、制御部11は、原稿サイズに基づいて原稿の種類を示す文字列を決定する。既に説明したように、制御部11は、原稿サイズを、文書画像データに基づいて把握可能である。制御部11は、原稿サイズが上述のレシートサイズの範囲に該当する場合には、原稿の種類(第1種のレシート)を示す文字列として、例えば“receipt”という文字列を決定する。また、原稿サイズがレターサイズに該当する場合には、原稿の種類(第2種のレシート)を示す文字列として、例えば“hotel receipt”という文字列を決定する。また、制御部11は、原稿サイズが、規定の名刺サイズに該当する場合には、原稿の種類(名刺)を示す文字列として、例えば“name card”という文字列を決定する。このようにステップS123では、制御部11は、原稿サイズから推測される原稿の種類を示す文字列を、所定のポリシー(例えば、予め定められた原稿サイズと文字列との対応関係)に従って決定する。
上述したようにステップS140(図2)では、制御部11は、ステップS100で取得した文書画像データを保存する際に付けるファイル名を、ステップS120,S130の結果を用いて生成する。
図5Aに示したステップS120を実行する構成においては、制御部11は、ステップS121でデータ内文字列から特定文字列の検索に成功した場合には、ステップS140では、ステップS121の検索でデータ内文字列から検出した特定文字列を含んだファイル名を生成する。そして、ステップS150では特定文字列を含んだファイル名を表示する。一方、ステップS121でデータ内文字列から特定文字列を検出できなかった場合には、ステップS140では、ステップS123で原稿サイズに基づいて決定した文字列を含んだファイル名を生成し、ステップS150では原稿サイズに基づいて決定した文字列を含んだファイル名を表示する。
図5Bの例においては、制御部11は、ステップS121,S123の両方を実行する。従って、図5Bに示したステップS120を実行する構成においては、制御部11は、ステップS121でデータ内文字列から特定文字列の検索に成功した場合には、ステップS140では、ステップS121の検索でデータ内文字列から検出した特定文字列を含んだファイル名を生成する。さらに、制御部11は、ステップS121でデータ内文字列から特定文字列の検索に成功したか否かに関係なく、ステップS140では、ステップS123で原稿サイズに基づいて決定した文字列を含んだファイル名も生成する。この結果、基本的には、ステップS150では特定文字列を含んだファイル名と、原稿サイズに基づいて決定した文字列を含んだファイル名とを表示する。
図5Aの例によれば、制御部11は、データ内文字列から特定文字列の検索に成功しなかったとしても、文書画像データの保存に際しての適切なファイル名をユーザーに提示することができる。また、図5Bの例によれば、制御部11は、文書画像データの保存に際しての適切なファイル名の選択肢をより多くユーザーに提示することができる。
これまで、ステップS130(図4)は、図2のフローチャートの一部、つまり文書画像データにファイル名を付けて保存する過程の一部として説明した。しかし、ステップS130(図4)で説明した内容は、図2のフローチャートと切り離して捉えることも可能である。例えば、ステップS130により原稿の発行日として決定した日付情報について、制御部11は、原稿の発行日(Issue date)として表示部12に表示するとしてもよい。
図6は、制御部11がプログラムAに従って実行する、本実施形態の一つの変形例としての発行日決定表示処理をフローチャートにより示している。
ステップS200,S210,S220は、これまでに説明したステップS100,S110,S130と同じ処理であるため、説明を省略する。
ステップS230では、制御部11は、ステップS220(=S130、図4)により抽出した日付情報(原稿の発行日として選択した日付情報)を、原稿の発行日(issue date)として表示部12に表示させる。
図7は、制御部11(表示制御部22)がステップS230で表示部12に表示させるスキャンデータ管理画面50の一例を示している。図7の例では、スキャンデータ管理画面50は、画面の左側に原稿画像表示欄51を含んでいる。原稿画像表示欄51には、ステップS200で取得した文書画像データに基づく画像IM2、つまり原稿(例えば、レシート)の表示がなされ、ユーザーは、スキャナー30に読み取らせた原稿を、原稿画像表示欄51を通じて視認することができる。また、図7の例では、スキャンデータ管理画面50は、画面の右側に複数の設定入力欄を含んでいる。ユーザーは、各設定入力欄に対して、原稿の内容に基づいた入力を行うことができる。
このようなスキャンデータ管理画面50を表示する場合、制御部11は、複数の設定入力欄のうちの1つである発行日入力欄52に、ステップS220において原稿の発行日として決定した日付情報を表示させる。図7の例では、原稿画像表示欄51において原稿の全体を表示している訳ではないが、符号D1,D2で示すように、原稿の各位置には日付情報が存在している。このうち、日付情報D2は、期間限定用キーワード“expire”を伴っているため、ステップS220(=S130、図4)の結果、日付情報として抽出されることはない(原稿の発行日として選択されることはない)。一方、日付情報D1は、時刻情報を含んでいるため、ステップS220(=S130、図4)の結果、日付情報として抽出される(原稿の発行日として選択される)。従って、図7の例では、発行日入力欄52には、原稿の発行日として“2017/09/30”という日付が自動的に表示される。
制御部11は、例えば、スキャンデータ管理画面50に対する設定入力を終了させる所定の操作をユーザーから受け付けた場合に、スキャンデータ管理画面50の各設定入力欄における現在の設定内容を、ステップS200で取得した文書画像データとともに保存し(ステップS240)、スキャンデータ管理画面50を閉じて、図6のフローチャートを終了する。ユーザーは、文書画像データとともに保存した設定内容については、再びスキャンデータ管理画面50を開くことで随時編集することが可能である。
なお図3や図7は、ステップS150(図2)やステップS230(図6)におけるファイル名や原稿の発行日の表示態様の一例を示しているに過ぎない。ステップS150(図2)やステップS230(図6)における表示態様、例えば、表示部12に表示させる画面上のレイアウトやデザイン、表示部12に表示させる画面の目的や役割は、様々である。
さらに、本実施形態によるファイル名の生成、表示の方法は、ファイルを保存するためのフォルダーのフォルダー名の生成、表示にも応用することができる。つまり、制御部11は、データ内文字列の中から、予め登録された特定文字列を検索し、検索により検出した特定文字列を含んだフォルダー名を、文書画像データの保存先のフォルダー名として表示部12に(例えば、フォルダー設定欄42の近傍に)表示させる。また、制御部11は、データ内文字列の中から日付情報を抽出し、前記表示させるフォルダー名に前記抽出した日付情報を含ませるとしてもよい。ユーザーは、このように表示部12に表示されたフォルダー名を選択することにより、文書画像データをファイル保存する際の保存先のフォルダー(新しく作成するフォルダー)のフォルダー名を容易に決定することができる。
10…画像処理装置、11…制御部、12…表示部、13…操作受付部、14…通信IF、15…記憶部、20…データ取得部、21…ファイル名生成部、22…表示制御部、30…スキャナー、40…ファイル保存設定画面、41…原稿画像表示欄、42…フォルダー設定欄、43…ファイル名入力欄、44…ファイル名候補欄、44a…第1欄、44b…第2欄、50…スキャンデータ管理画面、51…原稿画像表示欄、52…発行日入力欄、A…プログラム、T…テーブル

Claims (9)

  1. 原稿の読み取りにより生成された文書画像データを取得し、文字認識により前記文書画像データに含まれている文字列を認識する制御部を備え、
    前記制御部は、前記文字列の中から複数の日付情報を抽出した場合に、
    前記複数の日付情報の中の時刻情報を含む日付情報を前記原稿の発行日として選択し、
    一方、時刻情報を含む日付情報を選択しなかった場合、前記文書画像データに基づいて前記原稿の種類を判別し、前記原稿の種類に応じて前記複数の日付情報の中から前記原稿の発行日としての日付情報を選択する、ことを特徴とする画像処理装置。
  2. 前記制御部は、前記文書画像データに含まれている文字列に基づいて前記原稿の種類を判別することを特徴とする請求項に記載の画像処理装置。
  3. 前記制御部は、前記文書画像データが示す前記原稿のサイズに基づいて前記原稿の種類を判別することを特徴とする請求項に記載の画像処理装置。
  4. 前記制御部は、前記原稿の種類がレシートである場合には、前記複数の日付情報の中で古い日付情報を優先して選択することを特徴とする請求項1~請求項3のいずれかに記載の画像処理装置。
  5. 前記制御部は、前記原稿の種類が宿泊施設のレシートである場合には、前記複数の日付情報の中で新しい日付情報を優先して選択することを特徴とする請求項1~請求項4のいずれかに記載の画像処理装置。
  6. 前記制御部は、期間を限定する文字列とともに記述された日付情報は選択肢から除外することを特徴とする請求項1~請求項のいずれかに記載の画像処理装置。
  7. 前記制御部は、前記文書画像データの生成日時よりも新しい日付情報は選択肢から除外することを特徴とする請求項1~請求項のいずれかに記載の画像処理装置。
  8. 前記制御部は、前記発行日を含んだファイル名を前記文書画像データのファイル名として表示部に表示させることを特徴とする請求項1~請求項のいずれかに記載の画像処理装置。
  9. 原稿の読み取りにより生成された文書画像データに対する処理をコンピューターに実行させる画像処理プログラムであって、
    文字認識により前記文書画像データに含まれている文字列を認識する制御機能を実行させ、
    前記制御機能は、前記文字列の中から複数の日付情報を抽出した場合に、
    前記複数の日付情報の中の時刻情報を含む日付情報を前記原稿の発行日として選択し、
    一方、時刻情報を含む日付情報を選択しなかった場合、前記文書画像データに基づいて前記原稿の種類を判別し、前記原稿の種類に応じて前記複数の日付情報の中から前記原稿の発行日としての日付情報を選択する、ことを特徴とする画像処理プログラム。
JP2017249294A 2017-12-26 2017-12-26 画像処理装置および画像処理プログラム Active JP7040000B2 (ja)

Priority Applications (5)

Application Number Priority Date Filing Date Title
JP2017249294A JP7040000B2 (ja) 2017-12-26 2017-12-26 画像処理装置および画像処理プログラム
US16/226,034 US10936896B2 (en) 2017-12-26 2018-12-19 Image processing apparatus and image processing program
EP18215839.4A EP3506155A1 (en) 2017-12-26 2018-12-24 Image processing apparatus and image processing program
CN201811591937.5A CN109960684A (zh) 2017-12-26 2018-12-25 图像处理装置及存储介质
US17/248,322 US11749008B2 (en) 2017-12-26 2021-01-20 Image processing apparatus and image processing program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2017249294A JP7040000B2 (ja) 2017-12-26 2017-12-26 画像処理装置および画像処理プログラム

Publications (2)

Publication Number Publication Date
JP2019114193A JP2019114193A (ja) 2019-07-11
JP7040000B2 true JP7040000B2 (ja) 2022-03-23

Family

ID=65013507

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017249294A Active JP7040000B2 (ja) 2017-12-26 2017-12-26 画像処理装置および画像処理プログラム

Country Status (4)

Country Link
US (2) US10936896B2 (ja)
EP (1) EP3506155A1 (ja)
JP (1) JP7040000B2 (ja)
CN (1) CN109960684A (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11030450B2 (en) * 2018-05-31 2021-06-08 Vatbox, Ltd. System and method for determining originality of computer-generated images
JP7447614B2 (ja) 2020-03-27 2024-03-12 富士フイルムビジネスイノベーション株式会社 情報処理装置
JP2022096218A (ja) * 2020-12-17 2022-06-29 キヤノン株式会社 情報処理装置、情報処理システム、その制御方法及びプログラム
JP2024014169A (ja) * 2022-07-22 2024-02-01 シャープ株式会社 画像形成装置、画像形成システム、及び画像形成方法

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3084490U (ja) 2001-09-04 2002-03-22 日本エヌ・シー・アール株式会社 特典情報が印字されたレシート
JP2007148569A (ja) 2005-11-24 2007-06-14 Canon Inc 情報処理装置及びその制御方法、プログラム、記憶媒体
JP2008071050A (ja) 2006-09-13 2008-03-27 Sharp Corp 情報処理端末装置、情報処理装置、ファイル管理サーバ、情報処理システム、ファイル名自動生成方法、プログラムおよび記録媒体
JP2011118513A (ja) 2009-12-01 2011-06-16 Toshiba Corp 文字認識装置および帳票識別方法
US20140257996A1 (en) 2013-03-08 2014-09-11 Lg Cns Co., Ltd. Financial Apparatus, Method and System for Receiving and Refunding Fees
JP2015118488A (ja) 2013-12-17 2015-06-25 株式会社日本デジタル研究所 会計データ入力システム、方法、およびプログラム
JP2016035690A (ja) 2014-08-04 2016-03-17 大日本印刷株式会社 調査システム、調査方法、サーバ、ユーザ端末、プログラム、記録媒体
US20170351913A1 (en) 2016-06-07 2017-12-07 The Neat Company, Inc. d/b/a Neatreceipts, Inc. Document Field Detection And Parsing

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6212504B1 (en) * 1998-01-12 2001-04-03 Unisys Corporation Self-authentication of value documents using encoded indices
JP4247138B2 (ja) 2004-02-25 2009-04-02 株式会社リコー ネットワーク複合機
US20150012339A1 (en) * 2004-06-01 2015-01-08 Daniel W. Onischuk Computerized voting system
US8131674B2 (en) * 2004-06-25 2012-03-06 Apple Inc. Methods and systems for managing data
JP6051827B2 (ja) 2012-12-07 2016-12-27 株式会社リコー 文書処理装置、画像処理装置、文書処理方法及び文書処理プログラム
JP6368195B2 (ja) * 2014-08-28 2018-08-01 キヤノン株式会社 情報処理装置とその制御方法、及びプログラム
JP6482361B2 (ja) * 2015-04-09 2019-03-13 キヤノン株式会社 原稿読取装置、原稿読取装置の制御方法、プログラム、及び記憶媒体

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3084490U (ja) 2001-09-04 2002-03-22 日本エヌ・シー・アール株式会社 特典情報が印字されたレシート
JP2007148569A (ja) 2005-11-24 2007-06-14 Canon Inc 情報処理装置及びその制御方法、プログラム、記憶媒体
JP2008071050A (ja) 2006-09-13 2008-03-27 Sharp Corp 情報処理端末装置、情報処理装置、ファイル管理サーバ、情報処理システム、ファイル名自動生成方法、プログラムおよび記録媒体
JP2011118513A (ja) 2009-12-01 2011-06-16 Toshiba Corp 文字認識装置および帳票識別方法
US20140257996A1 (en) 2013-03-08 2014-09-11 Lg Cns Co., Ltd. Financial Apparatus, Method and System for Receiving and Refunding Fees
JP2015118488A (ja) 2013-12-17 2015-06-25 株式会社日本デジタル研究所 会計データ入力システム、方法、およびプログラム
JP2016035690A (ja) 2014-08-04 2016-03-17 大日本印刷株式会社 調査システム、調査方法、サーバ、ユーザ端末、プログラム、記録媒体
US20170351913A1 (en) 2016-06-07 2017-12-07 The Neat Company, Inc. d/b/a Neatreceipts, Inc. Document Field Detection And Parsing

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Panuwat Ketwong et al.,"The Simple Image Processing Scheme for Document Retrieval Using Date of Issue as Query",2017 IEEE 2nd International Conference on Signal and Image Processing (ICSIP),米国,IEEE,2017年08月04日,pp.288-291
松本 俊子、外3名,"ビジネス文書からのメタデータ抽出のためのルール自動生成技術",電気学会論文誌C,日本,(社)電気学会,2011年08月01日,Vol.131, No.8,pp.1502-1511

Also Published As

Publication number Publication date
US20210142094A1 (en) 2021-05-13
US10936896B2 (en) 2021-03-02
US20190197337A1 (en) 2019-06-27
EP3506155A1 (en) 2019-07-03
CN109960684A (zh) 2019-07-02
US11749008B2 (en) 2023-09-05
JP2019114193A (ja) 2019-07-11

Similar Documents

Publication Publication Date Title
JP7059624B2 (ja) 画像処理装置および画像処理プログラム
JP7040000B2 (ja) 画像処理装置および画像処理プログラム
US10949662B2 (en) Image processing apparatus
JP2019168857A (ja) 画像処理装置、画像処理方法および画像処理プログラム
US10057449B2 (en) Document analysis system, image forming apparatus, and analysis server
JP7131137B2 (ja) 画像処理装置および画像処理プログラム
JP6743445B2 (ja) 携帯型情報装置およびプログラム
JP2009230498A (ja) 帳票処理方法、帳票処理プログラム、帳票処理装置、および、帳票処理システム
US20220272226A1 (en) Method for controlling display of screen for setting metadata, non-transitory storage medium, and apparatus
JP2020177426A (ja) 情報処理装置及びプログラム
JP7032692B2 (ja) 画像処理装置および画像処理プログラム
JP2022137608A (ja) 情報処理装置、情報処理方法およびプログラム
US11620840B2 (en) Image processing apparatus for extracting a desired character string from a scanned image
US20220207900A1 (en) Information processing apparatus, information processing method, and storage medium
JP6307933B2 (ja) 情報処理装置およびプログラム
JP2021056732A (ja) データ処理システム、データ処理方法、および、プログラム
KR102721513B1 (ko) 메타데이터를 설정하기 위한 화면의 표시를 제어하는 방법, 비일시적 저장 매체 및 장치
US11431868B2 (en) Information processing apparatus, information processing method, and storage medium comprising extracting a character string from a scanned document and determining if pre-defined candidates of a selection-type match the extracted character string, determining whether to display or not display one of the pre-defined candidates as a default value based on the result of the match between the extracted character string and the pre-defined candidates
JP5860434B2 (ja) 画像形成システム、ログ画像抽出プログラムおよび画像形成装置
US11475687B2 (en) Information processing system
US20220019835A1 (en) Image processing system, apparatus, method, and storage medium
JP2020030498A (ja) 文書処理
JP2017027114A (ja) 情報処理装置、情報処理システム及びプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20201207

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20211122

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20211130

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220121

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20220208

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20220221

R150 Certificate of patent or registration of utility model

Ref document number: 7040000

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150