JP2019204401A - 情報処理装置及びプログラム - Google Patents

情報処理装置及びプログラム Download PDF

Info

Publication number
JP2019204401A
JP2019204401A JP2018100417A JP2018100417A JP2019204401A JP 2019204401 A JP2019204401 A JP 2019204401A JP 2018100417 A JP2018100417 A JP 2018100417A JP 2018100417 A JP2018100417 A JP 2018100417A JP 2019204401 A JP2019204401 A JP 2019204401A
Authority
JP
Japan
Prior art keywords
character string
image
character
designated
character recognition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2018100417A
Other languages
English (en)
Inventor
山口 聡之
Satoyuki Yamaguchi
聡之 山口
邦彦 小林
Kunihiko Kobayashi
邦彦 小林
清水 淳一
Junichi Shimizu
淳一 清水
和宏 大谷
Kazuhiro Otani
和宏 大谷
真太郎 安達
Shintaro Adachi
真太郎 安達
岡田 茂
Shigeru Okada
茂 岡田
慎也 中村
Shinya Nakamura
慎也 中村
茜 阿部
Akane Abe
茜 阿部
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd filed Critical Fuji Xerox Co Ltd
Priority to JP2018100417A priority Critical patent/JP2019204401A/ja
Publication of JP2019204401A publication Critical patent/JP2019204401A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Character Discrimination (AREA)

Abstract

【課題】最初に指定された原稿の形式が2枚目以降の原稿の形式と異なる場合でも、原稿の2枚目以降の指定領域が間違って読み取られることを抑制する。【解決手段】処理手段11は、最初に指定された文字認識の基準となる第1の画像及び文字認識の対象となる1又は複数の第2の画像に含まれた1又は複数の指定領域について文字認識処理を行う。記憶手段12は、第1の画像について指定領域ごとに文字認識処理により認識された文字列と該文字列の種類を記憶する。出力手段13は、1又は複数の第2の画像について指定領域ごとに文字認識処理により認識された文字列と記憶された文字列が文字列の種類ごとに定められた文字列の条件を満たさない場合、その旨を示す情報を出力する。【選択図】図2

Description

本発明は、情報処理装置及びプログラムに関する。
紙文書をスキャンし、電子文書ファイルとして格納する電子ファイリングが行われている。この電子文書ファイリングにおいて、スキャンにより得た画像に対して文字認識処理を行い、文字認識結果を属性値として組み込むことで検索性を高めることも行われている。また、特許文献1には、読み取り設定の不備によりOCR認識率が低くなっていることを早い段階でユーザに通知し、再スキャンおよび再OCR処理に要する手間および時間の低減化を図ることが記載されている。
また、特許文献2には、印刷処理された用紙の画像情報を読み取り、読み取られる印刷用紙の画像情報と、印刷用紙に対応する蓄積されたジョブから生成されるビットマップイメージとを比較して印刷状態の良否を判定することが記載されている。特許文献3には、1回目の読み取りで原稿の良否を判定し、2回目の読み取り動作中に良くないと判定された原稿で読み取り動作を止めることが記載されている。
特開2006−260080号公報 特開2008−160284号公報 特開2011−124643号公報
本発明は、最初に指定された原稿の形式が2枚目以降の原稿の形式(原稿の記載項目のフォーマット)と異なる場合でも、原稿の2枚目以降の指定領域が間違って読み取られることを抑制する技術を提供することを目的とする。
本発明の請求項1に係る情報処理装置は、最初に指定された文字認識の基準となる第1の画像及び文字認識の対象となる1又は複数の第2の画像に含まれた1又は複数の指定領域について文字認識処理を行う処理手段と、前記第1の画像について指定領域ごとに前記文字認識処理により認識された文字列と該文字列の種類を記憶する記憶手段と、前記1又は複数の第2の画像について指定領域ごとに前記文字認識処理により認識された文字列と前記記憶された文字列が文字列の種類ごとに定められた文字列の条件を満たさない場合、その旨を示す情報を出力する出力手段とを有することを特徴とする。
本発明の請求項2に係る情報処理装置は、請求項1に記載の構成において、前記出力手段は、画像読取手段に画像読取処理を停止させるための制御情報を出力することを特徴とする。
本発明の請求項3に係る情報処理装置は、請求項1又は2に記載の構成において、前記出力手段は、前記文字列に含まれる予め定められた種類の文字の割合が該文字列に対応する条件を満たさない場合、前記情報を出力することを特徴とする。
本発明の請求項4に係る情報処理装置は、請求項1乃至3のいずれか1項に記載の構成
において、前記出力手段は、画像読取手段により読み取られた複数の前記第2の画像の各々について、前記文字列の前記条件を用いた判定結果の統計結果が予め定められた条件を満たさない場合、前記情報を出力することを特徴とする。
本発明の請求項5に係る情報処理装置は、請求項1乃至4のいずれか1項に記載の構成において、画像読取手段により読み取られた前記第1の画像を画像解析することにより、前記指定領域の位置を表す位置情報を生成する生成手段を更に有し、前記処理手段は、前記画像読取手段により前記第1の画像の読取処理の後に続けて読み取られた前記第2の画像において前記位置情報により示される指定領域に対し文字認識処理を行うことを特徴とする。
本発明の請求項6に係るプログラムは、コンピュータに、最初に指定された文字認識の基準となる第1の画像及び文字認識の対象となる1又は複数の第2の画像に含まれた1又は複数の指定領域について文字認識処理を行うステップと、前記第1の画像について指定領域ごとに前記文字認識処理により認識された文字列と該文字列の種類を記憶するステップと、前記1又は複数の第2の画像について指定領域ごとに前記文字認識処理により認識された文字列と前記記憶された文字列が文字列の種類ごとに定められた文字列の条件を満たさない場合、その旨を示す情報を出力するステップとを実行させるためのプログラムであることを特徴とする。
請求項1及び6に係る発明によれば、最初に指定された原稿の形式が2枚目以降の原稿の形式と異なる場合でも、原稿の2枚目以降の指定領域が間違って読み取られることが抑制される。
請求項2に係る発明によれば、原稿の2枚目以降の指定領域が間違って読み取られることが抑制される。
請求項3に係る発明によれば、文字列に含まれる文字の割合を用いた判定を行わない場合に比べて、原稿の2枚目以降の指定領域が間違って読み取られることが抑制される。
請求項4に係る発明によれば、複数の第2の画像の各々についての判定結果の統計が用いられない場合に比べて、原稿の2枚目以降の指定領域が誤って読み取られることが抑制される。
請求項5に係る発明によれば、第1の画像から生成された位置情報を第2の画像に用いることができる。
情報処理システムの構成を例示するブロック図。 情報処理装置10の機能構成を例示するブロック図。 情報処理装置10のハードウェア構成を例示するブロック図。 サーバ20のハードウェア構成を例示するブロック図。 原稿を例示する図。 マーカー種別テーブルの内容を例示する図。 指定領域がマーキングされた原稿を例示する図。 情報処理装置10が行う処理の流れを例示するフローチャート。 属性ごとの条件を例示する図。 ペーパーUIを例示する図。
[1]構成
図1は、本実施形態に係る情報処理システム1の構成を例示するブロック図である。情報処理システム1は、情報処理装置10及びサーバ20を備える。情報処理装置10は、
用紙等の媒体に画像を形成する画像形成処理や、原稿等の媒体に形成された画像を読み取る画像読取処理等の画像処理を行う。サーバ20はストレージサービス等の各種サービスを提供する。情報処理装置10は通信回線2によりサーバ20に接続されている。通信回線2は、例えばインターネット、移動体通信網、電話回線、及びLAN(local Area Network)などのうちの少なくとも1つを含む。
図2は情報処理装置10の機能構成を例示するブロック図である。情報処理装置10は、処理手段11、記憶手段12、出力手段13及び生成手段14を有する。処理手段11は、最初に指定された文字認識の基準となる第1の画像及び文字認識の対象となる1又は複数の第2の画像に含まれた1又は複数の指定領域について文字認識処理を行う。記憶手段12は、第1の画像について指定領域ごとに文字認識処理により認識された文字列と該文字列の種類を記憶する。この実施形態において、文字列の種類とは、文字列が分類されるカテゴリ(属性)をいう。文字列の種類は、例えば、「金額」、「日付」、「会社名」、「商品名」、住所」又は「氏名」である。
出力手段13は、1又は複数の第2の画像について指定領域ごとに文字認識処理により認識された文字列と記憶された文字列が文字列の種類ごとに定められた文字列の条件を満たさない場合、その旨を示す情報を出力する。出力される情報は、例えば画像読取手段に画像読取処理を停止させるための制御情報であってもよい。画像読取手段により行われる画像読取処理は、情報処理装置10にセットされた原稿等の媒体を1枚ずつ順次光学的に読み取る処理である。画像読取処理を停止させるとは、読取対象である原稿の画像読取手段への搬送や画像読取手段による光学的な読取を中断させる制御を行うことをいう。
生成手段14は、画像読取手段により読み取られた第1の画像を画像解析することにより、指定領域の位置を表す位置情報を生成する。この場合、処理手段11は、画像読取手段により第1の画像の読取処理の後に続けて読み取られた第2の画像において位置情報により示される指定領域に対し文字認識処理を行う。
図3は、情報処理装置10のハードウェア構成を例示する図である。プロセッサ101は、情報処理装置10の他の要素を制御するプロセッサである。メモリ102は、プロセッサ101がプログラムを実行するためのワークエリアとして機能する記憶装置であり、例えばRAM(Random Access Memory)を含む。ストレージ103は各種のプログラム及びデータを記憶する記憶装置であり、例えば、SSD(Solid State Drive)又はHDD(Hard Disk Drive)を含む。通信IF104は、予め定められた無線又は有線の通信規格(例えば、Wi−Fi(登録商標)、Bluetooth(登録商標)、又はイーサネット(登録商標))に従って他の装置と通信を行う。
UI部105は例えばタッチスクリーンとキーとを備える。UI部105は情報処理装置10に内蔵されていてもよく、また、外付けされて外部接続されるものであってもよい。画像形成部106は電子写真方式で用紙等の媒体に画像を形成する。画像読取部107は原稿(媒体)の画像を光学的に読み取る。画像処理部108は、例えばDSP(Digital Signal Processor)やGPU(Graphics Processing Unit)を備え、各種の画像処理を実行する。給紙部109は画像形成部106に用紙等の媒体を供給する。
この例で、メモリ102又はストレージ103に記憶されているプログラムを、プロセッサ101又は画像処理部108が実行することにより、図2に示される機能が実装される。プログラムを実行しているプロセッサ101又は画像処理部108は、処理手段11、出力手段13及び生成手段14の例である。
図4はサーバ20のハードウェア構成を例示する図である。プロセッサ201は、サー
バ20の他の要素を制御するプロセッサである。メモリ202は、プロセッサ201がプログラムを実行するためのワークエリアとして機能する記憶装置であり、例えばRAMを含む。ストレージ203は各種のプログラム及びデータを記憶する記憶装置であり、例えばSSD又はHDDを含む。通信IF204は、予め定められた無線又は有線の通信規格に従って他の装置と通信を行う。
[2]動作
この動作例では、情報処理装置10は、複数の原稿を読み取り、読み取られた原稿を表す画像データをストレージサーバであるサーバ20に蓄積する。蓄積される画像データには、文字認識により原稿から読み取られた文字から特定される属性(属性名及び属性値)が付与される。読取対象である原稿は文字(及び画像)を含むものであり、例えば請求書、領収書、レシート、免許証、又は会員証である。読取対象である原稿は定型フォームであってもよく、非定型フォームであってもよい。
属性名は、画像データの検索性の向上のために画像データに付与されるものであり、例えば、会社名、日付、商品名、人名又は請求金額である。例えば属性名が「請求金額」である属性の属性値には、その原稿から読み取られた請求金額を表す値が設定される。また、例えば属性名が「会社名」である属性の属性値には、その原稿から読み取られた会社名を表す文字列が設定される。ひとつの画像データに付与される属性の数は、1であってもよく、複数であってもよい。
図5は、情報処理装置10により読み取られる原稿を例示する図である。図5に例示される原稿A1は請求書である。図5の例では、原稿A1には、会社名、請求金額、請求書番号、請求日等を表す文字列が記されている。
ユーザは、1枚目の原稿(以下「ヘッダーシート」という)に、属性値の読み取りの対象とする領域(以下「指定領域」という)を指定する作業を行う。この実施形態では、ユーザは、原稿中の文字列に蛍光ペン等によりマーキングすることにより指定領域を指定する。この実施形態では、属性ごとにマーキングの態様(色、形状、等)が予め定められており、属性ごとのマーキングの態様を示すマーカー種別テーブルがストレージ103に記憶されている。ユーザは属性ごとに予め定められた手法でマーキングを行う。
図6はマーカー種別テーブルの内容を例示する図である。図7の例では、「属性名」と「マーカー種別」との各項目が互いに関連付けられている。これらの項目のうち、「属性名」の項目には、例えば「氏名」、「金額」又は「日付」等の属性名(文字列の種類)を示す情報が格納されている。「マーカー種別」の項目には、マーキングの態様(色、形状、等)を示す情報が格納されている。
図7は指定領域がマーキングされた原稿を例示する図である。図7の例では、社名が記された領域A111、請求金額が記された領域A112、請求書番号が記された領域A113、及び請求日が記された領域A114がユーザによりマーキングされている。指定領域の指定の仕方は、例えば、属性値として指定したい文字列を蛍光ペンでなぞるものであってもよく、また、例えば、指定したい文字列を線で囲むものであってもよい。また、例えば、指定したい文字列の左にチェックマーク等の予め定められた文字や記号をユーザが書き込むことにより指定領域が指定されてもよい。
ユーザが指定領域のマーキングを行う原稿は1枚のみであり、残りの原稿についてはマーキング作業を行わない。ユーザは、指定領域のマーキングを終えると、指定領域をマーキングした原稿が最初に読み取られるように、複数の原稿を情報処理装置10にセットし、UI部105を操作して画像読取処理の実行を指示する。
図8は、情報処理装置10が行う処理の流れを例示するフローチャートである。図8に示される処理は、ユーザにより複数の原稿が情報処理装置10にセットされ、スタートボタンが押下される等により画像読取処理が指示されたことをトリガとして開始される。
ステップS101において、情報処理装置10のプロセッサ101は画像読取部107を制御して画像読取を行わせる。ステップS101により、ヘッダーシートの原稿に対し画像読取が行われる。
ステップS102において、プロセッサ101は、画像読取部107により読み取られた1枚目の原稿(ヘッダーシート)の画像を画像解析することにより、属性値を特定するための文字認識の対象とする指定領域の属性名及び指定領域の位置を示す位置情報を生成する。この実施形態では、プロセッサ101は、読み取られた原稿を表す画像を解析し、予め定められたマーク方式に対応する特徴パターンを有する領域を特定する。例えば、プロセッサ101は、読み取られた原稿を表す画像を解析し、予め定められた背景色を有する領域(予め定められた色の蛍光ペンでマーキングされている指定領域)を特定する。読み取られた原稿が図7に例示されるものである場合、領域A111〜A114が指定領域として特定される。プロセッサ101は特定した指定領域に対応する属性名及び指定領域の位置を表す位置情報を、メモリ102又はストレージ103の予め定められた記憶領域(以下「記憶領域M1」という)に格納する。このように、この実施形態では、プロセッサ101は、画像読取部107により読み取られた1枚目の原稿(ヘッダーシート)の画像を画像解析することにより、文字認識の対象とする指定領域の位置を表す位置情報を生成する。1枚目の原稿(ヘッダーシート)の画像は、本発明に係る第1の画像の一例であり、最初に指定される文字認識の基準となる画像である。
また、ステップS102において、プロセッサ101は、ヘッダーシートの画像に含まれる指定領域について文字認識処理を行い、文字認識処理により認識された文字列と文字列の種類(属性名)をストレージ103の予め定められた文字列テーブルに記憶させる。文字列の種類は、ステップS102の画像解析により特定される指定領域の属性名である。
ステップS103において、プロセッサ101は、2枚目以降の原稿(後続の原稿)の画像読取を画像読取部107に行わせる。2枚目以降の原稿(後続の原稿)の画像は、本発明に係る第2の画像の一例であり、文字認識の対象となる画像である。
ステップS104において、プロセッサ101は、読み取られた原稿の枚数が、予め定められた閾値(X枚)以下であるかを判定する。X枚以下である場合(ステップS104;YES)、プロセッサ101はステップS105の処理に進む。一方、読み取られた原稿の枚数がX枚より多い場合(ステップS104;NO)、プロセッサ101はステップS121の処理に進む。
ステップS105乃至ステップS111において、プロセッサ101は、2枚目以降の原稿の画像について指定領域ごとに文字認識処理により認識された文字列と文字列テーブルに記憶された文字列が、文字列の種類ごとに定められた文字列の条件を満たさない場合、その旨を示す情報を出力する。具体的には、まず、ステップS105において、プロセッサ101は、読み取られた原稿を表す画像においてステップS102で生成された位置情報により示される指定領域(すなわち、ステップS102で特定された指定領域)に対し文字認識処理を行う。文字の認識処理は例えば、特開2007−304864号公報に記載された手法が用いられてもよい。また、プロセッサ101は認識された文字を形態素解析等の処理により、意味のある文字列に整形する処理を行う。ひとつの画像に指定領域
が複数ある場合は、複数の指定領域のそれぞれで文字認識処理や整形処理が行われる。これらの処理により、属性を特定するための文字列が原稿の画像から抽出される。例えば読み取られた原稿が図5に例示されるものである場合、図7の領域A111〜A114のそれぞれに対応する領域から、「○○○○○株式会社」、「\10,800-」、「20140999」及び「2014年9月10日」の4つの文字列が抽出される。
ステップS106において、プロセッサ101は、指定領域の文字認識結果に対し、文字列の種類ごとに予め定められたルールに基づいて正当性をチェックする。この実施形態では、プロセッサ101は、文字列に含まれる予め定められた種類の文字の割合が文字列の種類ごとに定められた条件を満たすかを判定する。ここでは、プロセッサ101は、2枚目以降の原稿(以下「後続ページ」という)の先頭からの数ページにおいて、文字認識処理により認識された文字数の合計値を指定領域ごとに算出する。更に、プロセッサ101は、予め定められた種類以外の種類の文字(以下「不適切文字」という)の数の合計値に対する割合が予め定められた閾値を超える場合に、ヘッダーシートが適切でないと判定する。例えば属性名(文字列の種類)が「氏名」である指定領域において、文字認識された文字列に含まれる記号文字の割合が閾値を超える場合、ヘッダーシートが適切でないと判定される。
図9は、属性名ごとに予め定義されたルール(条件)を例示する図である。図9の例では、属性名が「金額」である場合、プロセッサ101は、文字認識により読み取られた文字列に含まれる文字が、数値、「,」、「¥」、「円」、及び「−」のいずれかである文字数の合計の割合を算出し、算出された割合が予め定められた閾値以下である場合、ヘッダーシートが適切でないと判定する。
図8の説明に戻る。ステップS107において、プロセッサ101は、ステップS106のチェック結果(例えば、判定結果、各指定領域の文字認識結果の文字数、及び不適切文字数、等)を予め定められた記憶領域に格納する。
ステップS108において、プロセッサ101は、読み取られた原稿の枚数がX枚であるかを判定する。読み取られた原稿の枚数がX枚である場合(ステップS108;YES)、プロセッサ101はステップS109の処理に進む。一方、読み取られた原稿の枚数がX未満である場合(ステップS108;NO)、プロセッサ101はステップS122の処理に進む。
ステップS109乃至S110において、プロセッサ101は、2枚目以降の複数の原稿の画像についての上記条件を用いた判定結果を統計処理し、統計結果が予め定められた条件を満たすか否かを判定することにより、ヘッダーシートが適切であるかを判定する。統計結果は、例えば、合計文字数に対する不適切文字数の割合の平均値、又は合計値であってもよい。まず、ステップS109において、プロセッサ101は、文字数の合計に対する不適切文字数の合計の割合の平均値を算出する。ステップS110において、プロセッサ101は、ステップS109で算出された割合が予め定められた閾値以上であるかを判定する。閾値以上である場合(ステップS110;YES)、プロセッサ101はステップS111の処理に進む。一方、閾値未満である場合(ステップS110;NO)、プロセッサ101はステップS122の処理に進む。
上述のように、ヘッダーシートが適切でなかったと推定される場合(ステップS110;YES)、プロセッサ101はステップS111の処理に進む。この場合、ステップS111において、プロセッサ101は、画像読取部107に画像読取処理を停止させるための制御情報を出力することにより、画像読取部107を制御して画像読取処理を一時停止させる。また、ステップS111において、プロセッサ101は、画像読取処理を停止
させた旨を示すメッセージをUI部105に表示させたり警告音を出力したりする等により、画像読取処理を停止させた旨をユーザへ通知する。更に、プロセッサ101は、画像読取処理を継続させるか中止させるかをユーザが選択するための画面をUI部105に表示させる。ユーザへの通知後、プロセッサ101は、ユーザ操作により画像読取処理の継続又は中止が指示されるまで待機する。
ステップS112において、プロセッサ101は、ユーザによる指示が画像読取処理の中止であるか継続であるかを判定する。「中止」が指示された場合(ステップS112;中止)、プロセッサ101はステップS113の処理に進む。ステップS113において、プロセッサ101は画像読取処理を中止する。一方、「継続」が指示された場合(ステップS112;継続)、プロセッサ101はステップS122の処理に進む。
また、ステップS104の処理において、読み取られた原稿の枚数がXより大きい場合(ステップS104;NO)、プロセッサ101はステップS121の処理に進む。ステップS121において、プロセッサ101は次の原稿があるかを判定する。次の原稿がある場合(ステップS121;YES)、プロセッサ101はステップS103の処理に進む。一方、次の原稿がない場合(ステップS121;NO)、プロセッサ101は処理を終了する。
情報処理装置10により1又は複数の属性が付された画像データは、サーバ20等のストレージサーバに送信され、蓄積される。付与された属性は、例えばファイル(画像データ)が検索される際に、検索キーとして用いられる。
一方、ステップS110の処理において判定結果が「NO」である場合(ステップS110;NO)、又はステップS112の処理において判定結果が「継続」である場合(ステップS112;継続)、プロセッサ101はステップS122の処理に進む。ステップS122において、プロセッサ101は、次の原稿があるかを判定する。次の原稿がある場合(ステップS122;YES)、プロセッサ101はステップS103の処理に進む。一方、次の原稿がない場合(ステップS122;NO)、プロセッサ101は処理を終了する。
ところで、ヘッダーシートにより指定領域が指定され、指定された指定領域から属性名が抽出される場合、ユーザが意図しないヘッダーシートを誤って使用してしまった場合、間違った文字認識結果が属性名として付与されてしまう場合がある。この場合、ユーザが付与された属性名を目視等によりチェックするまで、指定領域が間違っていることに気付かないことが多い。そのため、ユーザが間違いに気付くまでに時間がかかってしまう場合がある。ユーザは、間違いに気付いてから、再度、情報処理装置10の設置場所まで赴いてスキャン作業をやり直す必要があり、作業の手戻りとなる。
それに対しこの実施形態では、ヘッダーシート上でマーカーにより指定領域が指定されるとともに、後続の数ページにおいて指定領域に対し文字認識が行われ、指定領域ごとに文字認識結果がその指定領域のルール(条件)を満たしているか(すなわちヘッダーシートが適切であるか)が確認される。ヘッダーシートが適切でないと判定された場合、連続スキャンは中断され、UI部105でユーザへ警告が通知されるとともに、中止か続行かがユーザにより選択される。ユーザは、間違ったヘッダーシートを使用した否かを確認し、間違っていた場合はスキャン処理を中止し、その場で正しいヘッダーシートに替えてスキャン作業をやり直す。これにより、作業の手戻りが大きくなってしまうことが抑制される。
[3]変形例
上述した実施形態は、本発明の実施の一例に過ぎず、以下のように変形させてもよい。また、上述した実施形態及び以下に示す各変形例は、必要に応じて組み合わされて実施されてもよい。
(1)上述の実施形態では、ユーザにより指定領域がマーキングされたヘッダーシートを画像読取することにより、指定領域の位置が特定された。また、プロセッサ101は、属性名とマーキング種別との対応関係を示すマーカー種別テーブル(図6)を参照することにより、指定領域と属性名との対応関係を特定した。指定領域と属性名との対応関係の特定方法は上述した実施形態で示したものに限られない。例えば、ペーパーUIを用いて両者の対応関係がユーザにより指定されてもよい。ペーパーUIが用いられる場合、ユーザは、ヘッダーシートの前又は後にペーパーUIが読み取られるように、ペーパーUIを読取対象である原稿及び/又はヘッダーシートに重ねて情報処理装置10にセットし、UI部105を用いて画像読取を指示する。
図10は、ペーパーUIを例示する図である。図の例で、ペーパーUIである原稿A2には、「氏名」、「金額」及び「日付」等の属性名が記載されているとともに、各属性名の右側にマーキング種別をユーザが記すための領域A211、A212、A213、…が設けられている。ユーザは原稿A2の領域A211、A212、A213、…に、自身が行いたいマーキング方式でマーキングを行う。ユーザによりマーキングされたペーパーUI(原稿A2)は、情報処理装置10により画像読取処理が行われる。情報処理装置10は、読み取った原稿の画像を画像解析し、解析結果に従ってストレージ103のマーカー種別テーブルに属性名とマーカー種別とを対応付けて記憶する。
また、指定領域と属性名との対応関係の特定方法として上記以外の他の方法が用いられてもよい。例えば、プロセッサ101が、ヘッダーシートにおいて指定された指定領域において文字認識された文字列から属性名を特定してもよい。この場合、属性値として想定される文字列又は文字の配列規則が属性名に対応付けられたテーブルが参照されることにより、属性名が特定されてもよい。
(2)上述の実施形態では、1枚の原稿に含まれる複数の指定領域についてまとめて文字認識処理が行われた(図8のステップS105)。文字認識処理の方法は上述した実施形態で示したものに限られない。例えば、複数の指定領域がある場合に、1箇所ごとに文字認識処理が行われ、指定領域の数だけそれらの処理が繰り返し実行されてもよい。
(3)上述の実施形態では、図8のステップS111において、プロセッサ101は、画像読取処理を停止させた旨を示すメッセージをUI部105に表示させたり警告音を出力したりする等により、画像読取処理を停止させた旨をユーザへ通知した。画像読取処理を停止した際に出力される情報は、上述した実施形態で示したものに限られない。例えば、プロセッサ101が、ヘッダーシートが間違っている可能性がある旨が記された電子メールを、ユーザに対応するメールアドレスに送信してもよい。
(4)上述の実施形態では、プロセッサ101は、文字認識された文字列に含まれる特定の種類の文字の割合が、各属性に対応する条件を満たすかを判定することにより、ヘッダーシートが適切であるかを判定した(図8のステップS106)。ヘッダーシートが適切であるかの判定方法は、上述した実施形態で示したものに限られない。例えば、プロセッサ101は、指定領域において文字認識された文字列に特定の文字が含まれるか否かを判定することによって、ヘッダーシートが適切であるかを判定してもよい。例えば、プロセッサ101は、「氏名」の属性に対応する指定領域において文字認識された文字列に記号文字が含まれている場合、ヘッダーシートが適切でないと判定してもよい。
(5)上述の実施形態では、情報処理装置10のストレージ103にマーカー種別テーブルが記憶されていた。マーカー種別テーブルは情報処理装置10以外の装置に記憶されてもよい。例えば、マーカー種別テーブルがサーバ20又は他の外部サーバに格納され、情報処理装置10が通信ネットワークを介してマーカー種別テーブルにアクセスする構成であってもよい。
また、マーカー種別テーブルは情報処理装置等の装置により更新されてもよい。更新処理は、例えば、情報処理装置10のユーザによりUI部105が操作されることにより、属性名がテーブルに登録されてもよい。
(6)上述の実施形態において情報処理装置10により実行された処理の一部が、サーバ20等の他の装置により実行されてもよい。例えば、上述の実施形態において情報処理装置10により実行された文字認識処理がサーバ20により実行されてもよい。また、例えば、情報処理装置10とサーバ20が協働することにより図2に示す各機能が実装されてもよい。
(7)上述の実施形態において、情報処理装置10のプロセッサ101又はサーバ20のプロセッサ201により実行されるプログラムは、インターネットなどの通信回線を介してダウンロードされてもよい。また、これらのプログラムは、磁気記録媒体(磁気テープ、磁気ディスクなど)、光記録媒体(光ディスクなど)、光磁気記録媒体、半導体メモリなどの、コンピュータが読取可能な記録媒体に記録した状態で提供されてもよい。
10…情報処理装置、11…処理手段、12…記憶手段、13…出力手段、14…生成手段、101…プロセッサ、102…メモリ、103…ストレージ、104…通信IF、105…UI部、106…画像形成部、107…画像読取部、108…画像処理部。

Claims (6)

  1. 最初に指定された文字認識の基準となる第1の画像及び文字認識の対象となる1又は複数の第2の画像に含まれた1又は複数の指定領域について文字認識処理を行う処理手段と、
    前記第1の画像について指定領域ごとに前記文字認識処理により認識された文字列と該文字列の種類を記憶する記憶手段と、
    前記1又は複数の第2の画像について指定領域ごとに前記文字認識処理により認識された文字列と前記記憶された文字列が文字列の種類ごとに定められた文字列の条件を満たさない場合、その旨を示す情報を出力する出力手段と
    を有する情報処理装置。
  2. 前記出力手段は、画像読取手段に画像読取処理を停止させるための制御情報を出力する
    請求項1に記載の情報処理装置。
  3. 前記出力手段は、前記文字列に含まれる予め定められた種類の文字の割合が該文字列に対応する条件を満たさない場合、前記情報を出力する
    請求項1又は2に記載の情報処理装置。
  4. 前記出力手段は、画像読取手段により読み取られた複数の前記第2の画像の各々について、前記文字列の前記条件を用いた判定結果の統計結果が予め定められた条件を満たさない場合、前記情報を出力する
    請求項1乃至3のいずれか1項に記載の情報処理装置。
  5. 画像読取手段により読み取られた前記第1の画像を画像解析することにより、前記指定領域の位置を表す位置情報を生成する生成手段
    を更に有し、
    前記処理手段は、前記画像読取手段により前記第1の画像の読取処理の後に続けて読み取られた前記第2の画像において前記位置情報により示される指定領域に対し文字認識処理を行う
    請求項1乃至4のいずれか1項に記載の情報処理装置。
  6. コンピュータに、
    最初に指定された文字認識の基準となる第1の画像及び文字認識の対象となる1又は複数の第2の画像に含まれた1又は複数の指定領域について文字認識処理を行うステップと、
    前記第1の画像について指定領域ごとに前記文字認識処理により認識された文字列と該文字列の種類を記憶するステップと、
    前記1又は複数の第2の画像について指定領域ごとに前記文字認識処理により認識された文字列と前記記憶された文字列が文字列の種類ごとに定められた文字列の条件を満たさない場合、その旨を示す情報を出力するステップと
    を実行させるためのプログラム。
JP2018100417A 2018-05-25 2018-05-25 情報処理装置及びプログラム Pending JP2019204401A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2018100417A JP2019204401A (ja) 2018-05-25 2018-05-25 情報処理装置及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2018100417A JP2019204401A (ja) 2018-05-25 2018-05-25 情報処理装置及びプログラム

Publications (1)

Publication Number Publication Date
JP2019204401A true JP2019204401A (ja) 2019-11-28

Family

ID=68727047

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018100417A Pending JP2019204401A (ja) 2018-05-25 2018-05-25 情報処理装置及びプログラム

Country Status (1)

Country Link
JP (1) JP2019204401A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7393960B2 (ja) 2020-01-24 2023-12-07 株式会社日本総合研究所 情報処理装置、情報処理方法、およびプログラム

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09134405A (ja) * 1995-11-09 1997-05-20 Fujitsu Ltd 帳票読取装置
JP2004166062A (ja) * 2002-11-14 2004-06-10 Hitachi Ltd 書類読取装置
JP2006133880A (ja) * 2004-11-02 2006-05-25 Canon Inc 情報処理装置及び情報処理方法
JP2017010069A (ja) * 2015-06-16 2017-01-12 シャープ株式会社 情報処理装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09134405A (ja) * 1995-11-09 1997-05-20 Fujitsu Ltd 帳票読取装置
JP2004166062A (ja) * 2002-11-14 2004-06-10 Hitachi Ltd 書類読取装置
JP2006133880A (ja) * 2004-11-02 2006-05-25 Canon Inc 情報処理装置及び情報処理方法
JP2017010069A (ja) * 2015-06-16 2017-01-12 シャープ株式会社 情報処理装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7393960B2 (ja) 2020-01-24 2023-12-07 株式会社日本総合研究所 情報処理装置、情報処理方法、およびプログラム

Similar Documents

Publication Publication Date Title
US11361572B2 (en) Information processing apparatus and non-transitory computer readable medium
US11070686B2 (en) Image processing apparatus, control method of image processing apparatus, and recording medium
US20100251110A1 (en) Document processing apparatus, control method therefor, and computer-readable storage medium storing program for the control method
US10445041B2 (en) Image forming apparatus, control method of image forming apparatus, and storage medium
JP4861868B2 (ja) 画像処理装置、画像処理方法、画像処理プログラム及び記録媒体
US8136120B2 (en) Methods and systems of reconciling sources of print job processing information in a print processing environment
US20170286030A1 (en) Data processing device and non-transitory computer readable medium
JP2019204401A (ja) 情報処理装置及びプログラム
US8687239B2 (en) Relevance based print integrity verification
US8218178B2 (en) Image processing apparatus, image processing method, recording medium storing image processing program, and computer data signal embedded in carrier wave
US20200314268A1 (en) Information processing apparatus, method for controlling information processing apparatus, and non-transitory computer readable medium
CN112541498A (zh) 信息处理装置以及记录媒体
JP2007052615A (ja) 文書処理装置、ルールデータ生成方法およびプログラム
JP2012216083A (ja) 文書作成装置、文書作成プログラム、文書作成方法及び文書作成装置を用いた漏洩元特定システム
JP2019161352A (ja) 情報処理装置及び情報処理プログラム
JP2018005801A (ja) 画像処理装置
JP6613871B2 (ja) 情報処理装置、画像読み取り装置、および、プログラム
US20110157658A1 (en) Imaging processing apparatus, method for controlling the same, and program
US11587348B2 (en) Document classification system and non-transitory computer readable recording medium storing document classification program
JP7404943B2 (ja) 情報処理装置及び情報処理プログラム
US11076061B2 (en) Information processing apparatus and system and non-transitory computer readable medium that stores environmental information when providing a service has previously failed
JP2008123446A (ja) ログ情報管理システム、ログ情報管理装置、ログ情報管理方法及びログ情報管理プログラム
US20210281696A1 (en) Information processing apparatus and non-transitory computer readable medium
JP2013045437A (ja) 文書ファイルの差分抽出システム、画像処理装置、文書ファイルの差分抽出方法及びプログラム
JP4360418B2 (ja) 画像処理装置、ビューワ、画像処理プログラム及び画像処理システム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20210319

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20220214

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20220315

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220427

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20220823