JP7271889B2 - 情報処理装置及びプログラム - Google Patents

情報処理装置及びプログラム Download PDF

Info

Publication number
JP7271889B2
JP7271889B2 JP2018178484A JP2018178484A JP7271889B2 JP 7271889 B2 JP7271889 B2 JP 7271889B2 JP 2018178484 A JP2018178484 A JP 2018178484A JP 2018178484 A JP2018178484 A JP 2018178484A JP 7271889 B2 JP7271889 B2 JP 7271889B2
Authority
JP
Japan
Prior art keywords
character
characters
correction
certainty
threshold
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2018178484A
Other languages
English (en)
Other versions
JP2020052502A (ja
Inventor
康夫 中島
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Fujifilm Business Innovation Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd, Fujifilm Business Innovation Corp filed Critical Fuji Xerox Co Ltd
Priority to JP2018178484A priority Critical patent/JP7271889B2/ja
Publication of JP2020052502A publication Critical patent/JP2020052502A/ja
Application granted granted Critical
Publication of JP7271889B2 publication Critical patent/JP7271889B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

本発明は、情報処理装置及びプログラムに関する。
近年、表示された画像を確認しつつ文字を訂正する際、操作者の負担を軽減するようにした文字認識装置が提案されている(例えば、特許文献1参照。)。
特許文献1に記載された文字認識装置は、送信された画像データを表示画面の画像表示領域に表示する画像表示制御部と、画像データに対して文字認識を行い、文字列ごとに確信度を生成する文字認識部とを備え、画像表示制御部は、確信度に応じた背景の色で画像データを調整する。
特開2003-108919号公報
本発明の課題は、画像を読み取って得られた文字の認識結果の訂正画面を、空欄で表示する場合よりも、操作者の訂正入力作業の効率を上げる情報処理装置及びプログラムを提供することにある。
[1]読み取られた画像に対する文字認識結果の、文字の確からしさを示す確信度を取得する取得手段と、
前記文字認識結果のうち前記確信度が閾値以下の文字を含む文字列を訂正画面に表示するよう制御する表示制御手段と、
前記訂正画面において表示されている前記文字列全体に対して訂正する文字を受け付ける受付手段と、を備え
前記訂正する文字が前記確信度が前記閾値を超える文字と異なる場合、前記表示制御手段は、その旨を示す情報を前記訂正画面に表示するよう制御する、情報処理装置。
読み取られた画像に対する文字認識結果の、文字の確からしさを示す確信度を取得する取得手段と、
前記文字認識結果のうち前記確信度が閾値以下の文字を含む文字列を訂正作業量に応じた訂正画面に表示するよう制御する表示制御手段と、
前記訂正画面において表示されている前記文字列に対して訂正する文字を受け付ける受付手段と、を備えた情報処理装置。
]前記訂正作業量は、前記文字列中の前記確信度が閾値以下の文字の数である、前記[]に記載の情報処理装置。
]前記訂正作業量は、前記文字列の文字数に対する前記確信度が閾値以下の文字数の割合である、前記[]に記載の情報処理装置。
]前記訂正画面は、前記文字列のうち前記確信度が閾値以下の文字の位置を示す位置情報を含む、前記[1]から[4]のいずれか1つに記載の情報処理装置。
]前記訂正画面は、訂正する文字の入力欄を含み、
前記受付手段は、前記文字列のうち前記確信度が閾値以下の複数の文字の訂正のみを受け付ける場合、前記位置情報が訂正されていない文字を飛ばして移動されたとき、前記訂正されていない文字については前記文字認識結果を前記入力欄にコピーする、前記[]に記載の情報処理装置。
]前記受付手段は、前記文字列のうち前記確信度が閾値以下の複数の文字の訂正のみを受け付ける場合、前記訂正する文字を受け付けたとき、前記確信度が閾値以下の訂正されていない文字に前記位置情報を移動させる、前記[]に記載の情報処理装置。
]コンピュータを、読み取られた画像に対する文字認識結果の、文字の確からしさを示す確信度を取得する取得手段と、
前記文字認識結果のうち前記確信度が閾値以下の文字を含む文字列を訂正画面に表示するよう制御する表示制御手段と、
前記訂正画面において表示されている前記文字列全体に対して訂正する文字を受け付ける受付手段、として機能させるためのプログラムであって、
前記訂正する文字が前記確信度が前記閾値を超える文字と異なる場合、前記表示制御手段は、その旨を示す情報を前記訂正画面に表示するよう制御する、プログラム。
[9]コンピュータを、読み取られた画像に対する文字認識結果の、文字の確からしさを示す確信度を取得する取得手段と、前記文字認識結果のうち前記確信度が閾値以下の文字を含む文字列を訂正作業量に応じた訂正画面に表示するよう制御する表示制御手段と、前記訂正画面において表示されている前記文字列に対して訂正する文字を受け付ける受付手段、として機能させるためのプログラム。
請求項1、に係る発明によれば、操作者は、画像を読み取って得られた認識結果のうち、確信度が閾値以下の文字を含む文字列を訂正することができるとともに、確信度が閾値以下の文字のみの訂正を受け付ける場合よりも、操作者の作業負担を軽減させることができ文字認識手段により正しく認識された文字に対して操作者が誤って入力した場合に、そのことを操作者に知らせることができる。
求項4、9に係る発明によれば、操作者は、画像を読み取って得られた認識結果のうち、確信度が閾値以下の文字を含む文字列を訂正することができるとともに、訂正作業量に応じた訂正画面で訂正することができる。
請求項に係る発明によれば、訂正すべき文字を位置情報で認識することができる。
請求項に係る発明によれば、訂正されなかった文字については認識結果を利用することができる。
請求項に係る発明によれば、訂正すべき文字が複数存在する場合、その位置が分かり易くなる。
図1は、本発明の実施の形態に係る情報処理システムの構成例を示すブロック図である。 図2は、帳票の一例を示す図である。 図3は、訂正文字列テーブルの一例を示す図である。 図4は、確認訂正設定画面の一例を示す図である。 図5(a)~(c)は、部分入力モードに対応した訂正画面の一例を示す図である。 図6(a)~(c)は、全入力モードに対応した訂正画面の一例を示す図である。 図7(a)~(c)は、部分入力モードに対応した訂正画面の他の例を示す図である。 図8(a)~(c)は、部分入力モードに対応した訂正画面の変形例を示す図である。 図9は、本実施の形態に係る情報処理システムの動作の一例を示すフローチャートである。
以下、本発明の実施の形態について図面を参照して説明する。なお、各図中、実質的に同一の機能を有する構成要素については、同一の符号を付してその重複した説明を省略する。
[実施の形態の要約]
本実施の形態に係る情報処理装置は、読み取られた画像に対する文字認識結果の、文字の確からしさを示す確信度を取得する取得手段と、文字認識結果のうち確信度が閾値以下の文字を含む文字列を訂正画面に表示するよう制御する表示制御手段と、訂正画面において表示されている前記文字列に対して訂正する文字を受け付ける受付手段とを備える。
文字認識とは、読取対象の画像に含まれる手書きや活字による文字パターンをJISコード等の文字コードに変換する処理をいう。読取対象は、例えば、帳票等の紙文書である。確信度は、文字の確からしさを示す指標のことである。確信度として、例えば、認識対象の文字パターンをベクトルに変換し、文字認識結果の文字コードに対応する標準パターンをベクトルに変換し、両者のベクトル間の距離(例えば、ユークリッド距離等)や類似度(例えば、コサイン類似度等)等で表した指標を用いてもよい。訂正画面の表示には、端末装置に訂正画面を送信し端末装置に表示する態様や、自己が有する表示部に訂正画面を表示する態様等が含まれる。
[実施の形態]
図1は、本発明の実施の形態に係る情報処理システムの構成例を示すブロック図である。この情報処理システム1は、帳票10(図2参照)から画像を読み取る読取装置2と、読取装置2により読み取られた画像(以下「読取画像」ともいう。)を受信し、帳票10に記入された文字を認識する情報処理装置3と、情報処理装置3による認識結果に対して文字の訂正を行う端末装置4とを備える。帳票10は、読取対象の一例である。
読取装置2は、帳票10を光学的に走査して帳票10の画像を読み取るスキャナと、スキャナによる読取画像を情報処理装置3に送信する送信部とを備える。
端末装置4は、タッチパネル等で実現される表示部と、キーボード、マウス等で実現される入力部と、CPU(Central Processing Unit)、インターフェース等で実現される制御部と、プログラムやデータ等を記憶する記憶部等で構成される。端末装置4は、例えば、パーソナルコンピュータや、タブレット型端末、多機能携帯電話機(スマートフォン)等の携帯情報端末を用いることができる。端末装置4は、情報処理装置3から送信された訂正画面60(図5等参照)に含まれる文字列に対して訂正し、訂正内容を情報処理装置3に送信する。
(情報処理装置の構成)
情報処理装置3は、この装置3の各部を制御する制御部30と、各種の情報を記憶する記憶部31とを備える。
制御部30は、CPU(Central Processing Unit)、インターフェース等から構成されている。CPUは、記憶部31に記憶されたプログラム311に従って動作することにより、設定手段300、領域抽出手段301、文字認識手段302、低確信度文字列抽出手段303、表示制御手段304、受付手段305等として機能する。これらの手段300~305については後述する。文字認識手段302は、取得手段の一例である。
記憶部31は、ROM(Read Only Memory)、RAM(Random Access Memory)、ハードディスク等から構成される。記憶部31は、プログラム311、認識結果情報312、設定情報313、訂正文字列テーブル314(図3参照)、帳票データ315、文字認識辞書316等の各種情報を記憶する。
認識結果情報312は、読取装置2から送信された読取画像のうち領域抽出手段301により抽出された画像(以下「抽出画像」ともいう。)に対して文字認識手段302が文字認識処理を行って得られた認識結果、及び文字認識手段302により文字ごとに求められた確信度が、文字認識手段302により帳票10の種類(例えば、申請書、納品書等)を識別する帳票ID、帳票10を特定する帳票管理番号、及び項目を識別する項目IDに関連付けて記憶部31に記憶されるものである。
設定情報313は、確認訂正設定画面50(図4参照)で設定された設定内容が、設定手段300により端末装置4の操作者を識別するユーザIDごとに記憶部31に記憶されるものである。
訂正文字列テーブル314は、低確信度文字列抽出手段303により抽出された文字列について、認識結果、確信度、確信度が閾値以下の文字(以下、「低確信度文字」ともいう。)の文字数が、低確信度文字列抽出手段303により帳票ID、帳票管理番号、及び項目IDに関係付けられて記録されるものである。なお、帳票管理番号が帳票一枚ごとに異なる番号が付されていない場合、情報処理装置2の内部で帳票管理番号に相当する番号を割り当て、スキャンイメージと訂正情報とを対応付けて管理してもよい。
帳票データ315は、認識結果、又は認識結果に対して訂正された場合は訂正後の文字が、受付手段305により帳票ID、帳票管理番号、及び項目IDに関係付けられて記憶部31に記憶されるものである。
文字認識辞書316は、例えば、JISコード等の文字コードごとに標準パターンが格納されたものである。
図2は、帳票10の一例を示す図である。帳票10は、申請日、氏名、住所、希望欄等の複数の項目11a~11d(これらを総称するときは、以下「項目11」ともいう。)を有し、項目11ごとに手書きで記入される記入欄12a~12f(これらを総称するときは、以下「記入欄12」ともいう。)が設けられている。帳票10は、予め帳票IDごとに項目11の位置が定められている。希望欄の項目11dは、複数行に渡って記入できる領域を有している。帳票10には、右上に帳票ID(例えば、T001)、及び帳票管理番号(例えば、12345)が記録されている。
図3は、訂正文字列テーブル314の一例を示す図である。訂正文字列テーブル314は、帳票IDが記録される帳票IDの欄、帳票管理番号が記録される帳票管理番号の欄、項目IDが記録される項目IDの欄、認識結果が上段に記録される認識結果(上段)の欄、及び確信度が下段に記録される確信度(下段)の欄を有する。図2に示す帳票10の場合、申請日、氏名、住所、希望欄の各項目11a~11dにそれぞれ項目IDとしてK01、K02、K03、K04、K05が付与されているものとする。図3に示す場合は、例えば、帳票IDがT001、帳票管理番号が12345、項目IDがK03について記録されている。なお、図3中、確信度を・・・で表示している箇所は確信度が90%以上(図4では97%)であることを示す。
図4は、確認訂正設定画面の一例を示す図である。確認訂正設定画面50は、キーボード、マウス、タッチパネルのうち訂正する文字を選択する選択デバイスを選択するためのチェックボックス51と、確信度の閾値を表示する確信度表示部52と、確信度表示部52に表示される確信度の閾値を変更するスライドバー部53と、訂正モードを切り替えるための低確信度文字の文字数(図4では訂正文字数)の閾値を表示する文字数表示部54と、文字数表示部54に表示される文字数を変更するアローボタン55a、55bとを有する。訂正モードには、例えば、部分入力モード、全入力モードがある。部分入力モードとは、文字列のうち一部の文字を再入力するモードである。全入力モードとは、文字列の全ての文字を再入力するモードである。選択デバイスは、選択手段の一例である。
チェックボックス51で選択デバイスを選択すると、選択デバイスに応じた訂正画面が表示制御手段304により作成され、端末装置4に送信される。
スライドバー部53は、スライドバー53aを上下方向に移動させることにより閾値が設定され、設定された閾値が確信度表示部52に表示される。ここで設定された閾値以下の確信度が低確信度文字として訂正の対象になる。
アローボタン55a、55bを操作することにより文字数が文字数表示部54に表示される。ここで設定された文字数以上の低確信度文字が記入欄12に存在すると、当該記入欄12に対しては全入力モードとなり、設定された文字数未満の低確信度文字が記入欄12に存在すると、当該記入欄12に対しては部分入力モードとなる。
次に、制御部30の各手段300~305について説明する。
設定手段300は、端末装置4からの要求に基づき確認訂正設定画面50を端末装置4に送信する。設定手段300は、確認訂正設定画面50で設定された設定内容をユーザIDごとに設定情報313として記憶部31に記憶する。
領域抽出手段301は、読取装置2から送信された読取画像から記入欄12の内側の領域を抽出画像として抽出し、抽出画像を項目IDごとに文字認識手段302に出力する。
文字認識手段302は、抽出画像について文字の認識を行うとともに、文字の確からしさを示す確信度を出力する文字認識処理を行う。すなわち、文字認識手段302は、例えば、抽出画像に含まれる文字パターンをベクトルに変換し、文字認識辞書316に格納された標準パターンをベクトルに変換し、両者のベクトル間の類似度を確信度として算出し、文字パターンを類似度が最大の文字コードに変換する。類似度としては、例えば、コサイン類似度を用いる。文字コードは、認識結果の一例である。文字認識手段302は、認識結果及び確信度を、帳票ID、帳票管理番号、及び項目IDに関連付けて認識結果情報312として記憶部31に記憶する。
低確信度文字列抽出手段303は、記憶部31に記憶された認識結果情報312から低確信度文字を有する項目の文字列を抽出し、低確信度文字の文字数を算出する。そして低確信度文字列抽出手段303は、認識結果の文字列、確信度、及び低確信度文字の文字数を、帳票ID、帳票管理番号、及び項目IDに関連付けて訂正文字列テーブル314に記録する。
表示制御手段304は、訂正作業量に対応した訂正画面60を作成し、端末装置4に送信する。ここで、訂正作業量とは、例えば、文字列の訂正を開始してから終了するまでの時間である。訂正作業量は、例えば、低確信度文字の文字数で評価してもよく、文字列の文字数に対する低確信度文字の文字数の割合で評価してもよく、他の方法で評価してもよい。
具体的には、表示制御手段304は、訂正文字列テーブル314に記録された低確信度文字の文字数Nxと設定情報313として設定された文字数Ntとを比較し、Nx≦Ntの場合は、低確信度文字のみを再入力する部分入力モードに対応する訂正画面60を作成し、Nx>Ntの場合は、文字列の全て文字を再入力する全入力モードに対応する訂正画面60を作成し、端末装置4に送信する。
また、表示制御手段304は、部分入力モードにおいて、低確信度文字に対して訂正する文字の入力が完了した場合に、確認メッセージ63を訂正画面60に表示し、全入力モードにおいて、高確信度文字と異なる文字が入力された場合に、警告メッセージ64を訂正画面60に表示する。警告メッセージ64は、その旨を示す情報の一例である。また、表示制御手段304は、訂正作業量及び選択された選択デバイスに応じた訂正画面60を作成してもよい。
受付手段305は、訂正画面60に含まれる文字列に対して訂正する文字を受け付ける。また、受付手段305は、モードに応じた方法で訂正する文字を受け付ける。すなわち、部分入力モードでは、認識結果の文字列のうち低確信度文字に対して訂正する文字のみを受け付けてもよい。また、受付手段205は、全入力モードでは、認識結果の文字列全体に対して訂正する文字を受け付けてもよい。
受付手段305は、文字列のうち確信度が閾値以下の複数の文字の訂正のみを受け付ける場合、カーソル62(図5参照)が訂正されていない文字を飛ばして移動されたとき、訂正されていない文字については認識結果を入力領域61dにコピーしてもよい。また、受付手段305は、文字列のうち確信度が閾値以下の複数の文字の訂正のみを受け付ける場合、訂正する文字を受け付けたとき、確信度が閾値以下の訂正されていない文字にカーソル62を移動させてもよい。カーソル62は、低確信度文字の位置を示す位置情報の一例である。
(実施の形態の動作)
次に、情報処理システム1の動作の一例について図9を参照して説明する。図9は、情報処理システム1の動作の一例を示すフローチャートである。
低確信度文字列抽出手段303は、設定情報313及び訂正文字列テーブル314を参照して、項目ごとに低確信度文字の文字数が設定された文字数以上か否かを判断する(S1)。
低確信度文字の文字数が設定された文字数以下の場合(S1:Yes)、表示制御手段304は、部分入力モードで訂正する文字(訂正文字ともいう。)の入力を促す(S2)。すなわち、表示制御手段304は、部分入力モードに対応した訂正画面(図5参照)を作成し、端末装置4に送信する。
図5は、部分入力モードに対応した訂正画面の一例を示す図である。同図に示す訂正画面60は、認識結果のうち訂正する文字を選択する選択デバイスとしてキーボードが選択された場合を示す。訂正画面60は、表示制御手段304により作成され、抽出画像が表示される第1の表示領域61aと、認識結果が表示される第2の表示領域61bと、第2の表示領域61bに表示された認識結果の文字列の中で最低の確信度を表示する確信度表示部61cと、訂正文字が入力される入力領域61dとを含む。図5(a)に示すように、最初は第2の表示領域61bに表示された文字列のうち先頭側の低確信度文字にカーソル62が表示される。図5に示す場合の認識結果は、「追浜市西区みな4みらい6-1」となり、「追」、「4」が低確信度文字となっている。「追」の確信度が70%であったために確信度表示部61cに70%が表示されている。入力領域61dは、入力欄の一例である。
受付手段305は、入力があったか否かを判断する(S3)。文字の入力があった場合、図5(b)に示すように、入力領域61dに入力された文字を表示する(S4)。このとき、図5(b)に示すように、カーソル62が右隣に移動してもよく、操作者の操作に応じて移動させてもよい。
操作者が端末装置4のキーボードの文字送りキーでカーソル62を図5(c)に示すようにさらに右に送ると(S3:文字送りキー)、受付手段305は、カーソル62を移動して飛ばした文字の認識結果を入力領域61dにコピーする(S5)。図5(c)に示す場合は、カーソル62を認識結果の「追」から「4」まで移動したため、「追」と「4」との間の認識結果の「浜市西区みな」が入力領域61dにコピーされて表示される。キーボードの文字戻しキーでカーソル62を左側に戻せばカーソル62の位置の認識結果の文字が訂正の対象になる(S3:文字戻しキー)。なお、訂正画面60では、認識結果を明朝体で表示し、入力領域61dに入力される文字をゴシック体で表示しているが、両者の字体は同じでもよいし、どの字体で表示するかは操作者や管理者の設定により選択できるものとしてもよい。
受付手段305は、入力が完了したか否かを判断する(S7)。すなわち、カーソル62が第2の表示領域61bの右端の文字に達し、右端の文字が低確信度文字でない場合や、右端の文字が低確信度文字であり、その文字を訂正するために文字が入力された場合は、受付手段305は、入力が完了したと判断する(S7:Yes)。訂正する文字数が比較的少ない場合、部分入力モードとすれば、操作者によっては認識結果の文字列の全てを入力する場合よりも作業負担が軽減される場合がある。
上記ステップS1において、低確信度文字の文字数が設定された文字数を超える場合(S1:Yes)、表示制御手段304は、全入力モードで訂正する文字(訂正文字ともいう。)の入力を促す(S8)。すなわち、表示制御手段304は、全入力モードに対応した訂正画面(図6参照)を作成し、端末装置4に送信する。
図6は、全入力モードに対応した訂正画面の一例を示す図である。同図に示す訂正画面60は、認識結果のうち訂正する文字を選択する選択デバイスとしてキーボードが選択された場合を示す。訂正画面60は、図5(a)に示す訂正画面60と同様に、第1の表示領域61a、第2の表示領域61b、確信度表示部61c、及び入力領域61dを含むが、図5(a)に示したようなカーソル62は表示されない。図6に示す場合の認識結果は、「追浜市凸区丼な4丼らい6-1」であり、「追」、「凸」、「丼」、「4」、「丼」が低確信度文字となっている。「凸」、「丼」の一方又は両方の確信度が40%であったために確信度表示部61cに40%が表示されている。
操作者は、図6(b)に示すように、キーボードを操作して入力領域61dに文字列の全てを入力する(S9)。
受付手段305は、入力された文字列と認識結果のうち低確信度文字以外の文字(以下、「高確信度文字」ともいう。)とに差が生じているか否かを判断する(S10)。差が生じていない場合(S10:No)、表示制御手段304は、図6(b)に示すように、「入力された内容で確定します。」のような確認メッセージ63を訂正画面60に表示する(S11)。操作者はキーボードを操作して、訂正内容を確定させる場合は「OK」ボタン63aを選択し、修正が必要な場合は「戻る」ボタン63bを選択する。
差が生じている場合は(S10:Yes)、表示制御手段304は、図6(c)に示すように、「入力と、認識結果に差があります。確認してください。」のような警告メッセージ64を訂正画面60に表示する(S12)。操作者は、キーボードを操作して、差があってもそのまま確定させる場合は「OK」ボタン64aを選択し、修正が必要な場合は「戻る」ボタン64bを選択する。図6(c)に示す場合、入力領域61dに入力された文字列のうち「5」に入力ミスとなっているため、表示制御手段304によりそれが目立つようにカーソル62がその文字「5」に表示されている。
上記ステップS11、S12において、確認メッセージ63又は警告メッセージ64で「戻る」ボタン63b、64bが選択された場合は、受付手段305は、訂正画面60の入力領域61dへの入力を受け付ける(S13)。訂正する文字数が比較的多い場合、部分入力モードで入力すると、1文字ごとに訂正する文字の入力が必要となるため、操作者によっては全文入力モードで連続して入力した方が作業負担が軽減される場合がある。
(訂正画面の他の例)
図7は、部分入力モードに対応した訂正画面の他の例を示す図である。同図に示す訂正画面60は、認識結果のうち訂正する文字を選択する選択デバイスとしてタッチパネルが選択された場合を示す。訂正画面60は、表示制御手段304により作成され、図5に示す訂正画面60と同様に、第1の表示領域61a、第2の表示領域61b、確信度表示部61c、及び入力領域61dを含むが、図5(a)に示したカーソル62は表示されない。図7に示す場合の認識結果は、「追浜市西区みな4みらい6-1」であり、「追」、「4」が低確信度文字となっている。「追」の確信度が70%であったために確信度表示部61cに70%が表示されている。
図7(a)に示すように、認識結果のうち訂正対象の文字「追」、「4」をそれぞれペンでタッチして選択マーク65を付加すると、図7(b)に示すように、認識結果の対応する文字にカーソル62が表示される。また、選択していない文字が、受付手段305により認識結果からコピーして入力領域61dに表示されるとともに、受付手段305により訂正対象の文字の部分に空白のスペース66が表示され、入力枠67が拡大して表示される。入力枠67に訂正する文字をペンで入力すると、図7(c)に示すように、受付手段305により次のスペース66を拡大した入力枠67が表示される。入力枠67の面積が拡大して表示されることでペンで書き込みやすくなる。なお、スペース66又は入力枠67にキーボードで文字を入力してもよい。部分入力モードの場合、端末装置4の表示部の表示面積が小さい場合でも面積を拡大した入力枠67を複数設けることができる。
(変形例1)
図8は、部分入力モードに対応した訂正画面の変形例を示す図である。同図に示す訂正画面60は、 認識結果のうち訂正する文字を選択する選択デバイスとしてタッチパネルが選択された場合を示す。訂正画面60は、表示制御手段304により作成され、図7に示す訂正画面60と同様に、第1の表示領域61a、第2の表示領域61b、確信度表示部61c、及び入力領域61dを含み、文字列中に全ての低確信度文字にカーソル62が表示されている。さらに、全入力モードに対応した訂正画面に切り替えるための「全入力」ボタン61eが表示されている。「全入力」ボタン61eは、訂正モードを切り替える切替え手段の一例である。
図8(a)に示すように、認識結果のうち訂正対象の文字「追」、「4」をそれぞれペンでタッチして選択マーク65を付加すると、図8(b)に示すように、認識結果の対応する文字にカーソル62が表示される。また、先頭側の訂正対象の文字以外の文字が、受付手段305により認識結果からコピーして入力領域61dに表示されるとともに、受付手段305により先頭側の訂正対象の文字の部分に空白のスペース66が表示され、入力枠67が拡大して表示される。入力枠67に訂正する文字をペンで入力すると、図7(c)に示すように、次の訂正対象の文字に空白のスペース66が表示されるとともに、スペース66を拡大した入力枠67が表示される。
「全入力」ボタン61eを選択すると、図8(c)に示すように、表示制御手段304は、部分入力モードに対応した訂正画面60に切り替える。図8(c)に示す訂正画面60には、部分入力モードに対応した訂正画面60に切り替えるための「部分入力」ボタン61fが表示される。なお、全入力モードに対応した訂正画面60又は部分入力モードに対応した訂正画面60を最初に表示するかは、ディフォルトで定めてよい。「部分入力」ボタン61fは、訂正モードを切り替える切替え手段の一例である。
以上、本発明の実施の形態を説明したが、本発明の実施の形態は上記実施の形態に限定されるものではなく、本発明の要旨を変更しない範囲内で種々の変形、実施が可能である。例えば、上記実施の形態では、端末装置4に訂正画面60を表示したが、情報処理装置3に入力部及び表示部を設け、その表示部に訂正画面を表示して文字の訂正を受け付けてもよい。また、上記実施の形態では、情報処理装置3に1つの端末装置を接続したが、情報処理装置3にネットワーク(有線、無線を問わない)を介して複数の端末装置4を接続してもよい。
制御部30の各手段は、それぞれ一部又は全部を再構成可能回路(FPGA:Field Programmable Gate Array)、特定用途向け集積回路(ASIC:Application Specific Integrated Circuit)等のハードウエア回路によって構成してもよい。
また、本発明の要旨を変更しない範囲内で、上記実施の形態の構成要素の一部を省くことや変更することが可能である。また、本発明の要旨を変更しない範囲内で、上記実施の形態のフローにおいて、ステップの追加、削除、変更、入替え等が可能である。また、上記実施の形態で用いたプログラムをCD-ROM等のコンピュータで読み取り可能な記録媒体に記録して提供することができ、クラウドサーバ等の外部サーバに格納しておき、ネットワークを介して利用することもできる。
1…情報処理システム、2…読取装置、3…情報処理装置、4…端末装置、10…読取画像、11、11a-11d…項目、12、12a-12f…記入欄、30…制御部、31…記憶部、50…確認訂正設定画面、51…チェックボックス、52…確信度表示部、53…スライドバー部、53a…スライドバー、54…文字数表示部、55a、55b…アローボタン、60…訂正画面、61a…第1の表示領域、61b…第2の表示領域、61c…確信度表示部、61d…入力領域、61e…「全入力」ボタン、61f…「部分入力」ボタン、62…カーソル、63…確認メッセージ、63a…「OK」ボタン、63b…「戻る」ボタン、64…警告メッセージ、64a…「OK」ボタン、64b…「戻る」ボタン、65…選択マーク、66…スペース、67…入力枠、300…設定手段、301…領域抽出手段、302…文字認識手段、303…低確信度文字列抽出手段、304…表示制御手段、305…受付手段、311…プログラム、312…認識結果情報、313…設定情報、314…訂正文字列テーブル、315…帳票データ、316…文字認識辞書

Claims (9)

  1. 読み取られた画像に対する文字認識結果の、文字の確からしさを示す確信度を取得する取得手段と、
    前記文字認識結果のうち前記確信度が閾値以下の文字を含む文字列を訂正画面に表示するよう制御する表示制御手段と、
    前記訂正画面において表示されている前記文字列全体に対して訂正する文字を受け付ける受付手段と、を備え
    前記訂正する文字が前記確信度が前記閾値を超える文字と異なる場合、前記表示制御手段は、その旨を示す情報を前記訂正画面に表示するよう制御する、
    情報処理装置。
  2. 読み取られた画像に対する文字認識結果の、文字の確からしさを示す確信度を取得する取得手段と、
    前記文字認識結果のうち前記確信度が閾値以下の文字を含む文字列を訂正作業量に応じた訂正画面に表示するよう制御する表示制御手段と、
    前記訂正画面において表示されている前記文字列に対して訂正する文字を受け付ける受付手段と、
    を備えた情報処理装置。
  3. 前記訂正作業量は、前記文字列中の前記確信度が閾値以下の文字の数である、
    請求項に記載の情報処理装置。
  4. 前記訂正作業量は、前記文字列の文字数に対する前記確信度が閾値以下の文字数の割合である、
    請求項に記載の情報処理装置。
  5. 前記訂正画面は、前記文字列のうち前記確信度が閾値以下の文字の位置を示す位置情報を含む、
    請求項1からのいずれか1項に記載の情報処理装置。
  6. 前記訂正画面は、訂正する文字の入力欄を含み、
    前記受付手段は、前記文字列のうち前記確信度が閾値以下の複数の文字の訂正のみを受け付ける場合、前記位置情報が訂正されていない文字を飛ばして移動されたとき、前記訂正されていない文字については前記文字認識結果を前記入力欄にコピーする、
    請求項に記載の情報処理装置。
  7. 前記受付手段は、前記文字列のうち前記確信度が閾値以下の複数の文字の訂正のみを受け付ける場合、前記訂正する文字を受け付けたとき、前記確信度が閾値以下の訂正されていない文字に前記位置情報を移動させる、
    請求項に記載の情報処理装置。
  8. コンピュータを、
    読み取られた画像に対する文字認識結果の、文字の確からしさを示す確信度を取得する取得手段と、
    前記文字認識結果のうち前記確信度が閾値以下の文字を含む文字列を訂正画面に表示するよう制御する表示制御手段と、
    前記訂正画面において表示されている前記文字列全体に対して訂正する文字を受け付ける受付手段、として機能させるためのプログラムであって、
    前記訂正する文字が前記確信度が前記閾値を超える文字と異なる場合、前記表示制御手段は、その旨を示す情報を前記訂正画面に表示するよう制御する、
    プログラム。
  9. コンピュータを、
    読み取られた画像に対する文字認識結果の、文字の確からしさを示す確信度を取得する取得手段と、
    前記文字認識結果のうち前記確信度が閾値以下の文字を含む文字列を訂正作業量に応じた訂正画面に表示するよう制御する表示制御手段と、
    前記訂正画面において表示されている前記文字列に対して訂正する文字を受け付ける受付手段、
    として機能させるためのプログラム。
JP2018178484A 2018-09-25 2018-09-25 情報処理装置及びプログラム Active JP7271889B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2018178484A JP7271889B2 (ja) 2018-09-25 2018-09-25 情報処理装置及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2018178484A JP7271889B2 (ja) 2018-09-25 2018-09-25 情報処理装置及びプログラム

Publications (2)

Publication Number Publication Date
JP2020052502A JP2020052502A (ja) 2020-04-02
JP7271889B2 true JP7271889B2 (ja) 2023-05-12

Family

ID=69997125

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018178484A Active JP7271889B2 (ja) 2018-09-25 2018-09-25 情報処理装置及びプログラム

Country Status (1)

Country Link
JP (1) JP7271889B2 (ja)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004152115A (ja) 2002-10-31 2004-05-27 Toshiba Corp 入力修正方法および入力修正支援システム
JP2012043385A (ja) 2010-08-23 2012-03-01 Toshiba Corp 文字認識装置および文字認識方法
JP2012146147A (ja) 2011-01-12 2012-08-02 Hitachi Solutions Ltd 文書処理装置、及び文書処理プログラム
JP2015185157A (ja) 2014-09-02 2015-10-22 三菱電機インフォメーションシステムズ株式会社 文字データ修正方法、文字データ修正装置およびプログラム

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004152115A (ja) 2002-10-31 2004-05-27 Toshiba Corp 入力修正方法および入力修正支援システム
JP2012043385A (ja) 2010-08-23 2012-03-01 Toshiba Corp 文字認識装置および文字認識方法
JP2012146147A (ja) 2011-01-12 2012-08-02 Hitachi Solutions Ltd 文書処理装置、及び文書処理プログラム
JP2015185157A (ja) 2014-09-02 2015-10-22 三菱電機インフォメーションシステムズ株式会社 文字データ修正方法、文字データ修正装置およびプログラム

Also Published As

Publication number Publication date
JP2020052502A (ja) 2020-04-02

Similar Documents

Publication Publication Date Title
US20090226090A1 (en) Information processing system, information processing apparatus, information processing method, and storage medium
JP2019041150A (ja) スキャン画像にファイル名等を設定するための装置、その制御方法及びプログラム
JP5910345B2 (ja) 文字入力プログラム、情報処理装置および文字入力方法
US11836442B2 (en) Information processing apparatus, method, and storage medium for associating metadata with image data
JP2006031299A (ja) 文字認識方法、文字データの修正履歴処理方法およびシステム
US10097724B2 (en) System, control method, and recording medium
US11875587B2 (en) Information processing system, information processing method, and non-transitory recording medium
JP7271889B2 (ja) 情報処理装置及びプログラム
JP2006277001A (ja) 入力イメージ表示方法および入力イメージ表示プログラム
JP7241506B2 (ja) 光学式文字認識結果の修正支援装置および修正支援用プログラム
JP2006127499A (ja) イメージ処理装置
US11042695B2 (en) Information processing apparatus and non-transitory computer readable medium for generating input screen information
JP5089524B2 (ja) 文書処理装置、文書処理システム、文書処理方法、及び、文書処理プログラム
US10706337B2 (en) Character recognition device, character recognition method, and recording medium
JP6763173B2 (ja) 文書修正方法、文書修正装置、およびコンピュータプログラム
JP6921522B2 (ja) 画像処理装置及びその制御方法並びにプログラム
JP7031465B2 (ja) 情報処理装置及びプログラム
US20170249299A1 (en) Non-transitory computer readable medium and information processing apparatus and method
US11409408B2 (en) Display apparatus and non-transitory computer readable medium storing program
JP6201638B2 (ja) 帳票処理装置及びプログラム
JP2022010994A (ja) データ入力支援装置、データ入力支援方法及びプログラム
JP5243228B2 (ja) 文字認識装置、文字認識装置の確認画面生成方法
JP2021068306A (ja) 情報処理装置およびプログラム
JP2020052480A (ja) 情報処理装置及びプログラム
JP2012190357A (ja) 画像処理装置、画像処理方法、およびプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20210906

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20220913

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20221004

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20221125

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230328

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230410

R150 Certificate of patent or registration of utility model

Ref document number: 7271889

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150