JP2014137791A - 表示プログラム、表示装置及び表示方法 - Google Patents

表示プログラム、表示装置及び表示方法 Download PDF

Info

Publication number
JP2014137791A
JP2014137791A JP2013007489A JP2013007489A JP2014137791A JP 2014137791 A JP2014137791 A JP 2014137791A JP 2013007489 A JP2013007489 A JP 2013007489A JP 2013007489 A JP2013007489 A JP 2013007489A JP 2014137791 A JP2014137791 A JP 2014137791A
Authority
JP
Japan
Prior art keywords
text data
word
data
display
processing unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2013007489A
Other languages
English (en)
Inventor
Takashi Segawa
誉史 瀬川
Isao Magara
勲 真柄
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2013007489A priority Critical patent/JP2014137791A/ja
Publication of JP2014137791A publication Critical patent/JP2014137791A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Character Discrimination (AREA)

Abstract

【課題】オペレータによるテキストデータのチェック・修正作業の簡素化を図る。
【解決手段】データ処理部40は、入力欄に対して複数の文字が手書きされた振込依頼書の画像データから、複数の文字に対応するテキストデータを生成し、テキストデータと、単語辞書DB34に格納されている単語データとに基づいて、テキストデータを複数の文字群(分割部分又は単語)に分割し、分割位置を識別可能な状態でテキストデータを表示するよう、表示処理部50に対して指示を出す。
【選択図】図3

Description

本件は、表示プログラム、表示装置及び表示方法に関する。
従来、金融機関の窓口業務等において手書きされた書類(伝票)を読み取って電子化する技術や、オペレータによる電子化されたデータの修正作業を支援する技術が知られている(例えば、特許文献1、2参照)。
国際公開02/46988号 特開平6−251186号公報
電子化されたデータをチェックし、修正する作業では、オペレータは手書き文字と電子化されたテキストデータを比較する作業を行う必要があり、煩雑である。したがって、テキストデータを表示する際には、オペレータがチェックや修正作業を行いやすくなるように表示することが好ましい。
1つの側面では、本発明は、手書き文字に対応するテキストデータのチェック作業を簡素化することが可能な表示プログラム、表示装置及び表示方法を提供することを目的とする。
本発明者は、鋭意研究の結果、オペレータがテキストデータをチェックする場合、手書き文字とこれに対応するテキストデータを1文字1文字照らし合わせながらチェックするのではなく、誤って認識された、或いは認識不可であった文字が含まれる単語がどのようなものであるかを推測しながらチェックすることが多いことに気づいた。本明細書に記載の表示プログラム、表示装置及び表示方法は、上記新規知見に基づくものである。
本明細書に記載の表示プログラムは、入力欄に対して複数の文字が手書きされた書類の画像データから、前記複数の文字に対応するテキストデータを生成し、前記テキストデータと、格納部に格納されている複数の単語データとに基づいて、前記テキストデータを複数の文字群に分割し、前記テキストデータにおける分割位置を識別可能な状態で、前記テキストデータを表示する、処理をコンピュータに実行させる表示プログラムである。
本明細書に記載の表示装置は、入力欄に対して複数の文字が手書きされた書類の画像データから、前記複数の文字に対応するテキストデータを生成する生成部と、複数の単語データを格納する格納部と、前記テキストデータと、前記格納部に格納されている複数の単語データとに基づいて、前記テキストデータを複数の文字群に分割する分割部と、前記テキストデータにおける分割位置を識別可能な状態で、前記テキストデータを表示する表示部と、を備えている。
本明細書に記載の表示方法は、入力欄に対して複数の文字が手書きされた書類の画像データから、前記複数の文字に対応するテキストデータを生成する工程と、前記テキストデータと、格納部に格納されている複数の単語データとに基づいて、前記テキストデータを複数の文字群に分割する工程と、前記テキストデータにおける分割位置を識別可能な状態で、前記テキストデータを表示する工程と、をコンピュータが実行する表示方法である。
本実施例に記載の表示プログラム、表示装置及び表示方法は、手書き文字に対応するテキストデータのチェック作業を簡素化することができるという効果を奏する。
一実施形態に係る帳票処理システムの構成を概略的に示す図である。 図2(a)は、サーバのハードウェア構成を示す図であり、図2(b)は、オペレータ端末のハードウェア構成を示す図である。 サーバ及びオペレータ端末の機能ブロック図である。 振込依頼書の一例を示す図である。 認識結果DBのデータ構造の一例を示す図である。 単語辞書DBのデータ構造の一例を示す図である。 強調表示DBのデータ構造の一例を示す図である。 振込DBのデータ構造の一例を示す図である。 データ処理部の一連の処理を示すフローチャートである。 図9のステップS16の具体的処理を示すフローチャートである。 図9のステップS22の具体的処理を示すフローチャートである。 図12(a)〜図12(d)は、図10の処理を説明するための図(その1)である。 図13(a)〜図13(c)は、図10の処理を説明するための図(その2)である。 図14(a)〜図14(c)は、図10の処理を説明するための図(その3)である。 オペレータ端末に表示される画面データの一例を示す図である。 カーソルの表示位置を説明するための図である。 修正後の画面データの一例を示す図である。 変形例に係る画面データを示す図である。
以下、一実施形態について、図1〜図17に基づいて詳細に説明する。図1には、一実施形態に係る帳票処理システム100が概略的に示されている。
本実施形態の帳票処理システム100は、図1に示すように、表示装置としてのサーバ10と、オペレータ端末20と、スキャナ60と、を備える。サーバ10、オペレータ端末20及びスキャナ60は、インターネットやLAN(Local Area Network)などのネットワーク80に接続されている。なお、スキャナ60は、オペレータ端末20に対してUSB(Universal Serial Bus)ケーブル等を介して接続されていてもよい。
図2(a)には、サーバ10のハードウェア構成が示されている。図2(a)に示すように、サーバ10は、CPU(Central Processing Unit)90、ROM(Read Only Memory)92、RAM(Random Access Memory)94、記憶部(ここではHDD(Hard Disk Drive))96、表示部93、入力部95、ネットワークインタフェース97、及び可搬型記憶媒体用ドライブ99等を備えている。これらサーバ10の構成各部は、バス98に接続されている。表示部93は、液晶ディスプレイ等を含み、入力部95は、キーボードやマウス、タッチパネル等を含む。サーバ10では、ROM92あるいはHDD96に格納されているプログラム(表示プログラムを含む)、或いは可搬型記憶媒体用ドライブ99が可搬型記憶媒体91から読み取ったプログラム(表示プログラムを含む)をCPU90が実行することにより、図3に示すデータ処理部40としての機能が実現される。データ処理部40は、帳票に記載された手書き文字をテキストデータ化する処理や、テキストデータをオペレータ端末20の表示部193上に表示するための処理などを行う。なお、図3には、サーバ10のHDD96等に格納されているイメージDB(database)30、認識結果DB32、格納部としての単語辞書DB34、強調表示DB36、振込DB38も図示されている。なお、各DB30〜38の具体的なデータ構造等については後述する。
図2(b)には、オペレータ端末20のハードウェア構成が示されている。図2(b)に示すように、オペレータ端末20は、CPU190、ROM192、RAM194、記憶部(HDD)196、表示部193、入力部195、ネットワークインタフェース197、及び可搬型記憶媒体用ドライブ199等を備えており、オペレータ端末20の構成各部は、バス198に接続されている。表示部193は、液晶ディスプレイ等を含み、入力部195は、キーボードやマウス、タッチパネル等を含む。オペレータ端末20においては、CPU190がプログラムを実行することで、図3に示す表示処理部50及び入力処理部52としての機能が実現される。表示処理部50は、サーバ10のデータ処理部40からの指示に応じて、オペレータ端末20の表示部193上に帳票に関する画面を表示する。入力処理部52は、オペレータ端末20の利用者(金融機関の窓口のオペレータ等)が入力部195を介して入力した情報を受け付け、当該情報をサーバ10のデータ処理部40に対して送信する。
図1に戻り、スキャナ60は、帳票(本実施形態では、図4に示すような振込依頼書)を読み込んで画像データ(イメージ)を生成する装置である。スキャナ60で生成された画像データは、図3に示すサーバ10のデータ処理部40に入力され、データ処理部40によってイメージDB30に格納される。
ここで、サーバ10が有するDB(イメージDB30、認識結果DB32、単語辞書DB34、強調表示DB36、振込DB38)について説明する。
イメージDB30は、スキャナ60で生成された画像データを格納するデータベースである。イメージDB30は、図4に示すような振込依頼書の画像データが格納される。ここで、振込依頼書には、振込日、振込先金融機関(銀行名、支店名)、金額、手数料、科目(普通・当座)、口座番号、受取人、依頼人、備考の各入力欄が設けられている。振込依頼人は、各入力欄に対して主に手書きで文字を記入することが可能である。
認識結果DB32は、図5に示すようなデータ構造を有している。この認識結果DB32には、データ処理部40がOCR(Optical Character Reader)機能を用いて手書き文字を認識した結果(テキストデータ)と、認識の際の正読率(読み取りの確からしさを表す度合)と、が格納される。なお、本実施形態では、認識結果DB32には、振込依頼書のうち誤認識の可能性が高い(正読率が低い)入力欄である、「受取人」、「依頼人」、「備考」に記載された手書き文字の認識結果と正読率と、が格納されるものとする。なお、「受取人」、「依頼人」、「備考」の入力欄の正読率が低いのは、片仮名で記入されているためである。なお、データ処理部40は、文字認識できなかった文字があった場合、当該文字に対応する欄に「?(リジェクト)」を格納する。
なお、「銀行名」、「支店名」の入力欄、及び数字が記載される入力欄(「振込日」など)は、記載される文字が限定されているため、誤認識の可能性は低い(正読率は高い)と考えられる。したがって、これらの認識結果は、認識結果DB32には格納されない。また、「金額」などの重要項目については、認識結果DB32には格納されない。
単語辞書DB34には、振込依頼書に記入される頻度が所定値以上である単語データが登録されたDBである。単語辞書DB34には、例えば、図6に示すような人名や地名、役職名や会社名などの単語(片仮名表記)のデータが格納されている。なお、単語辞書DB34は、オペレータ等が随時更新できるようにしてもよいし、学習機能により単語データが随時更新されるようにしてもよい。
強調表示DB36は、図7に示すようなデータ構造を有している。この強調表示DB36には、認識結果DB32に登録されている認識結果データが格納されている。また、強調表示DB36では、認識結果データが、所定のルールに基づいて分割されるとともに、色分けされる。なお、上記所定のルールについては後述する。
振込DB38は、データ処理部40の認識結果(テキストデータ)をオペレータ等がチェック・修正した結果(確定した振込依頼書の内容)を格納する。振込DB38は、図8に示すようなデータ構造を有しているものとする。なお、振込DB38は、複数の振込依頼書のデータを1つのデータベースにてまとめて(表形式にて)管理してもよい。
次に、本実施形態におけるデータ処理部40の処理について、図9〜図11のフローチャートに沿って、その他図面を適宜参照しつつ、詳細に説明する。
図9は、帳票処理システム100(特にデータ処理部40)の一連の処理を示すフローチャートであり、図10は、図9のステップS16の具体的処理を示すフローチャートであり、図11は、図9のステップS22の具体的処理を示すフローチャートである。
図9の処理では、まず、ステップS10において、データ処理部40が、スキャナ60によって振込依頼書の読み取りが行われるまで待機する。すなわち、データ処理部40は、振り込み依頼者が手書きした振込依頼書をスキャナ60を用いて読み取る作業をオペレータが行った段階で、ステップS12に移行する。
ステップS12では、データ処理部40が、OCR機能を用いて文字認識処理を実行する。この文字認識処理により、データ処理部40は、図8の振込DB38の「振込日」、「銀行名」、「支店名」、「科目」の欄に認識した結果を入力する。なお、データ処理部40は、「銀行名」、「支店名」の文字認識処理においては、銀行名や支店名の漢字表記とカタカナ表記とを対応付けたリスト(不図示の銀行名・支店名DB)を参照するものとする。また、データ処理部40は、文字認識処理により、図5の認識結果DB32の「受取人」、「依頼人」、「備考」の欄に認識結果(テキストデータ)と正読率を入力する。なお、データ処理部40は、振込依頼書の「受取人」、「依頼人」、「備考」の欄のうち、片仮名表記された文字列のみを文字認識し、漢字や平仮名などで表記された文字列(「株式会社 富士通 太郎」など)は文字認識しないものとする。
なお、振込依頼書の重要項目である「金額」などについては、オペレータが直接入力した値が図8の振込DB38に格納されるものとする。ただし、これに限らず、データ処理部40が、重要項目の文字認識結果とオペレータが直接入力した結果とが一致するか否かを判断した後(いわゆるベリファイチェックをした後)、振込DB38に入力結果を格納することとしてもよい。
次いで、ステップS14では、データ処理部40が、認識結果DB32の各項目(以下、「認識項目」と呼ぶ)の1つを処理対象とする。具体的には、データ処理部40は、認識結果DB32の「受取人」、「依頼人」、「備考」のうちの1つ(ここでは、「受取人」とする)を処理対象とする。
次いで、ステップS16では、データ処理部40が、単語別判定処理のサブルーチンを実行する。具体的には、データ処理部40は、図10のフローチャートに沿った処理を実行する。
図10の処理では、まず、ステップS30において、データ処理部40が、処理対象を強調表示DB36にコピーし、スペース(空白)で分割する。具体的には、図12(a)に示すように、処理対象の「受取人」の認識結果(テキストデータ)を、強調表示DB36にコピーし、スペース(空白)ごとに分割する。なお、図12(a)では、分割結果が太線枠にて示されている。
次いで、ステップS32では、データ処理部40が、1つの分割部分を処理対象とする。ここでは、分割部分「カフ゛シキカ゛?シカ」が処理対象とされたものとする。
次いで、ステップS34では、データ処理部40が、単語辞書DB34に格納された単語データと一致する部分があるか否かを判断する。この場合、データ処理部40は、図6の単語辞書DB34を参照して、「カフ゛シキ」が単語データと一致する部分であると判断する。
ステップS34の判断が肯定された場合、ステップS42に移行し、データ処理部40は、一致部分とそれ以外の部分を単語と認識する(図12(b)参照)。次いで、ステップS44では、データ処理部40が、1つの単語を処理対象とする。ここでは、単語「カフ゛シキ」が処理対象とされたものとする。次いで、ステップS46では、データ処理部40が、単語辞書DB34に格納された単語データと一致する部分か否かを判断する。ここでの判断が肯定されると、ステップS54に移行し、データ処理部40は、正読率が所定値より小さい文字(ここでは、正読率が80%未満の文字とする)がないか否かを判断する。この場合、データ処理部40は、認識結果DB32のうち、処理対象の単語「カフ゛シキ」の各文字の正読率を参照して正読率80%未満の文字がないかを判断する。ここでの判断が肯定された場合には、ステップS56において、データ処理部40は、通常表示とし(色付き表示とせず)、ステップS60に移行する。一方、図5のように、処理対象の単語「カフ゛シキ」のうち「カ」や「シ」の正読率が80%未満であるような場合には、ステップS54の判断が否定され、ステップS58に移行する。ステップS58では、データ処理部40が、処理対象の単語「カフ゛シキ」を強調表示(水色)し(図12(c)参照)、ステップS60に移行する。
ステップS60に移行すると、データ処理部40は、処理対象の分割部分の全単語の処理が終了したか否かを判断するが、ここでは、まだ、単語「カ゛?シカ」の処理が終了していないので、ステップS60の判断は否定され、ステップS44に戻る。
ステップS44では、データ処理部40が、残りの単語「カ゛?シカ」を処理対象とする。次いで、ステップS46では、データ処理部40が、単語辞書と一致する部分か否かを判断するが、ここでの判断が否定されると、ステップS48に移行し、データ処理部40が、処理対象の単語「カ゛?シカ」にリジェクト(「?」マーク)が有るか否かを判断する。ここでの判断が肯定されると、ステップS52に移行し、データ処理部40は、処理対象の単語「カ゛?シカ」を強調表示(赤色)し(図12(d)参照)、ステップS60に移行する。一方、ステップS48の判断が否定された場合(処理対象の単語にリジェクトが含まれていなかった場合)には、データ処理部40は、処理対象の単語を強調表示(黄色)し、ステップS60に移行する。ステップS60では、データ処理部40が、処理対象の分割部分の全単語の処理が終了したか否かを判断し、ここでの判断が肯定されると、ステップS62に移行する。なお、ステップS62に移行すると、データ処理部40は、全分割部分の処理が終了したか否かを判断するが、ここでの判断が否定されると、ステップS32に戻る。
ステップS32に戻ると、データ処理部40は、次の分割部分「7シ゛ツウ」を処理対象とし、次のステップS34では、単語辞書と一致する部分があるか否かを判断する。ここでの判断が否定されると、ステップS36に移行し、データ処理部40は、リジェクトがあるか否かを判断するが、処理対象の分割部分「7シ゛ツウ」には「?」が含まれていないので、判断は否定され、ステップS38に移行する。ステップS38では、データ処理部40は、処理対象の分割部分「7シ゛ツウ」を強調表示(黄色)し(図13(a)参照)、ステップS62に移行する。
そして、ステップS62の判断が否定され、ステップS32に戻ると、データ処理部40は、次の分割部分「タ?ウ」を処理対象とし、次のステップS34では、単語辞書と一致する部分があるか否かを判断する。その後は、ステップS34(否定)、ステップS36(否定)の後、ステップS40にて、データ処理部40は、処理対象の分割部分「タ?ウ」を強調表示(赤色)し(図13(b)参照)、ステップS62に移行する。そして、ステップS62の判断が肯定されると、図9のステップS18に移行する。
ステップS18に移行すると、データ処理部40は、全ての認識項目(「受取人」、「依頼人」、「備考」)を既に処理対象としたか否かを判断する。ここでの判断が否定されると、ステップS14に戻り、データ処理部40は、次の認識項目(ここでは「依頼人」)を処理対象とする。
その後は、図13(c)に示すように、「依頼人」の文字列をスペースで分割し、各分割部分「?゛イヒヨウ?リツマリヤ7」、「フシ゛ツウ」、「ハナユ」それぞれに対して、図10の処理(S16)を実行する。これにより、図14(a)に示すように、「?゛イヒヨウ?リツマリヤ7」が強調表示(赤色)(S40)、「フシ゛ツウ」が通常表示(S56)、「ハナユ」が強調表示(黄色)(S38)となる。
また、ステップS14において処理対象が、「備考」となると、図14(b)に示すように、分割部分「シ゛ヨウニフリコミナ?ヨウテ゛?ソタ゛イナツ」(スペースが無いため分割されない)が処理対象となり、単語辞書と一致する部分「フリコミ」と、それ以外の部分「シ゛ヨウニ」、「ナ?ヨウテ゛?ソタ゛イナツ」が単語として認識される(S42)。そして、各単語「シ゛ヨウニ」、「フリコミ」、「ナ?ヨウテ゛?ソタ゛イナツ」それぞれに対して、図10のステップS44〜S58の処理・判断を実行することで、図14(c)に示すように、「シ゛ヨウニ」が強調表示(黄色)(S50)、「フリコミ」が通常表示(S56)、「ナ?ヨウテ゛?ソタ゛イナツ」が強調表示(赤色)(S52)となる。
以上のように全ての認識項目が処理対象となった後は、ステップS18の判断が肯定されるので、ステップS20に移行する。なお、通常表示される単語は、誤認識の可能性が最も低く、修正する必要がないと考えられる単語を意味する。また、強調表示(水色)される単語は、誤認識の可能性は低いため、修正しなくてもよい可能性が高いが、注意すべき単語を意味する。また、強調表示(黄色)される単語は、リジェクト文字は無いものの、修正する必要がある単語を意味し、強調表示(赤色)される単語は、リジェクト文字があり、修正する必要がある単語を意味する。
ステップS20に移行すると、データ処理部40は、画面表示を実行する。具体的には、図15に示すような画面データを強調表示DB36と、振込DB38と、イメージDB30に基づいて作成して、当該画面データをオペレータ端末20の表示処理部50に対して送信する。なお、表示処理部50は、受信した画面データをオペレータ端末20の表示部193上に表示する。なお、図15の画面データのうち、四角枠内には、イメージDB30に格納されている手書き文字が表示されるようになっている。また、図15の画面データでは、ステップS30やステップS42で単語等に分割された位置が識別可能となるように、強調表示の色に応じた表示が行われる。この場合、図15のように文字の背景が各色に塗り分けられてもよいし、文字自体が各色で表示されてもよい。
次いで、ステップS22では、修正処理(目検チェック処理とも呼ばれる)のサブルーチンが実行される。この修正処理では、図11のフローチャートに沿った処理が実行される。
図11の処理では、まず、ステップS70において、データ処理部40が、画面データの中に強調表示(赤色又は黄色)された単語があるか否かを判断する。ここでの判断が否定された場合には、ステップS82に移行するが、肯定された場合には、ステップS72に移行する。なお、図15の画面データの場合には、強調表示された単語があるので、ステップS72に移行する。
ステップS72に移行すると、データ処理部40は、先頭の強調表示(赤色又は黄色)された単語の先頭文字に、文字入力用(テキストデータ修正用)のカーソルを表示するよう、表示処理部50に対して指示を出す。この場合、表示処理部50は、図16の位置Aにカーソルを表示する。
次いで、ステップS74では、入力処理部52は、オペレータからの入力を受け付ける。この場合、オペレータは、カーソルの表示されている単語(ご認識の可能性が高い単語)を修正することができ、入力処理部52は、当該修正結果を受け付ける。なお、オペレータは、カーソルを自由に動かすことができるものとし、カーソルの表示された単語以外も自由に修正できるものとする。また、図16の画面の四角枠内には、振込依頼者による手書き文字(片仮名や漢字、平仮名)が表示されているので、オペレータは、当該手書き文字を参照しながら、テキストデータを修正できるようになっている。更に、画面上においては、単語の区切りと、単語ごとの修正必要性(赤色、黄色、水色)とが明確に表示されているので、オペレータは、修正すべき部分を適切に判断することができる。
次いで、ステップS76では、入力処理部52は、ステップS74で受け付けた入力が、オペレータによる「次へ」の操作であったか否かを判断する。なお、オペレータは、例えばキーボードの「enter」キーや、「space」キーを押すことで「次へ」の操作ができるものとする。オペレータによって当該操作が行われた場合、ステップS78に移行する。
ステップS78に移行すると、データ処理部40は、表示処理部50に対して、次の強調表示(黄色又は赤色)された単語の先頭にカーソルを表示する指示を出し、ステップS74に戻る。この場合、表示処理部50は、次の強調表示(黄色又は赤色)された単語の先頭にカーソルを表示する。
例えば、オペレータが、単語「カ゛?シカ」を修正し終えた後(単語「カ゛?シカ」にカーソルが位置している状態)で「次へ」の操作をした場合には、表示処理部50は、図16の位置Bにカーソルを表示する。また、単語「7シ゛ツウ」にカーソルが位置している状態でオペレータが「次へ」の操作をした場合には、表示処理部50は、位置Cにカーソルを表示する。また、単語「タ?ウ」にカーソルが位置している状態でオペレータが「次へ」の操作をした場合には、表示処理部50は、位置Dにカーソルを表示する。また、単語「?゛イヒヨウ?リツマリヤ7」や「フシ゛ツウ」にカーソルが位置している状態でオペレータが「次へ」の操作をした場合には、表示処理部50は、位置Eにカーソルを表示する。また、単語「ハナユ」にカーソルが位置している状態でオペレータが「次へ」の操作をした場合には、表示処理部50は、位置Fにカーソルを表示する。また、単語「シ゛ヨウニ」や「フリコミ」にカーソルが位置している状態でオペレータが「次へ」の操作をした場合には、表示処理部50は、位置Gにカーソルを表示する。更に、単語「ナ?ヨウテ゛?ソタ゛イナツ」や「カフ゛シキ」にカーソルが位置している状態でオペレータが「次へ」の操作をした場合には、表示処理部50は、位置Aにカーソルを表示する。
一方、ステップS76の判断が否定されて、ステップS80に移行すると、データ処理部40は、修正処理完了か否かを判断する。この場合、データ処理部40は、図15,図16の画面内に存在する「修正終了(振込)」ボタンがオペレータによって押されたという情報を入力処理部52から受信したか否かを判断する。ここでの判断が否定された場合には、ステップS74に戻るが、肯定された場合には、ステップS86に移行する。
ステップS86に移行すると、入力処理部52は、修正後のデータをデータ処理部40に送信し、図9のステップS24に移行する。なお、図17には、図15、図16の画面のテキストデータをオペレータが修正した後の画面の状態が示されている。
ところで、ステップS70の判断が否定された場合、すなわち、画面データ内に強調表示(赤色又は黄色)が無かった場合には、ステップS82において、入力処理部52は、入力を受け付ける。次いで、ステップS84では、データ処理部40は、ステップS80と同様、修正処理が完了したか否かを判断する。ここでの判断が否定された場合には、ステップS82に戻るが、肯定された場合には、ステップS86に移行する。そして、ステップS86に移行すると、前述したように、入力処理部52が修正後のデータをデータ処理部40に送信し、図9のステップS24に移行する。
図9のステップS24に移行すると、データ処理部40は、振込処理を実行する。具体的には、データ処理部40は、修正後のデータを図8の振込DB38に格納するとともに、所定の振込処理(送金処理)を実行する。以上の処理により、図9の全処理が終了する。なお、図9の処理は、サーバ10が稼動している間、繰り返し実行される。
なお、上記説明から分かるように、本実施形態では、一例として、データ処理部40により、帳票の画像データからテキストデータを生成する生成部、テキストデータを複数の文字群に分割する分割部、及び、分割した位置が識別できる状態でテキストデータを表示する表示部としての機能が実現が実現されている。
以上、詳細に説明したように、本実施形態によると、データ処理部40は、入力欄に対して複数の文字が手書きされた振込依頼書(図4)の画像データから、複数の文字に対応するテキストデータを生成し(S12)、テキストデータと、単語辞書DB34に格納されている単語データとに基づいて、テキストデータを複数の文字群(分割部分又は単語)に分割し(S30、S42)、分割した位置を識別できる状態でテキストデータを表示する(S20、図15等参照)。これにより、本実施形態では、オペレータは、誤って認識された、或いは認識不可であった文字を修正する際に、修正する文字が含まれる単語がどのようなものであるかを推測しながら、修正することができる。これにより、オペレータによるテキストデータのチェック・修正作業の簡素化を図ることができる。
また、本実施形態では、データ処理部40は、単語辞書DB34に格納されている単語データと一致しない文字群(単語)の先頭位置、及び認識できなかった文字(リジェクト文字)を含む文字群(単語)の先頭位置にテキストデータ修正用のカーソルを表示するよう、表示処理部50に対して指示を出す。これにより、オペレータは、修正すべき文字を含んだ単語の先頭位置にカーソルを自ら合わせる必要がなくなる。したがって、オペレータによるテキストデータのチェック・修正作業を行いやすくすることができる。なお、オペレータはキーボード操作に長けており、単語単位でテキストデータを修正した方が入力しやすい場合が多いため、本実施形態では、単語の先頭位置にカーソルを表示するようにしている。
また、本実施形態では、データ処理部40は、単語辞書DB34の単語データと一致しない文字群(単語)、認識できなかった文字(リジェクト文字)を含む文字群(単語)、単語辞書DB34に格納されている単語データと一致するが、正読率が所定値(80%)より低い文字を含む文字群(単語)をその他の文字群とは異なる態様(異なる強調色)で表示するよう、表示処理部50に対して指示を出す。これにより、オペレータは、各単語の認識結果(修正すべきか否か)を一目で確認することができるようになるため、どの単語を重点的にチェックすればよいかが明確となり、テキストデータのチェック・修正作業を簡易に行うことができる。
なお、上記実施形態では、上述した特定の文字群(単語)を、その他の文字群とは異なる強調色で表示する場合について説明したが、これに限られるものではない。例えば、上記特定の文字群の少なくとも1つを非表示とすることとしてもよい(図18参照)。このようにしても、どの単語を重点的にチェックすればよいかが明確となるので、キーボード操作に長けているオペレータにとって、修正作業がしやすくなる。また、上記実施形態では、上記特定の文字群をその他の文字群とは異なる強調色で表示する場合について説明したが、これに限られるものではない。例えば、上記特定の文字群をその他の文字群とは異なる大きさで表示することとしてもよいし、異なるフォントで表示することとしてもよい。また、上記実施形態では、上記特定の文字群それぞれをその他の文字群とは異なる態様で表示する場合について説明したが、これに限らず、上記文字群の少なくとも1つをその他の文字群とは異なる態様で表示するようにしてもよい。
なお、上記実施形態では、オペレータが「次へ」操作を行うごとに、カーソルを強調表示(赤色または黄色)されている単語の先頭に移動させる場合について説明したが、これに限られるものではない。すなわち、上記実施形態では、上述したカーソルを移動させる処理を行わないこととしてもよい。また、強調表示(赤色または黄色)されている単語の先頭のほかに、強調表示(水色)されている単語の先頭にもカーソルを移動させるようにしてもよい。
なお、上記実施形態では、リジェクト文字「?」を含む単語は、一律、強調表示(赤色)する場合について説明したが、これに限られるものではない。例えば、リジェクト文字を含む個数に応じて表示態様を変更することとしてもよい。
なお、上記実施形態において説明したサーバ10の機能を各オペレータ端末20が有していてもよい。このようにしても、上記実施形態と同様の処理を実現することが可能である。
なお、上記実施形態では、帳票処理システム100を、金融機関で利用する場合について説明したが、これに限られるものではない。すなわち、帳票処理システム100は、手書き文字が記載された帳票をテキストデータに変換して処理する様々な場面において適用することができる。
なお、上記の処理機能は、コンピュータによって実現することができる。その場合、処理装置が有すべき機能の処理内容を記述したプログラムが提供される。そのプログラムをコンピュータで実行することにより、上記処理機能がコンピュータ上で実現される。処理内容を記述したプログラムは、コンピュータで読み取り可能な記録媒体(ただし、搬送波は除く)に記録しておくことができる。
プログラムを流通させる場合には、例えば、そのプログラムが記録されたDVD(Digital Versatile Disc)、CD−ROM(Compact Disc Read Only Memory)などの可搬型記録媒体の形態で販売される。また、プログラムをサーバコンピュータの記憶装置に格納しておき、ネットワークを介して、サーバコンピュータから他のコンピュータにそのプログラムを転送することもできる。
プログラムを実行するコンピュータは、例えば、可搬型記録媒体に記録されたプログラムもしくはサーバコンピュータから転送されたプログラムを、自己の記憶装置に格納する。そして、コンピュータは、自己の記憶装置からプログラムを読み取り、プログラムに従った処理を実行する。なお、コンピュータは、可搬型記録媒体から直接プログラムを読み取り、そのプログラムに従った処理を実行することもできる。また、コンピュータは、サーバコンピュータからプログラムが転送されるごとに、逐次、受け取ったプログラムに従った処理を実行することもできる。
上述した実施形態は本発明の好適な実施の例である。但し、これに限定されるものではなく、本発明の要旨を逸脱しない範囲内において種々変形実施可能である。
なお、以上の実施形態の説明に関して、更に以下の付記を開示する。
(付記1) 入力欄に対して複数の文字が手書きされた書類の画像データから、前記複数の文字に対応するテキストデータを生成し、
前記テキストデータと、格納部に格納されている複数の単語データとに基づいて、前記テキストデータを複数の文字群に分割し、
前記テキストデータにおける分割位置を識別可能な状態で、前記テキストデータを表示する、処理をコンピュータに実行させることを特徴とする表示プログラム。
(付記2) 前記表示する処理では、前記格納部に格納されている単語データとは異なる文字群の先頭位置に、テキストデータ修正用のカーソルを表示することを特徴とする付記1に記載の表示プログラム。
(付記3) 前記表示する処理では、前記格納部に格納されている単語データとは異なる文字群と、前記格納部に格納されている単語データと同一の文字群のうち読み取りの確からしさを表す度合が所定の値以下である文字を含む文字群と、の少なくとも一方をその他の文字群とは異なる態様で表示することを特徴とする付記1又は2に記載の表示プログラム。
(付記4) 前記表示する処理では、前記格納部に格納されている単語データとは異なる文字群と、前記格納部に格納されている単語データと同一の文字群のうち読み取りの確からしさを表す度合が所定の値以下である文字を含む文字群と、の少なくとも一方を非表示とすることを特徴とする付記1又は2に記載の表示プログラム。
(付記5) 入力欄に対して複数の文字が手書きされた書類の画像データから、前記複数の文字に対応するテキストデータを生成する生成部と、
複数の単語データを格納する格納部と、
前記テキストデータと、前記格納部に格納されている複数の単語データとに基づいて、前記テキストデータを複数の文字群に分割する分割部と、
前記テキストデータにおける分割位置を識別可能な状態で、前記テキストデータを表示する表示部と、を備える表示装置。
(付記6) 前記表示部は、前記格納部に格納されている単語データとは異なる文字群の先頭位置に、テキストデータ修正用のカーソルを表示することを特徴とする付記5に記載の表示装置。
(付記7) 前記表示部は、前記格納部に格納されている単語データとは異なる文字群と、前記格納部に格納されている単語データと同一の文字群のうち読み取りの確からしさを表す度合が所定の値以下である文字を含む文字群と、の少なくとも一方をその他の文字群とは異なる態様で表示することを特徴とする付記5又は6に記載の表示装置。
(付記8) 前記表示部は、前記格納部に格納されている単語データとは異なる文字群と、前記格納部に格納されている単語データと同一の文字群のうち読み取りの確からしさを表す度合が所定の値以下である文字を含む文字群と、の少なくとも一方を非表示とすることを特徴とする付記5又は6に記載の表示装置。
(付記9) 入力欄に対して複数の文字が手書きされた書類の画像データから、前記複数の文字に対応するテキストデータを生成する工程と、
前記テキストデータと、格納部に格納されている複数の単語データとに基づいて、前記テキストデータを複数の文字群に分割する工程と、
前記テキストデータにおける分割位置を識別可能な状態で、前記テキストデータを表示する工程と、をコンピュータが実行することを特徴とする表示方法。
(付記10) 前記表示する工程では、前記格納部に格納されている単語データとは異なる文字群の先頭位置に、テキストデータ修正用のカーソルを表示することを特徴とする付記9に記載の表示方法。
(付記11) 前記表示する工程では、前記格納部に格納されている単語データとは異なる文字群と、前記格納部に格納されている単語データと同一の文字群のうち読み取りの確からしさを表す度合が所定の値以下である文字を含む文字群と、の少なくとも一方をその他の文字群とは異なる態様で表示することを特徴とする付記9又は10に記載の表示方法。
(付記12) 前記表示する工程では、前記格納部に格納されている単語データとは異なる文字群と、前記格納部に格納されている単語データと同一の文字群のうち読み取りの確からしさを表す度合が所定の値以下である文字を含む文字群と、の少なくとも一方を非表示とすることを特徴とする付記9又は10に記載の表示方法。
10 サーバ(表示装置)
34 単語辞書DB(格納部)
40 データ処理部(生成部、分割部、表示部)

Claims (6)

  1. 入力欄に対して複数の文字が手書きされた書類の画像データから、前記複数の文字に対応するテキストデータを生成し、
    前記テキストデータと、格納部に格納されている複数の単語データとに基づいて、前記テキストデータを複数の文字群に分割し、
    前記テキストデータにおける分割位置を識別可能な状態で、前記テキストデータを表示する、
    処理をコンピュータに実行させることを特徴とする表示プログラム。
  2. 前記表示する処理では、前記格納部に格納されている単語データとは異なる文字群の先頭位置に、テキストデータ修正用のカーソルを表示することを特徴とする請求項1に記載の表示プログラム。
  3. 前記表示する処理では、前記格納部に格納されている単語データとは異なる文字群と、前記格納部に格納されている単語データと同一の文字群のうち読み取りの確からしさを表す度合が所定の値以下である文字を含む文字群と、の少なくとも一方をその他の文字群とは異なる態様で表示することを特徴とする請求項1又は2に記載の表示プログラム。
  4. 前記表示する処理では、前記格納部に格納されている単語データとは異なる文字群と、前記格納部に格納されている単語データと同一の文字群のうち読み取りの確からしさを表す度合が所定の値以下である文字を含む文字群と、の少なくとも一方を非表示とすることを特徴とする請求項1又は2に記載の表示プログラム。
  5. 入力欄に対して複数の文字が手書きされた書類の画像データから、前記複数の文字に対応するテキストデータを生成する生成部と、
    複数の単語データを格納する格納部と、
    前記テキストデータと、前記格納部に格納されている複数の単語データとに基づいて、前記テキストデータを複数の文字群に分割する分割部と、
    前記テキストデータにおける分割位置を識別可能な状態で、前記テキストデータを表示する表示部と、を備える表示装置。
  6. 入力欄に対して複数の文字が手書きされた書類の画像データから、前記複数の文字に対応するテキストデータを生成する工程と、
    前記テキストデータと、格納部に格納されている複数の単語データとに基づいて、前記テキストデータを複数の文字群に分割する工程と、
    前記テキストデータにおける分割位置を識別可能な状態で、前記テキストデータを表示する工程と、をコンピュータが実行することを特徴とする表示方法。
JP2013007489A 2013-01-18 2013-01-18 表示プログラム、表示装置及び表示方法 Pending JP2014137791A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2013007489A JP2014137791A (ja) 2013-01-18 2013-01-18 表示プログラム、表示装置及び表示方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2013007489A JP2014137791A (ja) 2013-01-18 2013-01-18 表示プログラム、表示装置及び表示方法

Publications (1)

Publication Number Publication Date
JP2014137791A true JP2014137791A (ja) 2014-07-28

Family

ID=51415234

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013007489A Pending JP2014137791A (ja) 2013-01-18 2013-01-18 表示プログラム、表示装置及び表示方法

Country Status (1)

Country Link
JP (1) JP2014137791A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017156922A (ja) * 2016-03-01 2017-09-07 株式会社ビーアイ 書類の認識制御システム
JP2020095374A (ja) * 2018-12-11 2020-06-18 沖電気工業株式会社 文字認識システム、文字認識装置、プログラム及び文字認識方法
JP6870159B1 (ja) * 2020-11-04 2021-05-12 ファーストアカウンティング株式会社 データ処理装置、データ処理方法及びプログラム
CN114885202A (zh) * 2019-08-28 2022-08-09 腾讯数码(天津)有限公司 字符串显示处理方法、装置、终端及存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02126384A (ja) * 1988-11-07 1990-05-15 Hitachi Ltd 文字認識システムのパターン認識方法
JPH07254052A (ja) * 1994-03-16 1995-10-03 Toshiba Corp 文字認識装置
JPH11316802A (ja) * 1998-04-30 1999-11-16 Canon Inc 単語認識装置及びその住所地名登録方法並びに記録媒体
JP2010170461A (ja) * 2009-01-26 2010-08-05 Fujitsu Ltd 清書支援プログラム及び清書支援方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02126384A (ja) * 1988-11-07 1990-05-15 Hitachi Ltd 文字認識システムのパターン認識方法
JPH07254052A (ja) * 1994-03-16 1995-10-03 Toshiba Corp 文字認識装置
JPH11316802A (ja) * 1998-04-30 1999-11-16 Canon Inc 単語認識装置及びその住所地名登録方法並びに記録媒体
JP2010170461A (ja) * 2009-01-26 2010-08-05 Fujitsu Ltd 清書支援プログラム及び清書支援方法

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017156922A (ja) * 2016-03-01 2017-09-07 株式会社ビーアイ 書類の認識制御システム
JP2020095374A (ja) * 2018-12-11 2020-06-18 沖電気工業株式会社 文字認識システム、文字認識装置、プログラム及び文字認識方法
CN114885202A (zh) * 2019-08-28 2022-08-09 腾讯数码(天津)有限公司 字符串显示处理方法、装置、终端及存储介质
JP6870159B1 (ja) * 2020-11-04 2021-05-12 ファーストアカウンティング株式会社 データ処理装置、データ処理方法及びプログラム
WO2022097189A1 (ja) * 2020-11-04 2022-05-12 ファーストアカウンティング株式会社 データ処理装置、データ処理方法及びプログラム

Similar Documents

Publication Publication Date Title
US10176370B2 (en) Field verification of documents
TWI477985B (zh) 用於在網頁上顯示文件的字型處理
RU2634194C1 (ru) Верификация результатов оптического распознавания символов
US10963717B1 (en) Auto-correction of pattern defined strings
WO2015012812A1 (en) Information extraction and annotation systems and methods for documents
US20230401879A1 (en) Computing system for extraction of textual elements from a document
JP2020035019A (ja) 情報処理装置、情報処理方法及びプログラム
US20220335073A1 (en) Fuzzy searching using word shapes for big data applications
JP2014137791A (ja) 表示プログラム、表示装置及び表示方法
EP4141818A1 (en) Document digitization, transformation and validation
JP2019082814A (ja) 紙帳票データ化システム、ocrエンジン学習用画像生成装置および画像分析装置
RU2673016C1 (ru) Способы и системы оптического распознавания символов серии изображений
US12014561B2 (en) Image reading systems, methods and storage medium for performing geometric extraction
US20150370760A1 (en) Methods, systems, and media for presenting a document on a screen
US9229911B1 (en) Detecting continuation of flow of a page
JP4208566B2 (ja) 文書画像検索装置及びその方法、文書画像検索システム、プログラム
JP2019057115A (ja) 帳票情報認識装置および帳票情報認識方法
JP6325218B2 (ja) 文字認識結果検証装置及び文字読取システム
JP2019074807A (ja) 情報処理装置及びプログラム
JP2010237909A (ja) 知識補正プログラム、知識補正装置および知識補正方法
JP5752073B2 (ja) データ修正装置
JP2020166658A (ja) 情報処理装置、情報処理方法及びプログラム
KR20150085282A (ko) 전자 문서의 첨삭을 위한 단말의 동작 방법
JP2020071668A (ja) 要約生成方法及び要約生成プログラム
US20240184985A1 (en) Information representation structure analysis device, and information representation structure analysis method

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20150903

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20160622

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20160628

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160826

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20161018