JP6325218B2 - 文字認識結果検証装置及び文字読取システム - Google Patents

文字認識結果検証装置及び文字読取システム Download PDF

Info

Publication number
JP6325218B2
JP6325218B2 JP2013186997A JP2013186997A JP6325218B2 JP 6325218 B2 JP6325218 B2 JP 6325218B2 JP 2013186997 A JP2013186997 A JP 2013186997A JP 2013186997 A JP2013186997 A JP 2013186997A JP 6325218 B2 JP6325218 B2 JP 6325218B2
Authority
JP
Japan
Prior art keywords
character
image
recognition result
unit
correction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2013186997A
Other languages
English (en)
Other versions
JP2015055891A (ja
Inventor
典子 堀部
典子 堀部
和章 横田
和章 横田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Toshiba Digital Solutions Corp
Original Assignee
Toshiba Corp
Toshiba Digital Solutions Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp, Toshiba Digital Solutions Corp filed Critical Toshiba Corp
Priority to JP2013186997A priority Critical patent/JP6325218B2/ja
Publication of JP2015055891A publication Critical patent/JP2015055891A/ja
Application granted granted Critical
Publication of JP6325218B2 publication Critical patent/JP6325218B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Character Discrimination (AREA)
  • Character Input (AREA)

Description

本発明の実施形態は、文字認識結果検証装置及び文字読取システムに関する。
文書などから読み取ったイメージの文字認識結果を検証する技術が知られている。例えば、第1の技術は、図23に示すように、同一の文字認識結果が得られた文字認識元の一文字のイメージを、コンピュータの一画面上に並べて表示させるものである。この技術は、誤読されていない例えば「あ」という文字のイメージが多数並んだ一画面の中に、例えば誤読された少数の「ま」や「め」という文字のイメージが、際立って表示されることになるため、文字認識の誤読を比較的容易に見付けることが可能となる。
また、例えば、第2の技術は、図24に示すように、文書などの文字認識結果をテキスト形式で表示させて検証する技術である。
特開平3−25691号公報 特開2006−178543号公報 特開平6−231298号公報 特開平6−36066号公報
しかしながら、第1の技術は、「日」と「曰」など、字形の類似した誤読文字がある場合、結果的に一文字ずつ凝視して誤読を検証する必要があり、検証作業の効率の低下が懸念される。この他、「0(ゼロ)」と「O(オー)」や、「あ」と「ぁ」や、「―(ハイフン)」と「ー(長音)」などの誤読が生じている場合も同様である。一方、第2の技術は、文字認識結果の全文を凝視して誤読を見付ける必要があり、同様に検証作業の効率面で課題を抱えている。
そこで、本発明が解決しようとする課題は、文字認識の誤読を効率的に見付けることができる文字認識結果検証装置及び文字読取システムを提供することである。
実施の形態の文字認識結果検証装置は、文字抽出部、文字列生成部、文字コード指定部、表示制御部及びソート部を備えている。文字抽出部は、文字認識の対象となった文書のイメージ中から、一文字毎のイメージを第1文字イメージとして抽出する。文字列生成部は、前記抽出された第1文字イメージと、前記第1文字イメージの前及び/又は後に位置する文字のイメージである第2文字イメージと、を含む複数の文字列のイメージを生成する。文字コード指定部は、文字コードを指定する。表示制御部は、前記生成された複数の文字列のイメージのうちで、前記指定された文字コードと前記第1文字イメージの文字認識結果とが一致する文字列のイメージを一覧表示させる。ソート部は、前記第1文字イメージ及び前記第2文字イメージの文字認識結果と前記指定された文字コードとに基づいて、前記表示制御部が一覧表示させるべき文字列のイメージをソートする。さらに、ソート部は、前記第1文字イメージの前に位置する第2文字イメージの文字認識結果である文字コードの順に、前記一覧表示させるべき文字列のイメージをソートする。
第1の実施の形態に係る文字読取システムを示す構成図。 図1の文字読取システムが備えた文字認識端末の構成を示すブロック図。 図1の文字読取システムが備えた抽出端末の構成を示すブロック図。 図3の抽出端末が表示する抽出画面の一例を示す図。 図1の文字読取システムが備えた訂正端末の構成を示すブロック図。 図5の訂正端末が表示する初期の訂正画面の一例を示す図。 図5の訂正端末が表示する、文字列のイメージ選択後の訂正画面の一例を示す図。 図3の抽出端末による処理を示すフローチャート。 図5の訂正端末による処理を示すフローチャート。 第2の実施の形態に係る文字読取システムが備えた訂正端末の構成を示すブロック図。 図10の訂正端末が表示する訂正画面について説明するための図。 第3の実施の形態に係る文字読取システムが備えた訂正端末の構成を示すブロック図。 図12の訂正端末が表示する訂正画面の一例を示す図。 第4の実施の形態に係る文字読取システムが備えた抽出端末の構成を示すブロック図。 図14の抽出端末が表示する文字抽出数設定画面を示す図。 第5の実施の形態に係る文字読取システムが備えた抽出端末の構成を示すブロック図。 図16の抽出端末が表示する抽出画面の一例を示す図。 図16の抽出端末が表示する抽出画面の他の例を示す図。 第6の実施の形態に係る文字読取システムが備えた抽出端末の構成を示すブロック図。 図19の抽出端末が表示する抽出画面について説明するための図。 第7の実施の形態に係る文字読取システムが備えた抽出端末の構成を示すブロック図。 図21の抽出端末が表示する抽出画面の一例を示す図。 文字認識結果を検証する従来の第1の技術を説明するための図。 文字認識結果を検証する従来の第2の技術を説明するための図。
以下、実施の形態を図面に基づき説明する。
<第1の実施の形態>
図1に示すように、第1の実施の形態に係る文字読取システム10は、管理サーバ3と、スキャナ5と、文字認識端末15と、抽出端末20と、訂正端末30と、を主に備えている。上述した管理サーバ3を含む各端末は、例えばコンピュータによってそれぞれ実現されている。また、各端末やスキャナ5は、例えばLAN(Local Area Network)などのネットワーク7を介して互いに接続されている。管理サーバ3は、LAN7上のスキャナ5や各端末の動作を統括的に制御する。
スキャナ5は、例えば200頁綴りの文書のイメージを読み取る。図2に示すように、文字認識端末15は、レイアウト解析部16、文字認識部17、文字認識結果出力部18を備えている。レイアウト解析部16は、スキャナ5によって読み取られた文書のイメージを、文字部分の領域と例えば絵柄部分の領域などとに区分するレイアウト解析を行う。
文字認識部17は、文字の特徴量(特徴ベクトルなど)と文字コード(テキストデータ)とを互いに対応付けて記憶した文字認識用のデータベース(音声認識辞書)を参照しつつ、レイアウト解析された文書のイメージを文字認識する。文字認識結果出力部18は、文字認識部17による文字認識結果である文書のイメージに対応した文字コード(テキストデータ)をネットワーク7上に出力する。
文字認識結果検証装置としての抽出端末20は、図3に示すように、文字抽出部21、文字列生成部22、文字コード指定部23、ソート部24、イメージ記憶部25、イメージ選択部27及び表示制御部26を備えている。文字抽出部21は、文字認識の対象となった文書のイメージ中から、一文字毎のイメージを第1文字イメージとして抽出する。例えば、文書中に、「この日本には…」という文がある場合、文字抽出部21は、「こ」、「の」、「日」、「本」、「に」、「は」にそれぞれ対応したイメージを第1文字イメージとして抽出する。
イメージ記憶部25は、抽出された個々の第1文字イメージと、文書の頁番号及びその頁番号における頁中のイメージの座標情報と、を紐付け(対応付け)して記憶する。なお、イメージ記憶部25は、図3に示すように、抽出端末20本体に搭載されていてもよいし、抽出端末20に外部接続される記憶装置などに設けられていてもよい。
文字列生成部22は、抽出された第1文字イメージと、前記文書中において第1文字イメージの前及び/又は後に位置する文字のイメージである第2文字イメージと、を含む複数の文字列のイメージを生成する。本実施形態の文字列生成部22は、一文字の第1文字イメージと、第1文字イメージの前及び後にそれぞれ位置する二つの第2文字イメージと、を含む例えば三文字の文字列のイメージを複数生成する。
例えば、「この日本には…」という前述した文の例示を適用すると、文字列生成部22は、「この日」、「の日本」、「日本に」、「本には」にそれぞれ対応したイメージを文字列のイメージとして生成する。つまり、「の日本」が文字列のイメージである場合、「日」は、第1文字イメージであり、「の」は、第1文字イメージの前に位置する第2文字イメージであり、「本」は、第1文字イメージの後に位置する第2文字イメージである。イメージ記憶部25は、生成された個々の文字列のイメージ(中央の一つの第1文字イメージ及び前後二つの第2文字イメージ)と、文書の頁番号及びその頁番号における頁中のイメージの座標情報と、を紐付け(対応付け)して記憶する。
文字コード指定部23は、図4に示すように、例えばマウスやキーボードなどの入力デバイスによる抽出画面28内のユーザインタフェース(タブ)28aへの入力操作を受け付けることなどによって、文字コードを指定する。ユーザインタフェース28aは、複数の文字コードにそれぞれ対応させた入力ボタンである。
表示制御部26は、文字列生成部22によって生成された複数の文字列のイメージのうちで、文字コード指定部23によって指定された文字コードと、第1文字イメージ(三文字の文字列のイメージの中央の第1文字イメージ)の文字認識結果と、が一致する文字列のイメージを、図4に示すように、抽出端末20の表示モニタなどに映し出される抽出画面28に、一覧表示させる。図4は、「日」に対応する文字コードが指定された場合の一覧表示の例を示している。
ソート部24は、第1文字イメージ及び第2文字イメージの文字認識結果と、文字コード指定部23によって指定された文字コードと、に基づいて、表示制御部26が一覧表示させるべき文字列のイメージをソートする(並べ替える)。ソート部24は、文字列のイメージの例えば、前側の第2文字イメージの文字認識結果である文字コード順に、当該一覧表示させるべき文字列のイメージをソートする。
イメージ選択部27は、図4に示すように、マウスなどの入力デバイスによる抽出画面28内のユーザインタフェースへの入力操作を受け付けることなどによって、抽出画面28に一覧表示させた文字列のイメージのうちから、特定の文字列のイメージを選択する。この場合、表示制御部26は、選択された特定の文字列のイメージを差別化する情報として、図4に示すように、チェックマーク28bを抽出画面28内に表示させる。図4は、「曰(いわ・く)」として文字認識されるべきものが、「日(にち)」として誤読された第1文字イメージを、中央に含む文字列のイメージに、チェックマーク28bが付与された例を示している。
一方、文字認識結果訂正装置としての訂正端末30は、図5に示すように、入力操作受付部31、訂正部32及び表示制御部(第2の表示制御部)33を備えている。表示制御部33は、図6、図7に示すように、ユーザインタフェース(タブ)38a、文書のイメージ38b、及び、テキスト形式で表示させた文書のイメージの文字認識結果38cを含む訂正画面38を、訂正端末30の表示モニタなどに表示させる。
図7は、「曰(いわ・く)」として文字認識されるべきものが、「日(にち)」として誤読された文字のイメージ(第1文字イメージ)と、「本(ほん)」として文字認識されるべきものが、「木(き)」として誤読された文字のイメージ(第1文字イメージ)と、が例示されている。
入力操作受付部31は、図6、図7に示すように、入力デバイスによる訂正画面38内のユーザインタフェースなどへの入力操作に対応する指示内容を受け付ける。訂正部32は、抽出端末20のイメージ選択部27により選択された文字列のイメージに含まれる第1文字イメージの文字認識結果(図7中の「日」や「木」)を、入力操作に対応する指示内容に基づいて訂正する。
ここで、表示制御部33は、図7に示すように、当該選択された文字列のイメージに含まれる第1文字イメージの文字認識結果を、他の文字認識結果と差別化して表示する。差別化する表示方法は、文字色の変更、文字への下線や網掛けの付与、さらには、図7に示すように、文字を線で囲うこと、などが例示される。
また、上述した訂正部32は、当該第1文字イメージの文字認識結果(図7中の「日」や「木」)を訂正画面38内で例えばアクティブにした状態で、ユーザインタフェース38a中の訂正内容に対応した入力ボタンを押下することなどによって、文字認識結果を訂正する。さらに、表示制御部33は、この場合の訂正結果をテキスト形式で訂正画面38内に表示させる。
次に、抽出端末20による処理及び訂正端末30による処理を、それぞれ図8及び図9に示すフローチャートに基づき説明する。図8に示すように、まず、抽出端末20の文字抽出部21は、文字認識の対象となった文書のイメージ中から、一文字毎のイメージを第1文字イメージとして抽出する(S[ステップ]1)。次に、文字列生成部22は、抽出された第1文字イメージと、第1文字イメージの前後に位置する第2文字イメージと、を含む複数の文字列のイメージを生成する(S2)。
続いて、文字コード指定部23は、図4に示すように抽出画面28内のユーザインタフェース28aへの入力操作を受け付けることなどによって、文字コードを指定する(S3)。次いで、ソート部24は、第1文字イメージ及び第2文字イメージの文字認識結果と指定された文字コードとに基づいて、表示制御部26が一覧表示させるべき文字列のイメージをソートする(S4)。
次に、表示制御部26は、ソートされた文字列のイメージを一覧表示させる(S5)。すなわち、表示制御部26は、文字列生成部22によって生成された複数の文字列のイメージのうちで、文字コード指定部23によって指定された文字コードと、第1文字イメージの文字認識結果と、が一致する文字列のイメージを、図4に示すように、抽出画面28に一覧表示させる。
さらに、図4に示すように、抽出画面28に一覧表示させた文字列のイメージのうちから、特定の文字列のイメージが、イメージ選択部27によって選択された場合(S6のYES)、表示制御部26は、選択された特定の文字列のイメージを差別化する情報として、図4に示すように、チェックマーク28bを抽出画面28内に表示させる(S7)。
一方、図9に示すように、抽出端末20のイメージ選択部27によって文字列のイメージが選択された場合(S11のYES)、訂正端末30の表示制御部(第2の表示制御部)33は、選択された文字列のイメージに対応する文字認識結果を含むテキスト表示を訂正画面38に出力する(S12)。次に、訂正部32は、イメージ選択部27により選択された文字列のイメージに含まれる第1文字イメージの文字認識結果を、入力操作に対応する指示内容に基づいて訂正する(S13)。さらに、表示制御部33は、この場合の訂正結果をテキスト形式で訂正画面38内に表示させる(S14)。
既述した抽出端末20では、「日(ひ)」に対応する文字コードの指定を例示した場合において、図4に示すように、「今日は」のイメージが表示された最初の行が誤読していないことを把握できれば、「今日は」のイメージが連続して表示されたその下の5行についても誤読していないことを直感的に把握することができる。したがって、抽出端末20では、文字認識の誤読箇所を効率的に見付けることができる。
また、抽出端末20では、実質的な誤読検証の対象となる第1文字イメージの前後の第2文字イメージも併せて表示することにより、文字の前後関係から誤読文字を判別しやすくなる。さらに、抽出端末20では、一部の文字列を抽出して誤読か否かを判別できるので、文書全体の文字認識結果を一度に検証するよりも、効率的に誤読の検証を行うことができる。また、字形の類似する「あ」と「ぁ」や、「―(長音)」と「−(ハイフン)」など、一文字では判別し難い文字でも、前後の文字のイメージを併せて参照することにより、文脈などを想定することも可能となり、これにより、文字認識結果の検証の効率化を図ることができる。
さらに、抽出端末20では、図4に示すように、同一の文字列のイメージが連続するように一覧表示されるので、例えば誤読している箇所も連続して表示されることになる。このため、文字認識結果が誤読か否かをまとめて確認することが可能となる。また、図4に示すように、1種類しかない文字列のイメージを抽出画面28の例えば最上段の行に表示させるようにすることで、連続する同一の文字列のイメージを中段側にまとめて表示させることが可能となり、誤読の検証を効率良く行える。
さらに、抽出端末20では、文字列のイメージが数文字程度しか表示されないため、文字認識の対象となった文書の内容を類推することが困難となる。これにより、文字認識の対象となった文書が、例えば企業の機密情報や個人情報などを記載した文書であっても、抽出端末20を操作する作業者から機密情報などが漏洩するおそれを低減できる。また、訂正端末30では、図7に示すように、誤読文字を差別化して表示するので、誤読文字の見逃しなどが低減され、効率的に誤読文字を訂正できる。
既述したように、本実施形態に係る抽出端末20と訂正端末30とを含む文字読取システム10によれば、文字認識の誤読を効率的に見付けることができ、文字認識結果を訂正する作業の作業効率を高めることができる。
<第2の実施形態>
次に、第2の実施形態を図10及び図11に基づき説明する。なお、図10及び図11において、第1の実施形態で説明した図4〜図7中の構成要素と同一の構成要素については、同一の符号を付与し重複する説明を省略する。図10に示すように、本実施形態に係る文字読取システムが備えている訂正端末40は、第1の実施形態の訂正端末30が備えていた表示制御部33に代えて、表示制御部43を備えている。表示制御部43は、図11に示すように、訂正画面48を表示させる。
具体的には、図11に示すように、抽出端末20のイメージ選択部27によって抽出画面28内の文字列のイメージが選択された場合、表示制御部43は、選択された文字列のイメージに対応する文字認識結果を、テキスト形式の三文字の文字列として、訂正画面48中に表示させる。
ここで、第2の実施形態では、図11に示すように、複数のオペレータに依頼する作業が、抽出端末20の抽出画面28を参照しつつ誤読をチェックする作業と、訂正端末40の抽出画面48を参照しつつ誤読箇所を訂正する作業と、に分けられる。このように作業を分けると、誤読をチェックする作業では、文字の意味がわからなくても、字形の違いから誤読であることがわかるため、誤読のチェックが可能となる。
したがって、誤読をチェックする作業は、人件費の比較的高い日本ではなく、人件費の比較的安い海外で行うことが可能である。一方、誤読箇所を訂正する作業だけは、文字の意味を理解できる日本国内の日本人が行うことで、全体的な費用を抑えることができる。つまり、誤読をチェックする作業は、元の文書の意味を把握することが困難な作業者に担当させることが可能となる。このため、例えば多言語の文書を訂正する場合など、多言語の文書の意味が分かる作業者を少数しか確保できない状況であっても、この少数の作業者を誤読箇所を訂正する作業に割り当て、一方、誤読をチェックする作業を他の作業者に割り当てることで、文字認識結果を効率的に訂正することが可能となる。
また、抽出画面28を参照しつつ誤読をチェックする作業(文字列のイメージを選択する作業)は、ほとんどマウスによる入力操作で実現できる。一方で、訂正画面48を参照しつつ誤読箇所を訂正する作業は、ほとんどキーボードによる入力操作で実現できる。したがって、第2の実施形態では、マウスとキーボードを持ち替えるような煩わしい作業を低減できるため、作業の効率化を図ることが可能となる。また、第2の実施形態では、訂正画面48を介しての誤読の訂正は、図11に示すように、同様の誤読が連続している複数の文字列の行を、範囲指定して一括訂正することなども可能となる。
<第3の実施形態>
次に、第3の実施形態を図12及び図13に基づき説明する。なお、図12及び図13において、第1の実施形態で説明した図4〜図7中の構成要素と同一の構成要素については、同一の符号を付与し重複する説明を省略する。図12に示すように、本実施形態に係る文字読取システムが備えている訂正端末50は、第1の実施形態の訂正端末30が備えていた表示制御部33に代えて、表示制御部53を備えている。また、訂正端末50は、訂正履歴記憶部54をさらに備えている。
すなわち、訂正履歴記憶部54は、訂正部32によって訂正された第1文字イメージの文字認識結果についての訂正履歴を記憶する。なお、訂正履歴記憶部54は、図12に示すように、訂正端末50本体に搭載されていてもよいし、訂正端末50に外部接続される記憶装置などに設けられていてもよい。一方、表示制御部53は、図13に示すように、抽出端末20のイメージ選択部27によって選択された文字列のイメージと訂正履歴記憶部54により記憶された訂正履歴とを、第1文字イメージの訂正前の文字認識結果で互いに対応付けして訂正画面58に一覧表示させる。
具体的には、図13に示すように、訂正履歴は、過去に誤読した文字の訂正内容を示す警告情報である。訂正画面58は、図13に示すように、訂正文字(前記選択された訂正対象の文字列のイメージ)と訂正履歴と置換ボタン58aとを同じ行に並べて表示する。訂正文字に訂正履歴がある場合、訂正文字の表示色などが変更される。
置換ボタン58aが押下された場合、訂正履歴と同じ訂正内容で訂正文字(前記選択された訂正対象の文字列のイメージに含まれる第1文字イメージの文字認識結果)が訂正される。したがって、本実施形態の訂正端末50によれば、過去の修正履歴を活用することで、誤読箇所を容易に訂正できる。
<第4の実施形態>
次に、第4の実施形態を図14及び図15に基づき説明する。なお、図14において、第1の実施形態で説明した図3中の構成要素と同一の構成要素については、同一の符号を付与し重複する説明を省略する。図14に示すように、本実施形態に係る文字読取システムが備えている抽出端末60は、第1の実施形態の抽出端末20が備えていた表示制御部26に代えて、表示制御部66を備えている。また、抽出端末60は、文字数設定部67をさらに備えている。
文字数設定部67は、第2文字イメージの文字数を設定する。表示制御部66は、図15に示すように、第2文字イメージの文字数を設定するための文字抽出数設定画面68を表示させる。文字抽出数設定画面68は、第1文字イメージの前に位置する第2文字イメージの文字数と、第1文字イメージの後に位置する第2文字イメージの文字数と、を個別に設定することが可能となる。
したがって、本実施形態の抽出端末60では、第2文字イメージの文字数を設定することにより、文字列のイメージ全体の文字数を変更できるので、訂正作業の効率化や、文字認識元の文書の機密性に配慮を加えることができる。例えば個人情報などを含む文書の機密性に配慮を加える場合、第1文字イメージの前に位置する第2文字イメージの文字数を一文字に設定し、第1文字イメージの後に位置する第2文字イメージの文字数を0文字に設定することなどで、高い機密性を得ることができる。
<第5の実施形態>
次に、第5の実施形態を図16〜図18に基づき説明する。なお、図16〜図18において、第1及び第4の実施形態で説明した図3及び図14中の構成要素と同一の構成要素については、同一の符号を付与し重複する説明を省略する。図16に示すように、本実施形態に係る文字読取システムが備えている抽出端末70は、第4の実施形態の抽出端末60が備えていた表示制御部66に代えて、表示制御部76を備えている。また、抽出端末70は、書式判別部79をさらに備えている。
本実施形態の抽出端末70は、図17及び図18に示すように、タッチパネルやスクロール機能を備えたタブレット型の端末である。書式判別部79は、文字認識の対象となった文書が縦書きの書式であるか横書きの書式であるかを判別する。表示制御部76は、書式判別部79による書式の判別結果に基づいて、一覧表示させる文字列のイメージの縦書き表示と横書き表示とを切り替える。具体的には、判別された文書の書式が横書きの書式であった場合、表示制御部76は、図17に示すように、一覧表示させる文字列のイメージを横書き表示に切り替える。この際、縦スクロールやタッチ操作を活用することで効率良く誤読箇所を見付けることができる。また、タブレット型の抽出端末70では、例えば電車などによる移動中であっても、手軽に誤読の検証作業を行える。
一方、判別された文書の書式が縦書きの書式であった場合、図18に示すように、表示制御部76は、一覧表示させる文字列のイメージを縦書き表示に切り替える。この際、横スクロールやタッチ操作を活用することで誤読箇所を効率的に見付けることができる。縦書きの文字列を、縦書き表示にすることで、視認性が高まり、誤読の検証作業を効率良く行うことができる。
<第6の実施形態>
次に、第6の実施形態を図19及び図20に基づき説明する。なお、図19及び図20において、第1及び第4の実施形態で説明した図4及び図14中の構成要素と同一の構成要素については、同一の符号を付与し重複する説明を省略する。図19に示すように、本実施形態に係る文字読取システムが備えている抽出端末80は、第4の実施形態の抽出端末60が備えていた表示制御部66に代えて、表示制御部86を備えている。また、抽出端末80は、使用形態判別部89をさらに備えている。
本実施形態の抽出端末80は、タッチパネルやスクロール機能を備えたタブレット型の端末である。使用形態判別部89は、抽出端末80本体(装置本体)が縦向きで使用されているか横向きで使用されているかを表す使用形態を判別する。表示制御部86は、使用形態判別部89による判別結果に基づいて、一覧表示させる文字列のイメージの縦書き表示と横書き表示とを切り替える。
具体的には、抽出端末80本体が縦向きで使用されていると判別された場合、図20に示すように、文字認識の対象となった文書の書式が縦書きであったとしても、表示制御部86は、一覧表示させる文字列のイメージを横書き表示に切り替える。一方、抽出端末80本体が横向きで使用されていると判別された場合、表示制御部86は、一覧表示させる文字列のイメージを縦書き表示に切り替える。
したがって、本実施形態の抽出端末80によれば、当該抽出端末本体が縦向きで使用されているか横向きで使用されているかに応じて、一覧表示させる文字列のイメージの縦書き表示と横書き表示とを適切に切り替えるので、当該抽出端末本体を使用している現状の向きを変えることなく、文字認識結果を効率的に検証することができる。
<第7の実施形態>
次に、第7の実施形態を図21及び図22に基づき説明する。なお、図21及び図22において、第1及び第4の実施形態で説明した図3及び図14中の構成要素と同一の構成要素については、同一の符号を付与し重複する説明を省略する。図21に示すように、本実施形態に係る文字読取システムが備えている抽出端末90は、第4の実施形態の抽出端末60が備えていた表示制御部66に代えて、表示制御部96を備えている。表示制御部96は、抽出画面98内に一覧表示させる文字列のイメージに含まれる第2文字イメージについては、当該第2文字イメージの文字認識結果に対応させたテキスト形式で表示させる。
つまり、一覧表示させる文字列のイメージは、イメージ表示98aとテキスト表示98bとから構成される。これにより、「曰く」が「日ぐ」のように連続して文字の誤読が生じた場合であっても、これらの誤読を容易に検出することができる。ここで、かな漢字変換機能を用いて、例えば「日」と誤読されたものを「曰」に訂正する場合、「曰く」のように2文字以上を入力することも多い。そこで、「曰く」の誤読である「日ぐ」を一度にまとめて訂正端末により訂正することが可能となる。
また、一般に、複数の作業者で誤読を訂正する場合、誤読している一つの文字を複数の作業者に訂正してもらい、その訂正結果を投票して多数決を取ることで、訂正の精度を高めることができる。このような場合、本実施形態の抽出端末90を利用することで、多数決の投票数を効率的に増加させることができ、訂正の誤りを低減できるメリットがある。
以上、本発明の実施形態を説明したが、この実施形態は、例として提示したものであり、発明の範囲を限定することは意図していない。この新規な実施形態は、その他の様々な形態で実施することが可能であり、発明の要旨を逸脱しない範囲で、種々の省略、置き換え、変更を行うことができる。この実施形態やその変形例は、発明の範囲や要旨に含まれると共に、特許請求の範囲に記載された発明とその均等の範囲に含まれる。
3…管理サーバ、5…スキャナ、10…文字読取システム、15…文字認識端末、17…文字認識部、20,60,70,80,90…抽出端末、21…文字抽出部、22…文字列生成部、23…文字コード指定部、24…ソート部、25…イメージ記憶部、26,66,76,86,96…表示制御部、27…イメージ選択部、28,98…抽出画面、30,40,50…訂正端末、31…入力操作受付部、32…訂正部、33,43,53…表示制御部(第2の表示制御部)、38,48,58…訂正画面、38b…文書のイメージ、38c…文字認識結果、40…訂正端末、48…訂正画面、54…訂正履歴記憶部、58a…置換ボタン、67…文字数設定部、68…文字抽出数設定画面、79…書式判別部、89…使用形態判別部、98a…イメージ表示、98b…テキスト表示。

Claims (8)

  1. 文字認識の対象となった文書のイメージ中から、一文字毎のイメージを第1文字イメージとして抽出する文字抽出部と、
    前記抽出された第1文字イメージと、前記第1文字イメージの前及び/又は後に位置する文字のイメージである第2文字イメージと、を含む複数の文字列のイメージを生成する文字列生成部と、
    文字コードを指定する文字コード指定部と、
    前記生成された複数の文字列のイメージのうちで、前記指定された文字コードと前記第1文字イメージの文字認識結果とが一致する文字列のイメージを一覧表示させる表示制御部と、
    前記第1文字イメージ及び前記第2文字イメージの文字認識結果と前記指定された文字コードとに基づいて、前記表示制御部が一覧表示させるべき文字列のイメージをソートするソート部と、を備え、
    前記ソート部は、前記第1文字イメージの前に位置する第2文字イメージの文字認識結果である文字コードの順に、前記一覧表示させるべき文字列のイメージをソートする、文字認識結果検証装置。
  2. 前記表示制御部は、前記一覧表示させる文字列のイメージに含まれる第2文字イメージについては、当該第2文字イメージの文字認識結果に対応させたテキスト形式で表示させる、
    請求項1記載の文字認識結果検証装置。
  3. 前記一覧表示させた文字列のイメージのうちから、特定の文字列のイメージを選択するイメージ選択部をさらに備え、
    前記表示制御部は、前記選択された特定の文字列のイメージを差別化する情報を表示させる、
    請求項1又は2記載の文字認識結果検証装置。
  4. 前記第2文字イメージの文字数を設定する文字数設定部をさらに備える、
    請求項1ないし3のいずれか1項に記載の文字認識結果検証装置。
  5. 前記文書が縦書きの書式であるか横書きの書式であるかを判別する書式判別部をさらに備え、
    前記表示制御部は、前記書式の判別結果に基づいて、前記一覧表示させる文字列のイメージの縦書き表示と横書き表示とを切り替える、
    請求項1ないし4のいずれか1項に記載の文字認識結果検証装置。
  6. 装置本体が縦向きで使用されているか横向きで使用されているかを判別する使用形態判別部をさらに備え、
    前記表示制御部は、前記使用形態判別部による判別結果に基づいて、前記一覧表示させる文字列のイメージの縦書き表示と横書き表示とを切り替える、
    請求項1ないし4のいずれか1項に記載の文字認識結果検証装置。
  7. 文字認識結果検証装置と文字認識結果訂正装置とを有する文字読取システムであって、
    前記文字認識結果検証装置は、
    文字認識の対象となった文書のイメージ中から、一文字毎のイメージを第1文字イメージとして抽出する文字抽出部と、
    前記抽出された第1文字イメージと、前記第1文字イメージの前及び/又は後に位置する文字のイメージである第2文字イメージと、を含む複数の文字列のイメージを生成する文字列生成部と、
    文字コードを指定する文字コード指定部と、
    前記生成された複数の文字列のイメージのうちで、前記指定された文字コードと前記第1文字イメージの文字認識結果とが一致する文字列のイメージを一覧表示させる表示制御部と、
    前記第1文字イメージ及び前記第2文字イメージの文字認識結果と前記指定された文字コードとに基づいて、前記表示制御部が一覧表示させるべき文字列のイメージをソートするソート部と、
    前記一覧表示させた文字列のイメージのうちから、特定の文字列のイメージを選択するイメージ選択部と、を備え、
    前記ソート部が、前記第1文字イメージの前に位置する第2文字イメージの文字認識結果である文字コードの順に、前記一覧表示させるべき文字列のイメージをソートし、
    前記表示制御部が、前記選択された特定の文字列のイメージを差別化する情報を表示させ、
    前記文字認識結果訂正装置は、
    前記選択された文字列のイメージに含まれる第1文字イメージについての文字認識結果を、入力操作に基づいて訂正する訂正部、
    を備える文字読取システム。
  8. 前記文字認識結果訂正装置は、
    前記訂正された第1文字イメージの文字認識結果についての訂正履歴を記憶する訂正履歴記憶部と、
    前記選択された文字列のイメージと前記記憶された訂正履歴とを前記第1文字イメージの訂正前の文字認識結果で互いに対応付けして一覧表示させる第2の表示制御部と、
    をさらに備える請求項7記載の文字読取システム。
JP2013186997A 2013-09-10 2013-09-10 文字認識結果検証装置及び文字読取システム Expired - Fee Related JP6325218B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2013186997A JP6325218B2 (ja) 2013-09-10 2013-09-10 文字認識結果検証装置及び文字読取システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2013186997A JP6325218B2 (ja) 2013-09-10 2013-09-10 文字認識結果検証装置及び文字読取システム

Publications (2)

Publication Number Publication Date
JP2015055891A JP2015055891A (ja) 2015-03-23
JP6325218B2 true JP6325218B2 (ja) 2018-05-16

Family

ID=52820282

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013186997A Expired - Fee Related JP6325218B2 (ja) 2013-09-10 2013-09-10 文字認識結果検証装置及び文字読取システム

Country Status (1)

Country Link
JP (1) JP6325218B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR3142020A1 (fr) * 2022-11-15 2024-05-17 Inovatic Technologies Procédé d’extraction Semi Automatique de données sensibles dans des documents, soumis à une stricte confidentialité de ces données
TWI860401B (zh) 2020-09-11 2024-11-01 日商日立系統股份有限公司 文字一致性確認系統、文字一致性確認裝置、文字一致性確認方法及儲存介質

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7270457B2 (ja) * 2019-05-17 2023-05-10 株式会社日立システムズ 文字一致性確認システム、文字一致性確認装置、文字一致性確認方法及び文字一致性確認プログラム

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03214281A (ja) * 1990-01-19 1991-09-19 Sony Corp 文字認識装置
JPH0696263A (ja) * 1992-09-09 1994-04-08 Nippon Telegr & Teleph Corp <Ntt> パターン認識装置
JPH06176189A (ja) * 1992-12-10 1994-06-24 Ricoh Co Ltd 文字認識装置の画面表示方法
JPH06325203A (ja) * 1993-05-18 1994-11-25 Hitachi Micom Syst:Kk 文字認識装置ならびにその認識文字表示方法および認識文字校正方法
JP2002314652A (ja) * 2001-04-16 2002-10-25 Kyocera Corp 携帯通信端末
JP4697851B2 (ja) * 2004-12-20 2011-06-08 キヤノンマーケティングジャパン株式会社 画像処理方法、画像処理装置
JP5284342B2 (ja) * 2010-12-22 2013-09-11 株式会社東芝 文字認識システムおよび文字認識プログラム

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI860401B (zh) 2020-09-11 2024-11-01 日商日立系統股份有限公司 文字一致性確認系統、文字一致性確認裝置、文字一致性確認方法及儲存介質
FR3142020A1 (fr) * 2022-11-15 2024-05-17 Inovatic Technologies Procédé d’extraction Semi Automatique de données sensibles dans des documents, soumis à une stricte confidentialité de ces données
WO2024105335A1 (fr) * 2022-11-15 2024-05-23 Inovatic Technologies Procédé d'extraction semi automatique de données sensibles dans des documents, soumis à une stricte confidentialité de ces données

Also Published As

Publication number Publication date
JP2015055891A (ja) 2015-03-23

Similar Documents

Publication Publication Date Title
US11113464B2 (en) Synchronizing data-entry fields with corresponding image regions
RU2634194C1 (ru) Верификация результатов оптического распознавания символов
JP5239506B2 (ja) 学習支援システム、プログラムおよび学習支援方法
JP2007109118A (ja) 入力指示処理装置および入力指示処理プログラム
US10963074B2 (en) Input display device and input display method
JP2014149612A (ja) 音声認識誤り修正装置およびそのプログラム
US10152472B2 (en) Apparatus and method for generating summary data of E-book or E-note
JP2013196479A (ja) 情報処理システム、情報処理プログラム、情報処理方法
RU2665274C2 (ru) Всплывающая панель верификации
US10359864B2 (en) Input display device and input display method
JP6325218B2 (ja) 文字認識結果検証装置及び文字読取システム
CN106708801B (zh) 用于文本的校对方法
JP5229102B2 (ja) 帳票検索装置、帳票検索プログラムおよび帳票検索方法
JP6081606B2 (ja) 電子機器および方法
JP5717831B2 (ja) 電子機器および手書き文書処理方法
JP6655331B2 (ja) 電子機器及び方法
JP2014078168A (ja) 文字認識装置及びプログラム
JP2016162211A (ja) 情報処理装置、制御方法及びプログラム
CN111143541A (zh) 一种基于手写字迹进行深度学习的字体生成系统
JP5284342B2 (ja) 文字認識システムおよび文字認識プログラム
JP5439721B2 (ja) 学習支援システム、プログラムおよび学習支援方法
JP2687902B2 (ja) 文書画像認識装置
JP2002133367A (ja) 文字認識装置
JP2020047097A (ja) 情報処理装置及びプログラム
WO2019049187A1 (ja) プログラム、情報処理装置、及び情報処理方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20160826

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20170725

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20170801

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20171002

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20171025

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20180313

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20180412

R150 Certificate of patent or registration of utility model

Ref document number: 6325218

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees