JP2005050094A - 光学的文字読取装置 - Google Patents

光学的文字読取装置 Download PDF

Info

Publication number
JP2005050094A
JP2005050094A JP2003280902A JP2003280902A JP2005050094A JP 2005050094 A JP2005050094 A JP 2005050094A JP 2003280902 A JP2003280902 A JP 2003280902A JP 2003280902 A JP2003280902 A JP 2003280902A JP 2005050094 A JP2005050094 A JP 2005050094A
Authority
JP
Japan
Prior art keywords
xml document
document
screen
form image
tagged
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2003280902A
Other languages
English (en)
Inventor
Hisashi Arai
寿 新井
Kazuaki Yokota
和章 横田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2003280902A priority Critical patent/JP2005050094A/ja
Publication of JP2005050094A publication Critical patent/JP2005050094A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Character Input (AREA)
  • Character Discrimination (AREA)

Abstract

【課題】出力対象となるタグ付文書の帳票上に於ける修正確認位置を容易にかつ迅速に認識できる光学的文字読取装置を提供することを課題とする。
【解決手段】処理制御部12は、XML文書ファイル記憶部23に記憶されたXML文書ファイルから、XML文書エディタ画面102上のカーソル105で指定された文字列を対象に所定行のXML文書を取得し、そのXML文書に従うXML文書エディタ画面102をXML文書確認修正処理画面101の右片半部に表示する。さらに中間XML文書ファイル記憶部22に記憶された中間XML文書ファイルから、上記指定文字列の行を含んだ上記XML文書エディタ画面102の表示行に対応する各行の座標値を取得し、その取得した座標をもとに、帳票イメージファイル記憶部21から上記各座標の帳票イメージを切り出して、その帳票イメージに従う確認部分イメージ表示画面103をXML文書確認修正処理画面101の左片半部に表示する。
【選択図】 図1

Description

本発明は、スキャナから読み込んだ帳票イメージに対して文書レイアウト構造に基づいた文書論理構造解析を行い、この解析結果の内容に基づいて前記スキャナから読み込んだ読取結果を所定のマークアップ言語を用いたタグ付文書ファイルに変換する文書論理構造解析機能を備えた光学的文字読取装置に関する。
光学的文字読取装置(以下OCRと称す)に於いて、文書レイアウト解析情報等をもとに所定のマークアップ言語を用いたタグ付文書を生成し、このタグ付文書の内容を修正可能に表示して、最終出力結果となるタグ付文書を取得する機能を具備したものが存在する(例えば、特許文献1参照)。
従来のこの種、所定のマークアップ言語を用いたタグ付文書ファイルの修正機能をもつOCRは、タグ付文書を修正する際、読み取った帳票のイメージデータを表示する手段、最終成果物としての出力対象となるタグ付文書を修正可能に表示する手段等は存在しても、修正の対象となるタグ付文書は、座標情報をもたないことから、修正対象となる文字、または修正対象となるタグが付与された文字列が実際の帳票上のどの位置の文字であるかの確認を実際の帳票と見比べて修正しなければならず、従って修正並びに確認作業に於けるユーザの負担が大きく、修正確認作業の迅速化、効率化を図る上で問題があった。
特願平8−212293
上述したように従来では、タグ付文書の修正機能をもつOCRに於いて、タグ付文書を修正する際、読み取った帳票のイメージデータを表示する手段、タグ付文書を表示する手段等は存在しても、修正の対象となるタグ付文書は、座標情報をもたないことから、修正対象となる文字が実際の帳票上のどの位置の文字であるかの確認を実際の帳票と見比べて修正しなければならず、修正確認作業の効率化を図る上で問題があった。
そこで本発明は、所定のマークアップ言語を用いたタグ付文書について、修正、確認を行う際に、タグ付文書の修正、確認を行う部分に対応する帳票部分を認識する(捜す)作業の煩わしさ、並びに作業時間の無駄を排除して、タグ付文書の修正確認作業を容易かつ迅速に行うことのできる光学的文字読取装置を提供することを目的とする。
本発明は、修正確認の対象となるタグ付文書について、座標値を含んだ中間タグ付文書を取得し、この中間タグ付文書を用いて、出力対象となるタグ付文書の修正確認部分に対応する帳票部分の帳票イメージを表示する機能を実現したことを特徴とする。この表示機能を備えることで、実際の帳票を用いることなく、出力対象となるタグ付文書の帳票上に於ける修正確認位置を容易にかつ迅速に認識することができ、出力結果としてのタグ付文書の修正確認作業を効率よく実施できる。
即ち、本発明は、帳票イメージを記憶する帳票イメージ記憶手段と、前記帳票イメージ記憶手段に記憶された前記帳票イメージの文書論理構造解析を行う文書論理構造解析手段と、前記文書論理構造解析手段の解析結果に基づいて前記帳票イメージを文字認識する文字認識手段と、前記文字認識手段の文字認識結果と、その文字認識した帳票イメージの座標値とを記憶する中間文書記憶手段と、前記文字認識手段の文字認識結果にマークアップ言語を用いたタグを付与してタグ付文書を作成するタグ付け手段と、前記タグ付けされた文字認識結果を記憶するタグ付け文書記憶手段と、前記タグ付け文書を表示し、前記タグ付け文書において指示された文字に対応する帳票イメージを前記表示したタグ付け文書とともに表示する表示手段とを具備する光学的文字読取装置を特徴とする。
実際の帳票を用いることなく、出力対象となるタグ付文書の帳票上に於ける修正確認位置を容易にかつ迅速に認識できる。
以下図面を参照して本発明の実施形態を説明する。
本発明の実施形態による光学的文字読取装置(以下OCRと称す)の構成を図1に示す。この実施形態では、スキャナから読み込んだ帳票イメージをもとに、XML(extensible markup language)で記述したタグ付文書ファイル(XML文書ファイルと称す)を生成し、当該XML文書ファイルをDTD(document type definition)に則った出力結果として取得する構成例を示している。
図1に於いて、文書論理構造解析機能をもつOCR10は、スキャナ部11と処理制御部12とにより構成される。
スキャナ部11は、処理制御部12の制御の下に文字認識処理対象となる帳票(P)上を走査して、当該帳票(P)の帳票イメージを読み取り、読み取った帳票イメージデータを処理制御部12に送出する。
処理制御部12は、表示部13を備えたコンピュータシステムにより構成される。処理制御部12は、スキャナ部11から読み込んだ帳票イメージに対して文書レイアウト構造に基づいた文書論理構造解析を行い、当該帳票上の文字を、文字認識処理して、その読取結果を座標値を含んだ中間XML文書ファイルに変換し、更に既存規格の(即ちここではDTDに則った)XML文書ファイルに変換する。
処理制御部12は、帳票イメージファイル記憶部21と、中間XML文書ファイル記憶部22と、XML文書ファイル記憶部23とを備え、上記スキャナ部11から取得した帳票イメージファイルを帳票イメージファイル記憶部21に記憶し、上記座標値を含んだ中間XML文書ファイルを中間XML文書ファイル記憶部22に記憶し、DTDに則った出力対象となるXML文書ファイルをXML文書ファイル記憶部23に記憶する。
処理制御部12は、上記DTDに則ったXML文書の確認修正処理時に於いて、上記帳票イメージファイル記憶部21に記憶された帳票イメージファイルと、中間XML文書ファイル記憶部22に記憶された中間XML文書ファイルと、XML文書ファイル記憶部23に記憶されたXML文書ファイルとをもとに、XML文書確認修正処理画面101を生成し、表示部13に表示する。
このXML文書確認修正処理画面101は、確認並びに修正を行うためのXML文書エディタ画面102と、当該画面上で確認並びに修正を行う際に参照される確認部分イメージ表示画面103とにより構成される。XML文書エディタ画面102には、XML文書ファイル記憶部23に記憶された出力対象となるXML文書ファイルの内容が確認並びに修正位置を指定可能に表示される。確認部分イメージ表示画面103には、上記帳票イメージファイル記憶部21に記憶された帳票イメージファイルと、中間XML文書ファイル記憶部22に記憶された座標値とをもとに、上記XML文書エディタ画面102上の指定位置に対応する帳票イメージが表示される。この際のXML文書確認修正処理画面101の表示処理については図2を参照して後述する。
図2乃至図5はそれぞれ本発明の実施形態に於ける動作を説明するためのもので、図2は処理制御部12により実行されるXML文書確認修正処理画面101の表示処理手順を示すフローチャートである。図3は上記図2に示す表示処理により表示部13上に表示されるXML文書確認修正処理画面101の一構成例を示している。図4は上記図3に示すXML文書確認修正処理画面101に対応させた、中間XML文書ファイル記憶部22に記憶されている中間XML文書ファイルの具体的な記述例を示している。図5は同じく図3に示すXML文書確認修正処理画面101に対応させた、XML文書ファイル記憶部23に記憶されている確認、修正の対象となる(出力対象となる)XML文書ファイルの具体的な記述例を示している。
図4に示す中間XML文書ファイルの具体例では、認識した文字列の帳票上に於ける位置を座標「rect」(rectangle)で示している。「rect」=に続く所定桁の数値は、帳票上の認識文字列に対しての始点位置(x・y)、幅、及び高さを表す。図5に示す出力対象となるXML文書ファイルには、図4に示す中間XML文書ファイルから座標値を外したXML文書ファイルがDTDに則って従う形式で記憶される。このXML文書ファイル記憶部23に記憶されたXML文書ファイルが後述する確認、修正を経た後、最終的な成果物(出力結果)となる。
ここで、上記各図を参照して本発明の実施形態に於ける動作を説明する。
OCR10のたスキャナ部11は、処理制御部12の制御の下に、帳票(P)上を走査し、読み取った帳票イメージを処理制御部12に送出する。
処理制御部12は、スキャナ部11から読み込んだ帳票イメージに対して文書レイアウト構造に基づいた文書論理構造解析を行い、当該帳票上の文字を文字認識処理して、その文字認識結果を座標値を含んだ中間XML文書ファイルに変換し、更に出力対象となるDTDに則ったXML文書ファイルに変換する。そして上記スキャナ部11から取得した帳票イメージファイルを帳票イメージファイル記憶部21に記憶し、上記座標値を含んだ中間XML文書ファイルを中間XML文書ファイル記憶部22に記憶し、DTDに則った出力対象となるXML文書ファイルをXML文書ファイル記憶部23に記憶する。この際、中間XML文書ファイル記憶部22には、帳票(P)のレイアウト構造に基づいた解析結果の内容に従う座標値が、対応する行の文字列と関係付けられて記憶される。この際の中間XML文書の具体的な構造例については図4に示されている。この図4に示す中間XML文書に於いては、上述したように、認識文字列について、その各行座標が「rect」=**…**のように数値で記述されている。
処理制御部12は、上記DTDに則ったXML文書の確認修正処理時に於いて、上記帳票イメージファイル記憶部21に記憶された帳票イメージファイルと、中間XML文書ファイル記憶部22に記憶された中間XML文書ファイルと、XML文書ファイル記憶部23に記憶されたXML文書ファイルとをもとに、XML文書エディタ画面102と確認部分イメージ表示画面103とをもつXML文書確認修正処理画面101を生成し、表示部13に表示する。この際の表示処理手順を図2に示し、そのXML文書確認修正処理画面101の具体的な画面構成例を図3に示している。
このXML文書確認修正処理画面101の表示処理では、XML文書ファイル記憶部23に記憶されたXML文書ファイルから、XML文書エディタ画面102上のカーソル105で指定された文字列を対象に、その行を先頭とした若しくはその行を中心とした所定行のXML文書を取得し(図2ステップS11)、そのXML文書に従うXML文書エディタ画面102をXML文書確認修正処理画面101の右片半部に表示する。
さらに中間XML文書ファイル記憶部22に記憶された中間XML文書ファイルから、上記指定文字列の行を含んだ上記XML文書エディタ画面102の表示行に対応する各行の座標値を取得し(図2ステップS12)、その取得した座標をもとに、帳票イメージファイル記憶部21から上記各座標の帳票イメージを切り出して、その帳票イメージに従う確認部分イメージ表示画面103をXML文書確認修正処理画面101の左片半部に表示する(図2ステップS13)。
この図3に示すXML文書確認修正処理画面101上で、出力対象となるXML文書を確認し修正する際は、その確認若しくは修正対象となる文字列の行位置をカーソル105で指定して、確認若しくは修正対象となる文字列をXML文書エディタ画面102に表示する。このXML文書エディタ画面102上での位置指定に従って、確認部分イメージ表示画面103に、対応する帳票部分のイメージが表示される。
このXML文書エディタ画面102上で、例えばある文字が修正されると、その修正内容をもとに、中間XML文書ファイル記憶部22上の該当する行位置の対応する文字が書き換えられ、その書き換え内容がXML文書ファイル記憶部23に反映されてXML文書エディタ画面102に訂正文字が表示される。この際、修正(書き換え)が行われた帳票上の行位置は確認部分イメージ表示画面103に表示されていることから、ユーザは当該画面上で帳票上に於ける修正箇所を容易に認識することができる。例えば、XML文書エディタ画面102上でXML文書の確認を行っている際に、多岐に渡る読取行に「投信は、…」という文字列が存在し、その中の1行に「投信」を「投倍」と誤認識した文字列があり、その誤認識した文字を修正した際に、従来ではその修正を行った帳票上の位置を実際の帳票を参照しなければ特定できなかった。これに対して上記実施形態では、修正箇所に相当する帳票の部分イメージが、カーソル105の操作による修正位置の指定に伴い、確認部分イメージ表示画面103上に表示されるので、ユーザは修正を行った帳票上の位置を容易に確認できる。
また、文字認識結果に付与されたタグの誤りを修正する場合に、XML文書エディタ画面103において、カーソル105で示したタグが付与されている認識文字を含む文字列の座標値に基づいて帳票イメージファイル記憶部21から帳票イメージを読み出して確認部分イメージ表示画面103を表示する。この表示された確認部分イメージ表示画面103を参照することにより、タグの修正対象となる認識文字の文書における位置(文書構造における位置)を確認できるため、正しいタグに修正することが容易にできる。
上記した実施形態では、XML文書エディタ画面102上での位置指定に従って、確認部分イメージ表示画面103に、対応する帳票部分の複数行に亘るイメージが表示される構成としているが、修正箇所を選択的に、より明確に、確認部分イメージ表示画面103に表示することも可能である。例えば、中間XML文書ファイル記憶部22から取得した、XML文書エディタ画面102の指定行を示す座標値をもとに、確認部分イメージ表示画面103上の該当する行の文字列のみを反転表示若しくは特定色表示とすることも可能である。または、上記確認部分イメージ表示画面103上の該当する行の文字列のみを切り出して、選択的に確認部分イメージ表示画面103に表示することも可能である。または帳票イメージファイル記憶部21から上記座標値に従う行の文字列を切り出して、その切り出した文字列のイメージを確認部分イメージ表示画面103上で頁内文書イメージ上の指定位置に対応付けて張り付けることも可能である。
このようなXML文書エディタ画面102上の指定文字列を確認部分イメージ表示画面103上に明示する手段をさらに具備することで、上記したような確認修正作業をより簡単かつ容易に行うことができる。
本発明の実施形態に於けるOCRの要部の構成を示すブロック図。 本発明の実施形態に於けるXML文書確認修正処理画面の表示処理手順を示すフローチャート。 本発明の実施形態に於けるXML文書確認修正処理画面の構成例を示す図。 本発明の実施形態に於ける中間XML文書ファイルの具体的な記述例を示す図。 本発明の実施形態に於けるXML文書ファイルの具体的な記述例を示す図。
符号の説明
10…光学的文字読取装置(OCR)、11…スキャナ部、12…処理制御部、13…表示部、21…帳票イメージファイル記憶部、22…中間XML文書ファイル記憶部、23…XML文書ファイル記憶部、101…XML文書確認修正処理画面、102…確認部分イメージ表示画面、103…XML文書エディタ画面

Claims (2)

  1. 帳票イメージを記憶する帳票イメージ記憶手段と、
    前記帳票イメージ記憶手段に記憶された前記帳票イメージの文書論理構造解析を行う文書論理構造解析手段と、
    前記文書論理構造解析手段の解析結果に基づいて前記帳票イメージを文字認識する文字認識手段と、
    前記文字認識手段の文字認識結果と、その文字認識した帳票イメージの座標値とを記憶する中間文書記憶手段と、
    前記文字認識手段の文字認識結果にマークアップ言語を用いたタグを付与してタグ付文書を作成するタグ付け手段と、
    前記タグ付けされた文字認識結果を記憶するタグ付け文書記憶手段と、
    前記タグ付け文書を表示し、前記タグ付け文書において指示された文字に対応する帳票イメージを前記表示したタグ付け文書とともに表示する表示手段と
    を具備することを特徴とする光学的文字読取装置。
  2. 前記表示手段は、前記指示された修正対象文字に対応する帳票イメージをカーソル若しくは特定の表示形態で表示することを特徴とする請求項1記載の光学的文字読取装置。
JP2003280902A 2003-07-28 2003-07-28 光学的文字読取装置 Pending JP2005050094A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2003280902A JP2005050094A (ja) 2003-07-28 2003-07-28 光学的文字読取装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003280902A JP2005050094A (ja) 2003-07-28 2003-07-28 光学的文字読取装置

Publications (1)

Publication Number Publication Date
JP2005050094A true JP2005050094A (ja) 2005-02-24

Family

ID=34266585

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003280902A Pending JP2005050094A (ja) 2003-07-28 2003-07-28 光学的文字読取装置

Country Status (1)

Country Link
JP (1) JP2005050094A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010113454A (ja) * 2008-11-05 2010-05-20 Toshiba Finance Corp データ照合システム
JP2011022718A (ja) * 2009-07-14 2011-02-03 Toshiba Corp 情報処理システム、情報処理方法
JP2020181365A (ja) * 2019-04-25 2020-11-05 株式会社ミック 帳票作成システム
CN113608817A (zh) * 2021-08-19 2021-11-05 上海幻电信息科技有限公司 弹框处理方法及系统

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010113454A (ja) * 2008-11-05 2010-05-20 Toshiba Finance Corp データ照合システム
JP2011022718A (ja) * 2009-07-14 2011-02-03 Toshiba Corp 情報処理システム、情報処理方法
JP2020181365A (ja) * 2019-04-25 2020-11-05 株式会社ミック 帳票作成システム
CN113608817A (zh) * 2021-08-19 2021-11-05 上海幻电信息科技有限公司 弹框处理方法及系统
CN113608817B (zh) * 2021-08-19 2024-05-07 上海幻电信息科技有限公司 弹框处理方法及系统

Similar Documents

Publication Publication Date Title
JP4926004B2 (ja) 文書処理装置、文書処理方法及び文書処理プログラム
CN113138961B (zh) 一种应用于oct图像的文件转换方法、电子设备和存储介质
US20070116363A1 (en) Image processing device, image processing method, and storage medium storing image processing program
CN109726369A (zh) 一种基于标准文献的智能模板化题录技术实现方法
JP2003346078A (ja) 2次元コード読取装置、画像入力装置、2次元コード読み取り方法、画像入力方法、そのプログラム、及びそのプログラムを記録した記録媒体
JP2008108114A (ja) 文書処理装置および文書処理方法
JP2005050094A (ja) 光学的文字読取装置
JP4935459B2 (ja) 文字認識方法、文字認識プログラムおよび文字認識装置
WO2022004097A1 (ja) 情報処理装置、情報処理方法、及びコンピュータプログラム
JPH10162098A (ja) 文書電子化装置及び文書電子化方法
JP2008027133A (ja) 帳票処理装置及び帳票処理方法ならびに帳票処理方法を実行するプログラムと記憶媒体
JPH103483A (ja) 情報検索装置
JP7206740B2 (ja) 情報処理装置及びプログラム
JP3732254B2 (ja) フォーマット情報生成方法及びフォーマット情報生成装置
JP2005044256A (ja) 帳票フィールド属性作成システムおよび方法、並びにプログラム
JP2544589B2 (ja) 文書処理方法及び装置
JPH06251187A (ja) 文字認識誤り修正方法及び装置
CN113221608A (zh) 信息处理装置、信息处理方法及计算机可读介质
JP2001084330A (ja) マーク訂正確認システム、方法、確認用プログラム記録媒体
JPH0475185A (ja) 入力装置
JP2001184349A (ja) 文書編集装置および文書編集方法および記録媒体
JP2003085477A (ja) 文字認識装置および文字認識結果の訂正方法
JP2007108830A (ja) 帳票処理装置
JP2829186B2 (ja) 光学的文字読取装置
JP2001307016A (ja) 文字認識装置

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060822

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20061023

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20061219