JP3860341B2 - 文字認識装置 - Google Patents

文字認識装置 Download PDF

Info

Publication number
JP3860341B2
JP3860341B2 JP17732098A JP17732098A JP3860341B2 JP 3860341 B2 JP3860341 B2 JP 3860341B2 JP 17732098 A JP17732098 A JP 17732098A JP 17732098 A JP17732098 A JP 17732098A JP 3860341 B2 JP3860341 B2 JP 3860341B2
Authority
JP
Japan
Prior art keywords
column
character recognition
amount
money
cells
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP17732098A
Other languages
English (en)
Other versions
JP2000011071A (ja
Inventor
敏浩 中村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP17732098A priority Critical patent/JP3860341B2/ja
Publication of JP2000011071A publication Critical patent/JP2000011071A/ja
Application granted granted Critical
Publication of JP3860341B2 publication Critical patent/JP3860341B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Landscapes

  • Character Discrimination (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、帳票などに記入された文字を光学的に読取り、その文字を認識処理する文字認識装置(OCR:Optical Character Reader)に係り、特にフリーフォーマットの活字日本語文書を読取り対象としたテキストリーダタイプの文字認識装置関する。
【0002】
【従来の技術】
従来、光学的文字認識装置の一種に「テキストリーダ」と呼ばれるOCRがある。これは、業務用のOCRのように、定型フォーマットの帳票を読取り対象として、FC(フォーマットコントロール)データを用いて予め決められた読取り範囲内の文字を認識するものとは異なり、雑誌やワープロ文書のようなフリーフォーマットの日本語活字文書を読取り対象としたOCRであって、ソフトウェアにより汎用のパーソナルコンピュータにて実現されるものである。
【0003】
テキストリーダは、一般にイメージ入力処理、レイアウト解析処理、文字認識処理、修正処理、出力変換処理の順で処理を行う。
レイアウト解析処理では、日本語活字文書イメージからテキスト領域、表領域、図・写真領域などの各領域を自動的あるいはユーザの指定に基づいて抽出する。文字認識処理では、レイアウト解析処理によって抽出された各領域毎に文字の認識を行う。修正処理では、文字認識結果を修正画面に表示してユーザの指示により認識の誤りを修正する。この場合、レイアウト解析処理で表として抽出された領域は一般に修正画面でも表として表示される。出力変換処理では、修正画面上で修正された認識結果を出力する処理を行う。
【0004】
このようなテキストリーダにおいて、表領域に対する文字認識処理は、レイアウト解析結果に従って、表を構成する各セル毎に行われる。その際、セル内の文字の先頭にある空白部分については、文字の1つとして認識することは難しいので(何文字分の空白として認識すればよいか分からないので)、認識結果として再現されない。したがって、表領域の各セルに対応する認識結果文字(数字列)は、すべて左側に寄せられて修正画面に表示されることになる(図2(c)参照)。
【0005】
【発明が解決しようとする課題】
例えば、銀行などの金融機関で扱う帳票などには、金額データが記入されたカラムが存在する。このような帳票を読取り対象とした場合には、少なくとも金額カラムの認識結果に対して、右揃えであることが望まれる。これは、一般に金額データは他の項目データ(商品名など)と比べると、その文字列が長く、習慣的にもセル内の右側に寄せてある方が目検しやすく、誤読の発見が容易であるからである。
【0006】
しかしながら、従来のテキストリーダでは、表領域中の各セルに対応する認識結果文字をすべて左揃えでしか表示できなかったため、金額カラムに記入された金額データも左側に寄せられて表示されることになり、ユーザの使い勝手上、非常に不便であった。
【0007】
なお、文字認識後、ユーザが修正画面上で金額カラムを指定し、その金額カラム内のすべてのデータを一括して右揃えに編集することも可能ではある。しかしながら、その都度、右揃えのための編集操作をユーザ自身が行わなければならないため、ユーザに負担がかかるなどの問題がある。特に、多数の帳票を処理しなければならない業務では、処理の高速化が求められるため、このようなユーザによる編集操作はエントリー時間の無駄であり、処理効率が著しく低下することになる。
【0008】
本発明は上記の課題を解決するためになされたもので、表領域中の金額カラムを自動的に判別して、その認識結果を右揃えでユーザに提示することのできる文字認識装置提供することを目的とする。
【0009】
【課題を解決するための手段】
本発明の文字認識装置は、読取り対象イメージから表領域を抽出するレイアウト解析手段と、このレイアウト解析手段によって抽出された上記表領域に対して文字認識処理を行う文字認識手段と、上記表領域を構成する各カラム毎に当該カラムの中でカンマで3桁に区切られている数字列を有するセルの数を計数する計数手段と、この計数手段によって得られた計数値と当該カラムの全セル数との割合に基づいて金額カラムであるか否かを判定する金額カラム判定手段と、この金額カラム判定手段の判定結果に基づいて上記金額カラムの各セルに対応する上記文字認識手段の認識結果文字を右揃えに編集する編集手段とを具備して構成される。
【0010】
上記金額カラム判定手段は、上記計数手段によって得られた計数値と当該カラムの全セル数との割合が予め設定された値よりも大きい場合に当該カラムを金額カラムであると判定する。
【0011】
このような構成によれば、読取り対象イメージから表領域が抽出されて文字認識処理された場合に、表領域中の金額カラムが自動的に判定されて、その金額カラムの各セルに対応する認識結果文字が右揃えで出力される。したがって、修正画面上で、金額カラムについては、そのセルの内容つまり金額データを右揃えにした状態で確認することができ、誤読などをチェックする際に非常に都合の良いものとなる。
【0012】
【発明の実施の形態】
以下、図面を参照して本発明の一実施形態を説明する。
図1は本発明の一実施形態に係る文字認識装置のシステム構成を示すブロック図である。なお、本装置は、フリーフォーマットの活字日本語文書を読取り対象としたテキストリーダタイプのOCRであり、例えば磁気ディスク等の記録媒体に記録されたプログラムを読み込み、このプログラムによって動作が制御されるコンピュータによって実現される。
【0013】
図1に示すように、本実施形態における文字認識装置は、PC(パーソナルコンピュータ)10とスキャナ20によって構成される。
PC10は、汎用のコンピュータであって、CPU11、ROM12、RAM13、入力装置14、表示装置15、CD−ROM(Compact Disc Read Only Memory) 16、FDD(Floppy Disk Drive )17、HDD (Hard Disk Drive)18などを有する。
【0014】
CPU11は、本装置全体の制御を行うものであり、プログラムの起動で各種処理を実行するものであり、ここでは所定のアプリケーションプログラムの起動によりOCRとしての処理を実行する。ROM12、RAM13は、プログラムデータ、フォントデータ、辞書データなど、本装置の処理動作に必要な各種のデータを記憶している。
【0015】
入力装置14は、例えばキーボードからなり、データの入力やファンクションの指示などを行う場合に用いられる。表示装置15は、CRT (Cathode Ray Tube) やLCD (Liquid Crystal Display) などからなり、データの表示を行う。
【0016】
CD−ROM16、FDD17、HDD18は、本装置の外部記憶装置として用いられるものである。本実施形態において、テキストリーダを実現するアプリケーションプログラムはCD−ROM16またはFDD17を通じてHDD18にインストールされた後、起動時にRAM13に書き込まれる。CPU11はこのRAM13に書き込まれたアプリケーションプログラムに従ってOCRとしての処理を実行する。
【0017】
スキャナ20は、読取り対象21のイメージを直接デジタルデータとして入力する画像入力装置である。この場合、読取り対象21としては、雑誌やワープロ文書などのフリーフォーマットの日本語活字文書を前提とする。
【0018】
次に、上記図1のシステム構成にて実現されるテキストリーダの構成について説明する。
図2は上記図1のシステム構成にて実現されるテキストリーダの概念図である。例えば、図2(a)に示すような帳票イメージをスキャナ20により読み込んだものとする。この帳票には、タイトル領域31a、テキスト領域32aおよび32b、表領域33、図・写真領域34などが設けられている。
【0019】
テキストリーダは、図同(b)に示すように、レイアウト解析部41、文字認識部42、金額カラム判定/右寄せ部43を有する。なお、レイアウト解析部41、文字認識部42、金額カラム判定/右寄せ部43は、実際にはソフトウェアにて実現される部分である。
【0020】
レイアウト解析部41は、帳票イメージのレイアウトを解析し、タイトル領域31a、テキスト領域32aおよび32b、表領域33、図・写真領域34などの各領域を抽出する。
【0021】
文字認識部42は、レイアウト解析部41によって抽出された各領域毎に文字の認識処理を行う。同図(c)に表領域33に対する認識結果を示す。この例では、表領域33が「商品名」、「形番」、「数量」、「金額」、「備考」といった複数のカラム51〜55を有し、これらのカラムに対応する認識結果が表示されている。なお、認識結果として実際に出力されるデータは各セル内の文字(数字を含む)であり、表を構成する罫線などのデータは修正画面上で張り付けられる。
【0022】
金額カラム判定/右寄せ部43は、本発明の主要部分であり、表領域33中の金額カラムを判定すると共に、金額カラムであれば、文字認識部42から認識結果として得られる各セルの金額データを右揃えに編集する処理を行う。同図(d)に金額カラム54に対して金額データを右揃えにした状態を示す。
【0023】
次に、同実施形態の動作を説明する。
テキストリーダを実現するアプリケーションプログラムが図1に示すPC10のCD−ROM16またはFDD17を通じてHDD18にインストールされているものとする。CPU11はこのアプリケーションプログラムをRAM13に読み込むことにより、同プログラムに従ってOCR機能を実行する。このときの概念図を図2に示す。
【0024】
今、スキャナ20を通じて、図2(a)に示すような帳票イメージが読み込まれたとする。この帳票には、タイトル領域31a、テキスト領域32aおよび32b、表領域33、図・写真領域34などの各領域が存在する。これらの領域はフリーフォーマットであるため、テキストリーダ側で各領域を解析することになる。この解析処理はレイアウト解析部41が行う。
【0025】
すなわち、同図(b)に示すように、レイアウト解析部41は帳票イメージからタイトル領域31a、テキスト領域32aおよび32b、表領域33、図・写真領域34などの各領域を抽出する。文字認識部42はこれらの領域毎にその領域内に記述されている各文字を1文字ずつ切り出して認識処理する。
【0026】
なお、文字認識の方法としては、例えば認識対象とする文字のパターンを標準パターンとして持つ認識辞書を用意しておき、この認識辞書の標準パターンと入力パターンとを比較して類似している標準パターンを選択して認識結果とするなどの方法がある。
【0027】
ここで、レイアウト解析部41によって表領域33であることが解析され、その表領域33に対する認識結果が文字認識部42によって得られると、金額カラム判定/右寄せ部43によって金額カラム自動判定処理が行われる。
【0028】
以下、図3に示すフローチャートを参照して金額カラム自動判定処理の動作を説明する。
まず、金額カラム判定/右寄せ部43は表領域33を構成する各カラムを左または右から順番に取り出す(ステップS11)。この場合、図2(c)に示すように、表領域33は「商品名」、「形番」、「数量」、「金額」、「備考」といった複数のカラム51〜55を有するが、通常、これらのカラムの各セルに対する認識結果文字はすべて左揃えで出力される。これは、セル内の文字の先頭にある空白部分については、文字の1つとして認識することは難しいので(何文字分の空白として認識すればよいか分からないので)、認識結果として再現できないためである。
【0029】
表領域33からチェック対象となるカラムを取り出すと、図示せぬカウンタKを「0」に初期化した状態で(ステップS12)、そのカラム内の各セルを上または下から順番に取り出す(ステップS13)。
【0030】
ここで、本実施形態では、金額カラムの判定に、「金額カラムはカンマで3桁区切りされている数字列が記入されていることが多い」といった性質を利用する。そこで、上記ステップS13で抽出したセルの内容をチェックし、数字で、かつ、カンマで3桁区切りされているか否かを判断する(ステップS14)。なお、カンマは数字としてOCRのサブセットに入っている。
【0031】
その結果、セルの内容が金額カラムの条件(数字で、かつ、カンマで3桁区切り)に該当すれば(ステップS14のYes)、カウンタKを「+1」インクリメントした後(ステップS15)、次のセルを抽出して上記同様のチェックを繰り返す(ステップS16のYes)。
【0032】
このようにして、カラム内のすべてのセルをチェックし、上記金額カラムの条件に合致するセルがあれば、その都度、カウンタKを「+1」ずつインクリメントしていく。
【0033】
カラム内のすべてのセルをチェックし終えると(ステップS16のNo)、当該カラムの全セル数とカウンタKの値との割合Rを求め(ステップS17)、その割合Rが設定値Cより大きいか否かを判断する(ステップS18)。
【0034】
なお、この設定値Cは、誤読率などを考慮して、例えば80%の割合であれば金額カラムとして判定するような値に予め設定されている。
ここで、上記ステップS17で求めた割合Rが設定値Cより大きい場合には、つまり、上記金額カラム条件に合致するセルの割合が例えば設定値80%を超えていれば(ステップS18のYes)、当該カラムは金額カラムであると判定し、そのカラム内の各セルに対応する認識結果文字(数字列)をすべて右揃えに編集する(ステップS19)。編集後の金額カラム54の表示内容を図2(d)に示す。
【0035】
一方、上記ステップS18において、上記割合Rが設定値C以下であれば、つまり、上記金額カラム条件に合致するセルの割合が例えば設定値80%に満たない場合には、当該カラムは金額カラムでないと判定し、次のカラムを抽出して上記同様のチェックを繰り返す(ステップS20のYes)。
【0036】
このように、数字で、かつ、カンマで3桁区切りされているセルの割合から金額カラムであることが判定され、その金額カラム内の各セル中の数字列が右側に寄せられて表示される。
【0037】
図2(c)に示す認識結果の例では、金額カラム54の各セルの内容が「100」、「1,000」、「10,000」、「100,000」、「1,100,000」であり、上記金額カラム条件に合わないセルは1段目だけであるので、金額カラムであると判定される。したがって、修正画面上において、表領域33の金額カラム54に対しては、図2(d)に示すように、各セルの内容つまり金額データを右揃えにした状態で確認することができ、誤読などをチェックするのに非常に都合の良いものとなる。
【0038】
なお、上記実施形態では、カラムが持つすべてのセルをチェックした結果に基づいて当該カラムが金額カラムか否かを判定するようにしたが、例えば以下のような手順で判定処理を行うこともできる。
【0039】
すなわち、まず、チェック対象となるカラムを抽出したときに、そのカラムの全セル数を求め、その全セル数と上記設定値Cとを乗算することにより、金額カラムと判定するための基準セル数Sを求める。そして、当該カラムの各セルを順にチェックしていき、上記条件(数字で、かつ、カンマで3桁区切り)に合致したセルの数が上記基準セル数Sに達した時点で当該カラムは金額カラムであると判定する。
【0040】
このような手順で判定処理を行えば、カラム内のすべてのセルを最後までチェックしなくとも、金額カラムであるとの判定を下すことができ、処理時間の短縮化を図ることができる。
【0041】
また、セルの内容が数字であることだけを条件にして金額カラムであるか否かを判定する方法も考えられる。ただし、この場合には、例えば図2(c)に示す「形番」や「数量」など、数字を有するすべてのカラムを編集してしまうことになるため、返って見づらい結果になる可能性がある。
【0042】
また、カラムの見出しが予め設定された文字列(例えば「金額」)であることを認識することにより、金額カラムであると判定し、右揃えの編集を行うようにしても良い。
【0043】
なお、上述した実施形態において記載した手法は、コンピュータに実行させることのできるプログラムとして、例えば磁気ディスク(フロッピーディスク、ハードディスク等)、光ディスク(CD−ROM、DVD等)、半導体メモリなどの記録媒体に書き込んで各種装置に適用したり、通信媒体により伝送して各種装置に適用することも可能である。本装置を実現するコンピュータは、記録媒体に記録されたプログラムを読み込み、このプログラムによって動作が制御されることにより、上述した処理を実行する。
【0044】
【発明の効果】
以上詳記したように本発明によれば、テキストリーダタイプのOCRにおいて、読取り対象イメージから表領域を抽出して文字認識した際に、表領域中の金額カラムを判定し、その金額カラムの各セルに対応する認識結果文字を右揃えで編集出力するようにしたため、修正画面上で、金額カラムについては、そのセルの内容つまり金額データを右揃えにした状態で確認することができる。これにより、金額カラムを有する表領域の認識結果を得た際に、誤読などの目検チェックが容易になるなど、使い勝手が向上するようになる。
【図面の簡単な説明】
【図1】本発明の一実施形態に係る文字認識装置のシステム構成を示すブロック図。
【図2】上記図1のシステム構成にて実現されるテキストリーダの概念図。
【図3】同実施形態における金額カラム自動判定処理の動作を説明するためのフローチャート。
【符号の説明】
10…PC
11…CPU
12…ROM
13…RAM
14…入力装置
15…表示装置
16…CD−ROM
17…FDD
18…HDD
20…スキャナ
21…読取り対象
33…表領域
41…レイアウト解析部
42…文字認識部
43…金額カラム判定/右寄せ部
54…金額カラム

Claims (2)

  1. 読取り対象イメージから表領域を抽出するレイアウト解析手段と、
    このレイアウト解析手段によって抽出された上記表領域に対して文字認識処理を行う文字認識手段と、
    上記表領域を構成する各カラム毎に当該カラムの中でカンマで3桁に区切られている数字列を有するセルの数を計数する計数手段と、
    この計数手段によって得られた計数値と当該カラムの全セル数との割合に基づいて金額カラムであるか否かを判定する金額カラム判定手段と、
    この金額カラム判定手段の判定結果に基づいて上記金額カラムの各セルに対応する上記文字認識手段の認識結果文字を右揃えに編集する編集手段と
    を具備したことを特徴とする文字認識装置。
  2. 上記金額カラム判定手段は、上記計数手段によって得られた計数値と当該カラムの全セル数との割合が予め設定された値よりも大きい場合に当該カラムを金額カラムであると判定することを特徴とする請求項1記載の文字認識装置。
JP17732098A 1998-06-24 1998-06-24 文字認識装置 Expired - Lifetime JP3860341B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP17732098A JP3860341B2 (ja) 1998-06-24 1998-06-24 文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP17732098A JP3860341B2 (ja) 1998-06-24 1998-06-24 文字認識装置

Publications (2)

Publication Number Publication Date
JP2000011071A JP2000011071A (ja) 2000-01-14
JP3860341B2 true JP3860341B2 (ja) 2006-12-20

Family

ID=16028929

Family Applications (1)

Application Number Title Priority Date Filing Date
JP17732098A Expired - Lifetime JP3860341B2 (ja) 1998-06-24 1998-06-24 文字認識装置

Country Status (1)

Country Link
JP (1) JP3860341B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
NO20034035D0 (no) * 2003-09-11 2003-09-11 Opera Software Asa Skjelne og fremvise tabeller i dokumenter
JP2021028770A (ja) * 2019-08-09 2021-02-25 株式会社日立製作所 情報処理装置及び表認識方法

Also Published As

Publication number Publication date
JP2000011071A (ja) 2000-01-14

Similar Documents

Publication Publication Date Title
US20160078555A1 (en) Reading, organizing and manipulating accounting data
JPH05113879A (ja) プログラムの作成及びデータの処理方法
WO2001061587A1 (en) Financial processing system and method
JP3860341B2 (ja) 文字認識装置
US7080316B2 (en) Method for determining rubies
US20040139056A1 (en) Information display control apparatus and recording medium having recorded information display control program
JP7468960B1 (ja) 情報処理装置、情報処理方法及び情報処理プログラム
US20050050065A1 (en) Automating form transcription
JPH0470962A (ja) データ処理装置
JPH0520494A (ja) 帳票属性認識・表示方法
JP3567299B2 (ja) グラフ生成出力装置
JPH10302025A (ja) 手書き文字認識装置およびそのプログラム記録媒体
WO2023047570A1 (ja) 情報処理装置、情報処理方法、情報処理プログラム
US20240184985A1 (en) Information representation structure analysis device, and information representation structure analysis method
US5396589A (en) Character input apparatus for determining the total number of characters which may be written in a predetermined space
JPH11203279A (ja) かな漢字変換装置、かな漢字変換方法、及び記憶媒体
JPH10105558A (ja) 単語データ記憶装置、単語データ記憶方法及び記録媒体
JP2558692B2 (ja) 書画ファイル装置
JPS59177649A (ja) デ−タ処理装置
JPS61231661A (ja) 情報処理装置
JPH0778800B2 (ja) 文書処理装置
JP3237709B2 (ja) 文書処理装置及び文書処理方法
JPS6382543A (ja) 帳票の発行および処理装置
JPH01169569A (ja) 文書作成装置に於ける文章推敲方法
JP3496499B2 (ja) 計算データ処理装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20040924

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060418

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060614

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060704

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060901

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20060919

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20060921

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090929

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100929

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100929

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110929

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120929

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120929

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130929

Year of fee payment: 7

EXPY Cancellation because of completion of term