JP2016095753A - 文字認識システム及び文字認識方法 - Google Patents

文字認識システム及び文字認識方法 Download PDF

Info

Publication number
JP2016095753A
JP2016095753A JP2014232521A JP2014232521A JP2016095753A JP 2016095753 A JP2016095753 A JP 2016095753A JP 2014232521 A JP2014232521 A JP 2014232521A JP 2014232521 A JP2014232521 A JP 2014232521A JP 2016095753 A JP2016095753 A JP 2016095753A
Authority
JP
Japan
Prior art keywords
character
result
character string
data
conversion
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2014232521A
Other languages
English (en)
Other versions
JP6472218B2 (ja
Inventor
博樹 横井
Hiroki Yokoi
博樹 横井
和樹 中島
Kazuki Nakajima
和樹 中島
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Information and Telecommunication Engineering Ltd
Original Assignee
Hitachi Information and Telecommunication Engineering Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Information and Telecommunication Engineering Ltd filed Critical Hitachi Information and Telecommunication Engineering Ltd
Priority to JP2014232521A priority Critical patent/JP6472218B2/ja
Priority to CN201510785494.3A priority patent/CN105608453B/zh
Publication of JP2016095753A publication Critical patent/JP2016095753A/ja
Application granted granted Critical
Publication of JP6472218B2 publication Critical patent/JP6472218B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/22Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/19Recognition using electronic means
    • G06V30/196Recognition using electronic means using sequential comparisons of the image signals with a plurality of references
    • G06V30/1983Syntactic or structural pattern recognition, e.g. symbolic string recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Character Discrimination (AREA)

Abstract

【課題】文字認識に関して、文字の種類が異なる二重エントリを含む帳票の場合にも、精度や効率を高め、ユーザの作業の負担を軽減できる技術を提供する。【解決手段】文字認識システムは、帳票の画像データを得る帳票入力部と、帳票の画像データから、2つのフィールドの2つの文字列として、第1のフィールドの第1の文字列、及び第2のフィールドの第2の文字列を文字認識し、認識結果文字データを得る文字認識部と、認識結果文字データから、第1の文字列の文字種と第2の文字列の文字種とが異なる場合に、一方の文字列の文字種を他方の文字列の文字種に合わせるように一方の文字列を変換し、変換結果文字データを得る変換部と、変換結果文字データから、第1の文字列と第2の文字列とを比較し、一致または不一致を判定し、比較結果データを得る比較部と、比較結果データを含む出力データをユーザへ出力する出力部と、を有する。【選択図】図1

Description

本発明は、OCR(Optical Character Reader)を用いた文字認識の技術に関する。
OCRを用いた文字認識システムは、請求書や小切手等の帳票から画像を読み込み、帳票の欄に記入されている文字を認識し、その文字データを得る。ユーザは、画面でその文字データを見て、帳票の記入内容の確認、データの修正や確定、等の作業を行う。
OCRを用いた文字認識システムに関する先行技術例として、特開2002−92545号公報(特許文献1)が挙げられる。特許文献1には、帳票における2つの欄に記入された2つの金額の文字を文字認識する旨が記載されている。
特開2002−92545号公報
帳票における2つの欄または箇所に、二重エントリとして、対応関係を持つ2つの文字列が記入される場合がある。二重エントリは、金額等の重要な情報について、正確性の確保や、改ざん防止等の目的で行われる場合がある。二重エントリは、複記と呼ばれる場合もある。帳票には、二重エントリのための2つの欄が併設される場合がある。例えば、請求書において、金額の記入欄に、金額の文字列が記入され、複記欄に、記入欄の金額と同じ金額の文字列が記入される。
従来の文字認識システムは、帳票の二重エントリの2つの文字列を、単に別々に文字認識してデータを得る場合、2つの文字列の対応関係については判定していない。その場合、ユーザは、誤った金額等の文字列を得る可能性や、2つの文字列の不一致に気付かない可能性が高くなる。
特許文献1の技術は、帳票の2つの欄に同じ金額が同じ種類の文字、例えば算用数字で記入される場合に対応した技術である。
しかし、帳票の二重エントリの2つの欄または箇所に、同じ金額が異なる種類の文字で記入または印字される場合がある。例えば、記入欄に、金額が算用数字で記入され、複記欄に、同じ金額が漢数字で記入される。複記欄が無い帳票の場合、記入欄の近くの箇所に金額が記入される場合もある。
上記の場合、従来の文字認識システムは、2つの金額の文字の種類が異なるため、単純比較、及び対応関係の判定等はできない。ユーザは、2つの金額の文字認識結果を見て、2つの金額を比較し、金額の記入誤りや改ざん等の可能性が無いか判断及び確認する必要がある。ユーザは、帳票毎にこのような作業が要求され、手間及び時間がかかる。
特に、2つの金額の文字の種類が異なる場合、文字の種類が同じである場合よりも、ユーザは、金額の比較や判断を一見ですぐに行うことは難しい。また、多数の帳票の処理を行う文字認識システムは、ユーザによる帳票の確認等の作業を介在する場合、処理を一時停止させる必要がある。そのため、多数の帳票の処理に長い時間がかかり、ユーザの作業の負担が大きい。
上記のように、従来の文字認識システムは、二重エントリを含む帳票の文字認識に関して、精度や効率の観点で改善余地がある。
本発明の目的は、文字認識システムに関して、文字の種類が異なる二重エントリを含む帳票の場合にも、精度や効率を高め、ユーザの作業の負担を軽減できる技術を提供することである。
本発明のうち代表的な実施の形態は、文字認識システム及び文字認識方法であって、以下に示す構成を有することを特徴とする。
一実施の形態の文字認識システムは、帳票を入力して当該帳票の画像データを得る帳票入力部と、前記帳票の前記画像データから、2つのフィールドの2つの文字列として、第1のフィールドの第1の文字列、及び第2のフィールドの第2の文字列を文字認識し、認識結果文字データを得る文字認識部と、前記認識結果文字データから、前記第1の文字列の文字種と前記第2の文字列の文字種とが異なる場合に、一方の文字列の文字種を他方の文字列の文字種に合わせるように前記一方の文字列を変換し、変換結果文字データを得る変換部と、前記変換結果文字データから、前記第1の文字列と前記第2の文字列とを比較し、一致または不一致を判定し、比較結果データを得る比較部と、前記比較結果データを含む出力データをユーザへ出力する出力部と、を有する。
本発明のうち代表的な実施の形態によれば、文字認識システムに関して、文字の種類が異なる二重エントリを含む帳票の場合にも、精度や効率を高め、ユーザの作業の負担を軽減できる。
本発明の実施の形態1の文字認識システムの構成を示す図である。 実施の形態1における、帳票の具体例を示す図である。 実施の形態1における、処理及び作業の概要のフローを示す図である。 実施の形態1における、誤読低減モードの場合の処理フローを示す図である。 実施の形態1における、読み取り指定の際の画面例を示す図である。 実施の形態1における、対象箇所の読み取り例を示す図である。 実施の形態1における、位置ずれ補正処理の例を示す図である。 実施の形態1における、桁数比較処理の例を示す図である。 実施の形態1における、文字列変換処理の例を示す図である。 実施の形態1における、文字列変換処理に用いる変換表の例を示す図である。 実施の形態1における、第1の変換の場合の変換処理のフローを示す図である。 実施の形態1における、第2の変換の場合の変換処理のフローを示す図である。 実施の形態1における、文字列比較処理の例を示す図である。 実施の形態1における、改ざん可能性判定処理の例を示す図である。 実施の形態1における、結果画面の出力例を示す図である。 実施の形態1における、結果画面の出力例を示す図である。 実施の形態1における、不読低減モードの場合の処理フローを示す図である。 実施の形態1における、第1の変換の場合の、変換処理及び比較処理を含むフローを示す図である。 実施の形態1における、第2の変換の場合の、変換処理及び比較処理を含むフローを示す図である。 実施の形態1における、不読が有る場合の処理として、第1の変換の場合の例を示す図である。 実施の形態1における、不読が有る場合の処理表の例を示す図である。 本発明の実施の形態2の文字認識システムの構成を示す図である。
以下、本発明の実施の形態を図面に基づいて詳細に説明する。なお、実施の形態を説明するための全図において同一部には原則として同一符号を付し、その繰り返しの説明は省略する。
(実施の形態1)
図1〜図21を用いて、本発明の実施の形態1の文字認識システム及び文字認識方法について説明する。実施の形態1の文字認識システムは、OCRを用いて帳票の文字認識の処理を行うシステムである。実施の形態1の文字認識方法は、実施の形態1の文字認識システム上において、ユーザの操作に基づいてコンピュータにより実行される処理手順を含む方法である。
実施の形態1の文字認識システムは、帳票の2つの箇所に二重エントリとして記入されている2つの金額等の文字列について、それらの文字の種類が異なる場合にも、自動的に、文字種の変換、比較、及び判定等を行う高度な機能を提供する。文字認識システムは、2つの文字列を比較し、一致及び不一致や、記入誤りや改ざん等の可能性を判定し、その結果に応じて、アラート等を含む結果画面をユーザへ出力し、出力データを保存する。これにより、ユーザによる帳票の確認や修正等の作業を支援する。
[文字認識システム]
図1は、実施の形態1の文字認識システムの構成を示す。実施の形態1の文字認識システムは、OCR装置1とPC2との接続により構成される。実施の形態1の文字認識システムは、帳票5のOCR処理に関する主な処理をPC2で行う。言い換えると、実施の形態1の文字認識システムは、ソフトOCR方式のシステムである。OCR装置1は、帳票5のOCR処理のうち、帳票5の画像データを得る処理までを行う装置である。PC2は、ソフトウェア処理によりOCR処理を行う装置である。OCR処理は、言い換えると、帳票5のデータ化、文字列データを得る処理である。
ユーザは、実施の形態1の文字認識システムを利用し、OCR装置1及びPC2を操作する。ユーザは、帳票5のOCR処理に関する作業として、帳票5の記載内容の確認、データの修正や確定、等の作業を行う。
帳票5は、所定の業務で用いられる所定の形式の帳票であり、例えば請求書や小切手である。図示しない記入者は、帳票5の欄に、金額等の文字を、手書きで記入する。あるいは、帳票5の欄には、金額等の文字が、ライター等の機器を用いて印字される。ユーザは、提出された帳票5を受け取る。
ユーザは、作業のため、1枚以上の帳票5を、OCR装置1にセットし入力する。ユーザは、PC2を操作し、作業に関する設定や指示入力を行う。PC2は、指示入力に従い、OCR装置1へ命令を送信する。OCR装置1は、PC2からの命令に従い、帳票5のOCR処理を開始する。
OCR装置1は、帳票入力部11を含む。帳票入力部11は、図示しないスキャナ等のハードウェア及びソフトウェアにより構成される。OCR装置1は、帳票入力部11により、帳票5を読み込んでスキャンし、帳票5の画像データ21を得る。OCR装置1は、読み込み済みの帳票5を、図示しないスタッカへ排出し蓄積する。
OCR装置1とPC2は、所定の通信インタフェースで接続される。OCR装置1は、図示しない通信インタフェース装置を含む。OCR装置1は、帳票入力部11により得た画像データ21を、通信インタフェース装置による通信処理を介してPC2へ転送する。
PC2は、制御装置201、記憶装置202、入力装置203、表示装置204、印刷装置205、及び通信インタフェース装置206を有する。制御装置201は、CPU、ROM、RAM等により構成される。記憶装置202は、メモリやディスク等を含む。入力装置203は、キーボードやマウス等を含む。通信インタフェース装置206は、OCR装置1との通信インタフェースに対応した通信処理を行う。
入力装置203や表示装置204等は、PC2の外部に接続されてもよい。PC2は、その他の入出力装置が接続されてもよい。PC2は、通信インタフェース装置206を通じてLAN等の通信網に接続されてもよい。PC2は、LAN等に接続されるサーバやストレージに、OCR処理に係わるデータを保存してもよい。
制御装置201は、記憶装置202に格納されているプログラム20をロードしてソフトウェア処理を実行することにより、文字認識部12等の各処理部を実現する。プログラム20は、PC2に特有のOCR処理を実行させるプログラムである。制御部201は、文字認識部12、変換部13、比較部14、出力部15、及びユーザインタフェース部16を有する。
記憶装置202は、OCR処理に係わる各データとして、画像データ21、認識結果文字データ22、変換結果文字データ23、比較結果データ24、及び出力データ25等を記憶する。
PC2は、OCR装置1から転送された帳票5の画像データ21を、通信インタフェース装置206を通じて受信し、記憶装置202内に格納する。
文字認識部12は、帳票5の画像データ21を入力し、画像データ21に対して文字認識処理を行い、その結果である認識結果文字データ22を出力する。文字認識部12は、認識結果文字データ22を記憶装置202に格納する。
PC2は、後述の位置ずれ補正処理や桁数比較処理を行う機能を備える。PC2は、認識結果文字データ22に基づいて、位置ずれ補正処理や桁数比較処理を行う。
変換部13は、記憶装置202の認識結果文字データ22を入力し、認識結果文字データ22に対して、所定の変換処理を行い、その結果である変換結果文字データ23を出力する。変換部13は、変換結果文字データ23を記憶装置202に格納する。
比較部14は、記憶装置202の変換結果文字データ23を入力し、変換結果文字データ23に対して、所定の比較処理を行い、その結果である比較結果データ24を出力する。比較部14は、比較結果データ24を記憶装置202に格納する。比較部14は、後述の判定処理を行う。この判定処理は、改ざん等の可能性を判定する処理を含む。
出力部15は、記憶装置202の比較結果データ24を入力し、所定の出力処理として、比較結果データ24を含む出力データ25を構成し、出力データ25を記憶装置202に保存する。また、出力部15は、ユーザインタフェース部16及び表示装置204を用いて、出力データ25に対応したOCR処理の結果画面をユーザへ表示する。また、出力部15は、出力データ25に基づいて、OCR処理の結果を、印刷装置205により印刷出力させることもできる。
ユーザインタフェース部16は、文字認識システム及びOCRの作業に関するユーザインタフェースとしての画面をユーザに提供する処理を行う。画面は、文字認識システムの設定や作業の指示入力の画面、OCR処理の結果画面、等を含む。ユーザインタフェース部16は、出力データ25に基づいて、Webページ等による画面データを構成し、画面データに基づいて表示装置204に結果画面を表示させる。
実施の形態1の文字認識システムは、多数の帳票5を順次に連続的に処理することも可能である。その場合、OCR装置1は、セットされた複数の帳票5を順に読み込んでスキャンし、それぞれの帳票5の画像データ21を得る。OCR装置1は、スキャン済みの帳票5をスタッカへ排出して蓄積する。PC2は、複数の各々の帳票5の画像データについて順次にOCR処理を行い、帳票5毎に比較結果データ24等を得る。
PC2は、ある帳票5の処理の結果、その帳票5の記載内容が正常であると判定した場合、例えば二重エントリの2つの金額が一致している場合、その帳票5に関してはアラートを出力せず、その帳票5に関する出力データ25を保存する。その場合、PC2は、複数の帳票5の連続的な処理を停止せずに継続する。
ユーザは、正常と判定された帳票5については、そのまま、その帳票5の認識結果文字データ22等のデータを正しいものとして確定してもよい。また、ユーザは、後で、OCR装置1のスタッカに蓄積されている帳票5を取り出して内容を確認することもできる。
PC2は、ある帳票5の処理の結果、帳票5の記載内容が異常であると判定した場合、例えば二重エントリの2つの金額が不一致である場合、その帳票5に関して、即時にアラートを含む結果画面を出力する。その場合、PC2は、複数の帳票5の連続的な処理を一時停止させる。ユーザは、アラートの発生時に、PC2の結果画面で、アラートの内容や認識結果文字データ22等を見て、その帳票5について、確認や修正等の対処の作業を行う。また、ユーザは、OCR装置1のスタッカに蓄積されているその帳票5を取り出して確認することもできる。ユーザは、その帳票5に関する対処の作業を済ませると、画面での指示入力により、複数の帳票5の連続的な処理を再開させる。
実施の形態1の変形例として、OCR装置1は、PC2からの命令に従い、正常と判定された帳票5を、正常用の第1のスタッカへ振り分けて排出して蓄積し、異常と判定された帳票5を、異常用の第2のスタッカへ振り分けて排出して蓄積するようにしてもよい。
実施の形態1の変形例として、PC2は、複数の帳票5の連続的な処理において、ある帳票5を異常と判定した場合に、即時にアラートを含む結果画面を出力するのではなく、そのアラートを含む出力データ25を記憶装置202に保存してもよい。ユーザは、後で、PC2を操作し、記憶装置202からそのアラートを含む出力データ25を読み出して画面に表示する。ユーザは、アラートが出力された1枚以上の帳票5について、確認等の作業をまとめて行うことができる。
[帳票の例]
図2の(a)は、帳票の第1の例として、日本の請求書の例を示し、特に、帳票のうちの、金額の記入欄51及び複記欄52を示す。この記入欄51及び複記欄52は、金額の二重エントリのために設けられている。記入欄51は、「項目」及び「合計」の各行において、金額が算用数字で記入されている。複記欄52は、「項目」及び「合計」の各行において、金額が漢数字で記入されている。複記欄52の金額は、記入欄51の金額と同じ金額が、異なる文字の種類で記入されている。数字欄61は、記入欄51のうちの「合計」の行の欄に相当する。数字欄61には、金額の合計が算用数字で記入されている。大字欄62は、複記欄52のうちの「合計」の行の欄に相当する。大字欄62は、金額の合計が漢数字で記入されている。
なお、複記欄52が無い形式の帳票の場合もある。その場合、二重エントリの仕方としては、例えば記入欄51に対して上下左右等のいずれかの近い位置に、金額が漢数字で記入される。
数字欄61は、例として、金額が「\1,265-」として記入されている。この金額は、詳しくは、「0」〜「9」等の算用数字と、「,」(カンマ)、「\」(円記号)、「-」(ハイフン)等の記号文字とが使用されている。「,」は桁を示すために使用されている。「\」等の文字は、金額の先頭を示すために使用されている。以下、この記号文字を先頭記号ともいう。「-」等の文字は、金額の末尾を示すために使用されている。以下、この記号文字を末尾記号ともいう。なお、先頭記号や末尾記号が使用されない場合もある。
大字欄62は、例として、金額が「金壱千弐百陸拾伍円」として記入されている。「\1,265-」と「金壱千弐百陸拾伍円」は、同じ金額である1265円を示す。この金額は、詳しくは、「壱」,「弐」,……,「玖」等の漢数字、「千」等の桁を表す漢字、「金」等の先頭記号、「円」等の末尾記号が使用されている。「円」は通貨記号でもある。
上記例のように、金額の明確化や改ざん等の防止のために、漢数字と算用数字とを用いた二重エントリが行われ、先頭記号や末尾記号が使用されている。「壱」等の「大字」は、改ざん等の防止のため、「一」等の単純な漢数字や、「1」等の単純な算用数字の代わりに使用される。先頭記号や末尾記号は、他にも、帳票や業務に応じて、「也」や「※」等、特定の記号文字が使用される。
図2の(b)は、帳票5の第2の例として、中国の請求書の例を示し、特に、帳票のうちの、金額の記入欄71及び複記欄72を示す。この記入欄71及び複記欄72は、同様に、金額の二重エントリのために設けられている。記入欄71は、金額が算用数字で記入されている。複記欄72は、金額が漢数字で記入されている。複記欄72の金額は、記入欄71の金額と同じ金額が、異なる文字の種類で記入されている。記入欄71のうち、小写欄81には、金額の合計が算用数字で記入されている。複記欄72のうち、大写欄82には、金額の合計が漢数字で記入されている。なお、中国語の数詞の表現として、「小写」、「大写」がある。「大写」は、日本語の「大字」に相当する。
「元」は、金額の末尾記号であり、通貨記号でもある。「整」は、補助単位であり、算用数字の「.」(ピリオド)以下の数字が「00」である場合、「整」が使用される。他の補助単位として、「角」や「分」がある。
小写欄81は、例として、金額が「\1265.00」として記入されている。この金額は、詳しくは、「0」〜「9」等の算用数字と、「\」、「.」等の記号とが使用されている。
大写欄82は、例として、金額が下記のように記入されている。
Figure 2016095753
「\1265.00」と上記金額は同じ金額を示す。この金額は、詳しくは、下記のような漢数字が使用されている。
Figure 2016095753
また、この金額は、詳しくは、「仟」等の桁を表す漢字、及び所定の先頭記号や末尾記号が使用されている。先頭記号としては、○と×を組合せて構成される記号や、「\」が使用されている。末尾記号としては、「整」や「.00」が使用されている。
図2の(c)の表は、使用文字として数字の例を示す。第1行は算用数字を示す。第2行及び第3行は、日本の場合の漢数字の例を示す。第4行は、中国の場合の漢数字の例を示す。例えば、「零」,「壱」〜「玖」は、それぞれ「0」,「1」〜「9」に対応する文字である。図2の(a)の日本の帳票では、「大字」として、第1行の「壱」,「弐」等を使用しているが、これに限らず、他の漢数字が使用される場合もある。PC2は、帳票で使用される文字のデータを保持している。
[処理及び作業の概要]
図3は、実施の形態1の文字認識システム及び文字認識方法における処理及び作業の概要を示す。S1等はステップを表す。以下、図3のステップS1〜S5を順に説明する。
(S1) ユーザは、PC2を操作し、ユーザインタフェース部16により提供される画面を見ながら、設定や指示入力を行う。ユーザは、帳票5のうちの二重エントリに対応する2つの対象箇所の読み取りの指定を行う。対象箇所は、所定の欄や任意の領域等のフィールドである。また、ユーザは、後述の拡張機能の利用を指定する。また、ユーザは、後述の読み取りモードとして、「誤読低減モード」または「不読低減モード」を指定する。ユーザは、上記指定の上で、OCR処理の実行指示を入力する。
なお、拡張機能とは、実施の形態1の文字認識システムが提供する高度な機能に対応する。即ち、拡張機能とは、帳票の二重エントリについて、自動的に、変換、比較、判定及び結果出力等を行う機能に対応する。
(S2) PC2は、S1の指示入力に従い、OCR処理の制御を実行する。PC2は、OCR装置1へ命令を送信する。OCR装置1は、命令に従い、図1の帳票入力部11による処理を実行し、帳票の画像データ21を得て、PC2へ転送する。PC2は、文字認識部12により、帳票の画像データ21に基づいて、その帳票の領域のうち、S1で指定されたフィールドを読み取る文字認識処理を行い、認識結果文字データ22を得る。
(S3) PC2は、ユーザによる拡張機能及び読み取りモードの指定がある場合、その指定に対応した処理を行う。PC2は、まずS3で変換処理を行う。
変換部13は、S2の認識結果文字データ22に基づいて、帳票の2つのフィールドの文字列について、一方のフィールドの文字列の文字の種類を、他方のフィールドの文字列の文字の種類に合わせるように変換し、変換結果文字データ23を得る。
(S4) PC2は、次にS4で比較処理を行う。比較部14は、変換結果文字データ23に基づいて、一方のフィールドの変換後の文字列と、他方のフィールドの非変換の文字列とを比較し、一致及び不一致を判定する。また、比較部14は、比較の際、改ざん等の可能性を判定する。比較部14は、処理の結果、比較結果データ24を得る。
(S5) PC2は、次にS5で出力処理を行う。出力部15は、比較結果データ24に基づいて、比較結果データ24を含む出力データ25を構成する。出力部15は、出力データ25を用いて、OCR処理の結果画面をユーザへ表示する。出力部15は、出力データ25を保存する。ユーザは、結果画面を見て、帳票の記載内容の判断や確認、データの修正、確定等の作業を行う。帳票毎に、S1〜S5のような処理が同様に行われる。S1の画面では複数の帳票の連続処理も指定可能である。
[読み取りモード]
実施の形態1の文字認識システムは、読み取りモードとして、「誤読低減モード」と「不読低減モード」がある。読み取りモードは、OCR処理に関する制御用のモードである。
「誤読低減モード」は、文字認識における誤読を低減させるモードである。誤読とは、帳票の画像から文字を認識して誤った文字へ変換してしまうことを指す。ユーザは、帳票の作業にあたり、誤読の低減を優先して、なるべく誤読を無くしたい場合、誤読低減モードを利用する。
実施の形態1の文字認識システムは、誤読低減モードでは、文字認識処理において、画像からどの文字へ変換すべきかが曖昧で確定しにくい場合、誤読の結果を避けるため、積極的な変換はせずに、不読の結果とする。これにより、文字認識システムは、特定のアラート等を含む結果画面を出力し、ユーザによる判断を薦める。不読とは、帳票の画像から文字を認識して1つの文字へ変換できないことを指す。ユーザは、不読の結果の文字について、自分で確認や判断を行う。これにより、誤読の文字への確定が減少する。
「不読低減モード」は、文字認識における不読を低減させるモードである。ユーザは、帳票の作業にあたり、不読の低減を優先して、なるべく不読を無くしたい場合、不読低減モードを利用する。
実施の形態1の文字認識システムは、不読低減モードでは、文字認識処理において、特有の処理を適用し、不読の結果を避けるため、積極的な推測に基づいた文字変換を行う。これにより、従来の文字認識処理の場合には不読の結果になる文字についても、不読を解消するように文字変換し、不読を解消した文字を含む結果画面を出力する。
以下、まず図4〜図16を用いて、「誤読低減モード」の場合について説明する。
[誤読低減モードの場合の処理フロー]
図4は、PC2における誤読低減モードの場合の処理フローを示す。以下、図4のステップS101〜S111の処理について、例を挙げながら説明する。
(S101) ユーザは、PC2の画面で、帳票の2つの対象箇所のフィールドの読み取り、拡張機能、及び「誤読低減モード」等を指定し、実行指示を入力する。2つのフィールドは、例えば図2の(a)の記入欄51の領域91及び複記欄52の領域92である。
(S102) OCR装置1は、帳票入力部11により、帳票の画像データ21を得る。PC2は、文字認識部12により、帳票の2つのフィールドを含む領域を読み取り、2つの文字列のデータを含む認識結果文字データ22を得る。
(S103) PC2は、S102の認識結果文字データ22における2つの文字列において、不読が無いかどうかを確認する。不読が有る場合(S103−N)は、不読が有る旨の結果とし、S111へ移る。この場合、S111では、不読が有る旨の結果画面を表示し、処理を終了する。不読が無い場合(S103−Y)は、S104へ移る。
(S104,S105) S104で、PC2は、画像データ21及び認識結果文字データ22に基づいて、2つの文字列について、位置ずれ補正処理を行う。位置ずれ補正処理は、対象箇所である記入欄51や複記欄52の領域に対して、金額等の文字列が、ずれた位置に記入または印字されている場合に対処する処理である。
PC2は、帳票の領域の指定のフィールド内に、対象の文字列が有る場合、S104の処理の結果を「空白無し」とする。PC2は、指定のフィールド内に、対象の文字列が無い場合、対象のフィールドの周りを探索する。PC2は、探索の結果、文字列が見つかった場合、S104の処理の結果を「空白無し」とし、その文字列を、認識結果文字データ22に含め、以降の処理で対象とする。PC2は、探索の結果、文字列が見つからなかった場合、当該フィールド内は空白になっているため、S104の結果を「空白有り」とする。
PC2は、S104の処理の結果が「空白有り」の場合(S105−N)、「空白有り」の旨の結果とし、S111へ移る。この場合、S111では、「空白有り」の旨の結果画面を表示し、処理を終了する。「空白無し」の場合(S105−Y)は、S106へ移る。
(S106,S107) S106で、PC2は、2つの対象箇所のフィールドの文字列について、桁数比較処理を行う。PC2は、この処理では、2つの文字列について、文字の種類に応じて、それぞれの桁数を判定し、両者の桁数を比較し、桁数の一致/不一致を判定する。
S107で、PC2は、S106の処理の結果、桁数が不一致の場合(S107−N)、桁数が不一致の旨の結果とし、S111へ移る。この場合、S111では、桁数が不一致の旨の結果画面を表示し、処理を終了する。桁数が一致の場合(S107−Y)は、S108へ移る。
(S108) PC2は、変換部13により、2つの対象箇所のフィールドの文字列について、文字の種類に関する変換処理を行う。なお、文字の種類を「文字種」ともいう。本例では、図2の(a)のように、数字欄61の算用数字による文字列と、大字欄62の漢数字による文字列とがある。変換部13は、2つの文字列の文字種が異なるので、文字種の変換処理を行う。
文字種の変換処理は、詳しくは、以下の3つの方式が挙げられる。それらを、説明上、第1の変換、第2の変換、第3の変換と称する。第1の変換とは、漢数字を算用数字へ合わせるように漢数字の文字列を変換することである。第2の変換とは、算用数字を漢数字へ合わせるように算用数字の文字列を変換することである。第3の変換とは、第1の変換と第2の変換との両方を行うことである。ユーザは、PC2の画面で、第1の変換等のいずれを利用するかを指定可能である。
(S109) PC2は、比較部14により、変換結果文字データ23における、同じ文字種となった2つの文字列について、比較処理を行い、一致/不一致等を判定する。
(S110) また、PC2は、比較部14により、変換結果文字データ23における、2つの文字列について、改ざん等の可能性を判定する処理を行う。比較部14は、S109及びS110の処理の結果を、比較結果データ24として出力する。
(S111) PC2は、出力部15により、S102〜S110の処理の結果に応じた出力データ25を構成し、保存する。出力部15は、出力データ25に基づいた結果画面をユーザに表示する。ユーザは、結果画面で、帳票のデータの内容を確認する。ユーザは、特に、二重エントリの2つの金額について、一致/不一致やアラームの内容を確認する。
[読み取り指定の画面例]
図5は、図4のS101に対応した、読み取り指定の際の画面例を示す。この画面は、2つの対象箇所に対応して、右側に示す「第1フィールド」欄と、左側に示す「第2フィールド」欄とがある。ユーザは、本画面で、例えば図2の(a)の帳票の数字欄61及び大字欄62の金額を読み取るために、2つの領域91,92や文字種を指定する。本例では、「第1フィールド」欄では、数字欄61の領域91が対象箇所として設定される。「第2フィールド」欄では、大字欄62の領域92が対象箇所として設定される。
「第1フィールド」欄及び「第2フィールド」欄において、それぞれ、項目として、「文字タイプ」、「文字種」、「文字数」、「読み取り位置(座標)」、「拡張機能」、「読み取りモード」がある。各項目は、テキスト入力の形式でもよいし、リストボックスの選択肢から選択する形式、等でもよい。
「文字タイプ」項目は、フィールドの文字列の文字タイプが指定される。文字タイプは、全角、半角、等がある。本例では、「第1フィールド」では「半角」、「第2フィールド」では「全角」が指定されている。「文字種」項目は、フィールドの文字列の文字種が指定される。文字種は、漢数字、算用数字、等がある。本例では、「第1フィールド」では「算用数字」、「第2フィールド」では「漢数字」が指定されている。「文字数」項目は、フィールドの文字列の最大文字数が指定される。本例では、「第1フィールド」では「10」、「第2フィールド」では「18」が指定されている。
「読み取り位置(座標)」項目は、読み取りの対象のフィールドの位置が座標で指定される。この項目は、例えば矩形の領域を規定する2点の座標の指定のために、「水平スタート」、「水平エンド」、「垂直スタート」、「垂直エンド」の4つの項目を含む。本例では、「第1フィールド」の場合、対象の領域91の左上の点の座標が(1000,500)であり、右下の点の座標が(1400,550)である。
図2の(a)の例で、破線枠で示す領域91,92は、読み取り指定されたフィールドの例を示す。なお、この領域91,92は、数字欄61及び大字欄62の中の一部を除いた領域とした例である。一部とは、「(大字)」,「(数字)」の記載箇所である。これに限らず、フィールドとして帳票内の任意の領域が指定可能である。図2の(b)の例のように、フィールドとして小写欄81や大写欄82と同じ領域も指定可能である。また、その場合、PC2は、フィールドの中に含まれる「(小写)」等の所定の文字を、対象外として処理してもよい。
「拡張機能」項目は、拡張機能を利用する場合に指定可能である。本例では、「第1フィールド」の「拡張機能」項目の値として「金額(変換しない)」が選択された場合を示す。この値は、第1フィールドが二重エントリの金額の記入欄であること、及びその記入欄の文字列の文字種を変換せずに、第2フィールドの文字列と比較すること、等を指定する値である。また、「第2フィールド」の「拡張機能」項目の値として「金額(変換する)」が選択された場合を示す。この値は、第2フィールドが二重エントリの金額の複記欄であること、及び複記欄の文字列の文字種を変換して、第1フィールドの文字列と比較すること、等を指定する値である。
「読み取りモード」項目は、読み取りモードとして、誤読低減モードと不読低減モードとから選択して指定可能である。本例では、「第1フィールド」及び「第2フィールド」で、誤読低減モードが指定されている。
ユーザは、上記画面で、2つのフィールドの各項目の値を指定した後、OKボタンにより設定する。PC2は、この設定情報に従い、OCR処理を行う。PC2は、「文字種」項目及び「拡張機能」項目での指定に応じて、文字種の変換及び比較等の処理を行う。上記「文字種」及び「拡張機能」項目の設定例は、第1の変換に対応した設定例である。なお、第2の変換の場合、「第1フィールド」の「拡張機能」項目で「金額(変換する)」、「第2フィールド」の「拡張機能」項目で「金額(変換しない)」と指定される。第3の変換の場合、両方の「拡張機能」項目で「金額(変換する)」と指定される。
また、「第1フィールド」及び「第2フィールド」の文字列の「文字種」項目の値が同じであり、両方の「拡張機能」項目で「金額(変換しない)」が指定された場合、PC2は、文字種を変換する必要が無いので変換せずに、両者の金額を比較する。「拡張機能」項目で何も指定されない場合、PC2は、2つの文字列の変換や比較を行わず、別々に文字認識を行う。
なお、変形例として、「文字タイプ」と「文字種」が1つの項目に統合された構成でもよい。
[文字認識の例]
図6は、図2の(a)の帳票の例、及び図4のS102に対応した、帳票の2つの対象箇所のフィールドについての文字認識の例を示す。文字認識部12は、指定されたフィールド内の文字列を読み取る。
図6の(a)は、第1フィールド及び第2フィールドのいずれの文字認識結果においても不読が無い場合を示す。右側は、第1フィールドの算用数字の文字列のデータを示す。この文字列のデータは、図2の(a)の数字欄61に記入された文字列と同じである正しい文字列「\1,265-」である。先頭記号が「\」、末尾記号が「-」である。左側は、第2フィールドの漢数字の文字列のデータを示す。この文字列のデータは、図2の(a)の大字欄62に記入された文字列と同じである正しい文字列「金壱千弐百陸拾伍円」である。先頭記号が「金」、末尾記号が「円」である。
図6の(b)は、第1フィールドの文字列の文字認識結果に不読が有る場合を示す。第1フィールドの算用数字において、文字「5」が不読となっている。図6の(c)は、第2フィールドの文字列の文字認識結果に不読が有る場合を示す。不読の箇所を記号「?」で示す。第2フィールドの漢数字において、文字「弐」が不読となっている。図6の(d)は、第1フィールド及び第2フィールドの両方の文字列の文字認識結果に不読が有る場合を示す。第2フィールドの漢数字の文字「弐」、及び第1フィールドの算用数字の文字「5」が不読となっている。
PC2は、文字認識の結果、図6の(b)〜(d)のように、2つのフィールドの一方または両方に、不読の文字が有る場合、不読が有る旨の結果とし、対応するアラートを含む結果画面をユーザに表示する。
[位置ずれ補正処理]
図7は、図4のS104に対応した、位置ずれ補正処理の例を示す。指定のフィールドに対応した画像において空白である場合、ずれた位置に文字が記入または印字されている可能性がある。そこで、PC2は、位置ずれ補正処理として、指定のフィールドの外側を探索し、文字列が見つかった場合、その文字列を文字認識の結果に含めるように補正する。
図7の(a)は、図2の(a)の帳票の例に対応し、大字欄62の領域に対して、上側にずれた位置に、701に示すように、金額の漢数字が印字されており、これにより大字欄62が空白になっている。なお、ここでは大字欄62が第2フィールドである。
図7の(b)は、図7の(a)の場合の位置ずれ補正処理として、大字欄62の領域に対して、上下左右に範囲を拡げて、文字列を探索する例である。702は、探索の範囲を示す。HXは、水平方向に拡げる幅の設定値を示す。HYは、垂直方向に拡げる幅の設定値を示す。
PC2は、702の範囲で、所定の文字記号を目標にしながら、文字列を探索する。この目標の文字記号は、前述の「金」等の先頭記号や、「円」等の末尾記号が挙げられる。上記範囲の設定値は、任意に設定可能である。PC2は、範囲を拡げても文字列が見つからない場合、「空白有り」の旨の結果とし、対応するアラートを含む結果画面をユーザに表示する。
図7の(c)は、位置ずれ補正処理等の際に用いる、特定の記号文字の表703を示す。この表703は、先頭記号、末尾記号、その他の記号について、日本や中国毎に、一覧で登録されている。なお、ここでは、末尾記号として、「円」や「元」等の通貨記号を含めている。
[桁数比較処理]
図8は、図4のS106に対応した、桁数比較処理の例を示す。
図8の(a)は、図2の(a)に対応した、第1フィールドの算用数字の文字認識結果の文字列のデータと、第2フィールドの漢数字の文字認識結果の文字列のデータとを示す。PC2は、2つの文字列において、先頭記号、末尾記号、桁漢字、カンマ等の文字記号に基づいて、それぞれの桁数を判定し、両者を比較する。PC2は、第1フィールドの文字列のうち、先頭記号「\」と末尾記号「-」との間にある、算用数字及びカンマの部分である「1,265」をみることにより、算用数字の桁数が4とわかる。また、PC2は、第2フィールドの文字列のうち、先頭記号「金」と末尾記号「円」との間にある、桁漢字等をみることにより、漢数字の桁数が4とわかる。桁漢字は、「千」,「百」,「拾」等である。本例では、2つのフィールドの文字列の桁数が一致している。
図8の(b)は、桁数比較処理に用いる表を示す。表801は、日本及び中国のそれぞれについて、桁漢字ごとの桁数を格納している。例えば桁漢字が「千」である場合、桁数が4であり、桁漢字が「拾万」である場合、桁数が8である。
図8の(c)は、中国の場合の桁数比較処理の例を示す。PC2は、第1フィールドの算用数字の文字列における最終の部分である、ピリオド後の数字を参照する。ピリオド後の数字が例えば「00」である。また、PC2は、第2フィールドの漢数字の文字列における最終の部分である、末尾記号を参照する。ここでは、末尾記号として、漢字「元」、及び「元」以後の漢字「整」がある。PC2は、図8の(b)の表802を参照する。
表802は、図8の(c)の中国の場合の桁数比較処理に用いる表を示す。この表802は、第1行の「末尾漢字」と、第2行の「ピリオド後の数字」とが関係付けられている。例えば末尾漢字「整」と、ピリオド後の数字「00」とが対応する。同様に、末尾漢字「角」と、ピリオド後の数字「10」〜「90」とが対応する。末尾漢字「分」と、ピリオド後の数字「01」〜「09」とが対応する。
PC2は、上記桁数比較処理の結果、2つの文字列の桁数が一致しない場合、桁数が不一致の旨の結果とし、対応するアラームを含む結果画面をユーザに表示する。なお、ユーザは、設定画面で、位置ずれ補正処理や桁数比較処理の実行有無を設定可能である。
[変換処理例(1)]
図9の(a)は、図4のS108の第1の変換の場合に対応した、文字種の変換処理の例を示す。変換部13は、比較対象である2つのフィールドの文字列について、図10の変換表に従い、文字種の変換処理を行う。第1の変換の場合、第1フィールドの算用数字は、変換の非対象であり、第2フィールドの漢数字は、変換の対象である。変換部13は、第2フィールドの文字列の文字種である漢数字を、第1フィールドの文字列の文字種である算用数字に合わせるように、第2フィールドの文字列を変換する。
図10は、文字種の変換処理に用いる変換表の構成例を示す。
図10の(a)は、日本の場合の変換表151の一部を示す。この変換表151は、第1列の「漢数字」、第2列の「算用数字」、及び第3列の「桁数」の関係付け情報が設定されている。この変換表151に従い、例えば、「零円」は「0」に、「壱円」は「1」に、「壱拾」は「10」に変換される。
図10の(b)は、同様に、中国の場合の変換表152の一部を示す。この変換表152は、更に、「元」以後の「整」等の文字、ピリオド以後の数字、及び桁数の関係付け情報が設定されている。この変換表152に従い、例えば、以下のように変換される。
Figure 2016095753
図9の(a)の第2フィールドの文字列は、図10の(a)の変換表151に従い、「壱千」が「1,000」に、「弐百」が「200」に、「陸拾」が「60」に、「伍円」が「5」に変換される。変換部13は、各文字の変換後の数字を加算する。即ち、変換後の文字列の算用数字は、1,000+200+60+5=1,265となる。
なお、図10の変換表は、第1の変換、第2の変換のいずれでも使用できる。第1の変換の場合、変換表において、第1列が変換前の文字、第2列が変換後の文字として参照される。第2の変換の場合、変換表において、第2列が変換前の文字、第1列が変換後の文字として参照される。
[変換処理例(2)]
図9の(b)は、図4のS108の第2の変換の場合に対応した、文字種の変換処理の例を示す。変換部13は、比較対象の2つのフィールドの文字列について、図10の変換表に従い、文字種の変換処理を行う。第2の変換の場合、第1フィールドの算用数字は、変換の対象であり、第2フィールドの漢数字は、変換の非対象である。変換部13は、第1フィールドの文字列の文字種である算用数字を、第2フィールドの文字列の文字種である漢数字に合わせるように、第1フィールドの文字列を変換する。
変換部13は、第2の変換の場合、図10の(a)の変換表151を用いて、算用数字の個々の数字ごとに、漢数字へ変換する。図9の(b)の第1フィールドの文字列は、図10の(a)の変換表151に従い、「1」が「壱千」に、「2」が「弐百」に、「6」が「陸拾」に、「5」が「伍」に変換される。変換部13は、各数字の変換後の漢字ごとに、第2フィールドの文字列のうちの対応する位置の非変換の漢字と比較し、一致/不一致を判定する。各変換後の文字が全て一致する場合、総合的な比較結果として一致となり、変換後の文字が1つでも不一致の場合、総合的な比較結果として不一致となる。変換部13は、各変換後の文字を接続して1つの文字列にする。変換後の文字列である漢数字は、「壱千」+「弐百」+「陸拾」+「伍」=「壱千弐百陸拾伍」となる。
[変換及び比較処理(1)]
図11は、図4のS108の第1の変換の場合に対応した、変換処理及び比較処理を含むフローを示す。変換部13は、第2フィールドの文字列の漢数字を算用数字に変換する。比較部14は、第2フィールドの変換後の文字列である算用数字と、第1フィールドの非変換の文字列である算用数字とを全体で比較し、一致/不一致を判定する。以下、図11のステップS201〜S209の処理について説明する。
(S201) 変換部13は、第2フィールドの文字列の開始文字から順に終了文字まで調べて、「数漢字」及び「桁漢字」の文字を探す。図9の(a)の例では、左端から順に文字が検出され、開始文字が先頭記号「金」であり、終了文字が末尾記号「円」である。また、「数漢字」とは、「壱」等であり、「桁漢字」とは、「千」等である。
(S202) 変換部13は、S201で得た数漢字及び桁漢字の文字について、図10の(a)の変換表151を用いて、算用数字へ変換する。なお、中国の場合、図10の(b)の変換表152を用いて同様に処理が行われる。
(S203) 変換部13は、S202の変換結果の算用数字を加算する。
(S204) 変換部13は、第2フィールドの文字列のうち、対象の文字の桁数が0になるまで、S201〜S203の処理を繰り返す。桁数が0の場合(S205−Y)は、S205へ移る。桁数が0とは、末尾記号「円」等に到達した場合である。
(S205) 変換部13は、S204までの第2フィールドの変換結果の数字と、第1フィールドの算用数字とを全体で比較して、一致/不一致等を判定する比較処理を行い、その結果を比較結果データ24として保存する。
(S206) 変換部13は、対象が日本の帳票である場合(S206−N)、処理を終了し、対象が中国の帳票である場合(S206−Y)、S207へ移る。
(S207,S208) 変換部13は、中国の帳票における第2フィールドの文字列において、「元」以降の文字を探し、同様に、算用数字への変換や加算を行う。変換部13は、数漢字や、「角」等の桁漢字について、図10の(b)の変換表152を用いて、算用数字へ変換し、変換結果の算用数字を加算する。変換部13は、文字列の最終文字になるまで(S208−N)、同様に処理を繰り返し、最終文字になると(S208−Y)、S209へ移る。
(S209) 変換部13は、S207,S208の処理の結果である「元」以降の文字列の変換結果の算用数字について、第1フィールドの文字列のピリオド以降の算用数字との比較処理を行い、その結果を比較結果データ24へ反映して保存する。
[変換及び比較処理(2)]
図12は、図4のS108の第2の変換の場合に対応した、変換処理及び比較処理を含むフローを示す。変換部13は、第1フィールドの文字列の算用数字を漢数字に変換する。比較部14は、第1フィールドの変換後の文字列である漢数字と、第2フィールドの非変換の文字列である漢数字との比較処理として、各桁の文字毎に比較して、一致/不一致を判定する。以下、図12のステップS301〜S311の処理について説明する。
(S301) 変換部13は、第1フィールドの文字列の開始文字から順に終了文字までを調べ、個々の文字である[数字]に着目する。変換部13は、その着目する[数字]毎に、([桁数]−n)を計算する。[桁数]は、第1フィールドの文字列の桁数を示す。変換部13は、前述の桁数比較処理による[桁数]を得る。nは、繰り返し処理の回数を示し、最初はn=0である。図9の(b)の例では、変換部13は、左端から順に、まず先頭記号「\」の次の数字「1」を得る。文字列「1265」の[桁数]は4である。n=0である。よって、([桁数]−n)=(4−0)=4である。
(S302) 変換部13は、S301の[数字]、及び([桁数]−n)の計算値に基づいて、図10の(a)の変換表151を用いて、数字を漢数字へ変換する。変換部13は、([桁数]−n)の計算値により、変換表151の「桁数」列の値を参照する。例えば計算値=4の場合、「桁数」列の値が4である第4行が該当する。この第4行の情報において、[数字]=「1」から、対応する算用数字が「1000」、漢数字が「壱千」とわかる。よって、変換部13は、着目の[数字]=「1」について、漢数字「壱千」へ変換する。
(S303〜S305) S303で、変換部13は、S302の第1フィールドの変換結果の漢数字である部分文字と、第2フィールドの漢数字における対応する位置の部分文字とを比較する。変換部13は、比較の結果、一致する場合(S304−Y)、S305へ移り、一致しない場合(S304−N)、文字列単位での比較結果を不一致と判定し、S311へ移る。S305で、変換部13は、n回繰り返しのためにnを1増加し、その結果、着目の[数字]について桁数が0になる場合(S305−Y)、S306へ移り、桁数が0ではない場合(S305−Y)、S301へ戻って同様に繰り返す。
なお、次のn=1の場合、S301では、([桁数]−n)=(4−1)=3である。この値=3により、変換表151の「桁数」列の値が3である第3行が参照される。第3行において、[数字]=「2」から、対応する算用数字が「200」、漢数字が「弐百」とわかる。
(S306) 変換部13は、対象が中国の場合(S306−Y)、S307〜S310の処理を行い、対象が日本の場合(S306−N)、S311へ移る。
(S307) 変換部13は、中国の帳票の文字列における、ピリオド以降の数字を探す。変換部13は、ピリオド以降の数字について、同様に、図10の(b)の変換表152に従い、漢数字へ変換する。
(S308〜S310) 変換部13は、S307の変換結果の漢数字の部分文字と、第2フィールドの漢数字の部分文字とを比較し、一致/不一致を判定する。変換部13は、比較の結果、一致する場合(S309−Y)、S310へ移り、一致しない場合(S309−N)、文字列単位での比較結果を不一致と判定し、S311へ移る。S310では、文字列の最終文字である場合(S310−Y)、S311へ移り、最終文字でない場合(S310−N)、S307へ戻り、同様に繰り返す。
(S311) 変換部13は、2つの文字列の一致または不一致の結果に応じた比較結果データ24を保存し、処理を終了する。
[比較処理例]
図13は、図4のS109に対応した、文字列の比較処理の例を示す。
図13の(a)は、図11に対応した第1の変換の場合の比較処理と、図12に対応した第2の変換の場合の比較処理との概要を示す。なお、説明上、第1の変換に対応して、第2フィールドの変換後の文字列の算用数字と、第1フィールドの非変換の文字列の算用数字との比較を、第1の比較と称する。第2の変換に対応して、第1フィールドの変換後の文字列の漢数字と、第2フィールドの非変換の文字列の漢数字との比較を、第2の比較と称する。
図13の(b)は、第1の比較の例として、不一致の場合を示す。第2フィールドの変換後の文字列の算用数字と、第1フィールドの非変換の文字列の算用数字とが不一致である。第2フィールドの変換後の文字列の算用数字は、正しい数字「1,265」である。第1フィールドの非変換の文字列の算用数字は、正しくない数字「7,265」となっている。即ち、「1」と「7」の部分で不一致である。正しくない数字になっている原因としては、記入誤り、改ざん、文字認識での誤読、等が挙げられる。記入誤りの場合、記入者は、「1」を誤って「7」と記入している。改ざんの場合、改ざん者は、記入済みの「1」を意図的に「7」に読めるように加工している。誤読の場合、PC2は、文字認識処理の際、画像から「1」を「7」として推定して文字変換している。
図13の(c)は、第2の比較の例として、不一致の例を示す。第1フィールドの変換後の文字列の漢数字と、第2フィールドの非変換の文字列の漢数字とが不一致である。第1フィールドの変換後の文字列の漢数字は、正しい「壱千弐百陸拾伍」である。第2フィールドの非変換の文字列の漢数字は、正しくない「七千弐百陸拾伍」となっている。即ち、「壱千」と「七千」の部分で不一致である。正しくない漢数字になっている原因としては、同様に、記入誤り、改ざん、文字認識での誤読、等が挙げられる。
なお、第3の変換が指定されている場合、第1の変換及び第1の比較と、第2の変換及び第2の比較との両方が行われる。PC2は、両方の結果をユーザへ出力する。ユーザは、画面で両方の結果を見て、判断や確認ができる。この場合、二重のチェックになるため、精度を更に高めることができる。
[改ざん可能性判定処理]
図14は、図4のS110に対応した、比較部14による改ざん可能性判定処理の例を示す。
図14の(a)は、第1の変換及び第1の比較の場合の改ざん可能性判定処理の例を示す。比較部14は、図13のような2つの文字列の比較処理の結果、不一致である場合、改ざん等の可能性を判定する。比較部14は、図14の(b)の改ざん可能性判定用の判定表140を参照して、改ざん等の可能性を判定する。
本例では、第2フィールドの文字列は正しい漢数字であり、第1の変換の結果の文字列は正しい算用数字「1,265」である。また、第1フィールドの文字列の算用数字については、文字認識結果の文字列において、正しくない算用数字「7,265」になっている。よって、両者の文字列についての第1の比較の結果が不一致となっている。
図14の(b)は、改ざん可能性判定用の判定表140を示す。この判定表140は、列として、「漢数字(日本)」、「漢数字(中国)」、「算用数字」、「改ざん候補算用数字」がある。この表は、改ざん等の可能性が有り得る組合せ、または可能性が高い組合せが、各行に設定されている。「漢数字(日本)」列は、日本の場合の漢数字の文字が一覧で格納されている。同様に、「漢数字(中国)」列は、中国の場合の漢数字の文字が一覧で格納されている。「算用数字」列は、「漢数字」の値に対応付けられる算用数字の文字が格納されている。「改ざん候補算用数字」列は、当該行の漢数字と算用数字との組に関して、改ざん等の候補として考えられる算用数字が格納されている。
例えば第1行は、「壱」と「1」の組に関して、改ざん候補算用数字として、「4」,「7」,「9」が設定されている。これは、例えば改ざん者が「1」を他の数字へ改ざんする場合に、「4」,「7」,「9」へ変える可能性が高いことを考慮して設定されている。
図14の(c)は、実際の改ざんの例を示す。左側から、「1」を「4」へ変える例、「1」を「7」へ変える例、「2」を「3」へ変える例を示す。このように、線の追加あるいは消去により、数字が改ざんされる可能性がある。また、意図的な改ざん以外にも、ごみの付着等を含め、誤って線が追加あるいは消去されてしまう場合も有り得る。また、判読しにくく曖昧な形の文字が記入されている場合、文字認識結果で誤読や不読になる可能性が高くなる。
比較部14は、図14の(a)の第1の比較の結果が不一致である場合、不一致の部分である「1」及び「7」と、「1」の変換前の文字である「壱」とを把握する。そして、比較部14は、「壱」と「1」と「7」の組合せに基づいて、判定表140を参照し、その組合せに該当する行がある場合は検出する。本例では、第1行の「改ざん候補算用数字」の値の中に「7」があるので、第1行がその組合せに該当する。よって、比較部14は、図14の(a)の比較結果について、改ざん可能性が高いと判定する。逆に、比較部14は、比較結果について、判定表140の中に該当する行が無い場合、改ざん可能性が低いと判定する。
[結果画面の出力例]
図15及び図16は、図4のS111に対応した、出力部15による結果画面の出力例を示す。図2の(a)の帳票の例を用いて説明する。出力部15は、図4の不読が有る等の判定結果ごとに、異なる表示内容の結果画面を出力する。
図15の(a)は、2つのフィールドの文字列の比較結果が一致の場合の出力例を示す。第1の変換及び第1の比較の結果、両者の文字列は一致している。出力部15は、画面に、2つのフィールドの文字認識結果の文字列をそのまま表示すると共に、比較結果情報として「金額が一致しています。」といったメッセージを表示する。また、出力部15は、画面に、第2フィールドの文字種の変換後の文字列を表示してもよい。画面に例えば「変換後の金額:1,265」といった情報が表示される。
上記一致の結果の場合、出力部15は、正常と判定し、アラートを出力しない。また、出力部15は、画面で、フィールド及びその金額の文字列等の情報を、白黒や青等、目立たない色で表示する。また、この場合、出力部15は、画面を表示させずに、対応する出力データ25を保存するのみとしてもよい。
また、出力部15は、画面内に、OKボタンや修正ボタンを設ける。ユーザは、画面で、ある帳票に関するOCR処理の結果を見て、確認した場合は、OKボタンにより、終了ができる。また、ユーザは、画面で結果を見て、データの修正等の作業を行う場合、修正ボタンにより、その帳票のデータに関する修正用の画面へ遷移できる。
図15の(b)は、2つのフィールドの文字列の一方または両方に、文字認識結果として不読がある場合の出力例を示す。本例では、第1フィールドの算用数字に不読がある。出力部15は、画面に、文字認識結果の文字列を表示する際、不読の箇所を例えば記号「?」で表示する。
この結果の場合、出力部15は、第1のアラートを出力する。第1のアラートは、軽いレベルのアラートであり、ユーザへの注意喚起に相当する。出力部15は、第1のアラートとして、画面に、「不読の箇所「?」があります。」といったメッセージを表示する。また、出力部15は、第1のアラートとして、画面で、不読を含むフィールド、または2つのフィールドを、黄色等で表示する。これにより、図15の(a)のようなアラート無しの場合よりも目立つようにする。
図15の(c)は、2つのフィールドの文字列の一方または両方において空白有りの場合の出力例を示す。本例では、第2フィールドが空白である。出力部15は、文字認識及び位置ずれ補正処理の結果、空白有りの場合、この画面で、フィールドのデータを空白として表示する。
この結果の場合、出力部15は、例えば第1のアラートを出力する。出力部15は、画面に、「空白があります。」といったメッセージを表示する。また、出力部15は、画面で、空白を含むフィールド、または2つのフィールドを、黄色等で表示する。
図15の(d)は、2つのフィールドの文字列において桁数が不一致の場合の出力例を示す。本例では、第1フィールドの算用数字が「265」であり、その桁数が3である。第2フィールドの漢数字は桁数が4である。よって、両者の桁数が不一致になっている。
この結果の場合、出力部15は、例えば第1のアラートを出力する。出力部15は、画面に、「桁数が一致しません。」といったメッセージを表示する。出力部15は、画面で、2つのフィールドを、黄色等で表示する。出力部15は、画面に、変換後の文字列の金額や、各文字列の桁数を表示してもよい。
図16の(a)は、2つのフィールドの文字列の比較結果が不一致であり、かつ、改ざん可能性判定処理の結果、改ざん可能性が低いと判定された場合の出力例を示す。本例では、第1フィールドの文字列は正しい算用数字「1,265」であり、第2フィールドの文字列は誤った漢数字「壱千陸百陸拾伍」である。また、変換後の金額が「1,665」であり、両者の金額が不一致である。不一致の部分の組合せは、「陸」,「6」,「2」である。図14の改ざん可能性判定処理で、判定表140には、「陸」,「6」,「2」の組合せに該当する行が無いので、改ざん可能性が低いと判定される。
この結果の場合、出力部15は、例えば第1のアラートを出力する。出力部15は、画面に、比較結果情報として「金額が一致していません。」といったメッセージ、及び変換後の文字列の金額、等を表示する。出力部15は、画面で、2つのフィールドを、黄色等で表示する。また、出力部15は、フィールドの文字列のうち、不一致の箇所の文字を、わかりやすいように、異なる色やマーク等で目立つように表示してもよい。
図16の(b)は、2つのフィールドの文字列の比較結果が不一致であり、かつ、改ざん可能性判定処理の結果、改ざん可能性が高いと判定された場合の出力例を示す。本例では、第1フィールドの文字列は誤った算用数字「7,265」であり、第2フィールドの文字列は正しい漢数字「壱千弐百陸拾伍」である。また、変換後の金額が「1,265」であり、両者の金額が不一致である。不一致の部分の組合せは、「壱」,「1」,「7」である。図14の改ざん可能性判定処理で、判定表140には、「壱」,「1」,「7」の組合せに該当する行が有るので、改ざん可能性が高いと判定される。
この結果の場合、出力部15は、第2のアラートを出力する。第2のアラートは、第1のアラートよりも強いレベルのアラートであり、ユーザへの警告に相当する。出力部15は、第2のアラートとして、画面で、2つのフィールドを、赤色等、目立つ色で表示する。また、出力部15は、画面に、比較結果情報として「金額が一致していません。」、「改ざんの可能性があります。」等のメッセージ、及び変換後の文字列の金額等を表示する。ユーザは、第2のアラートから、改ざん可能性を考慮して確認や判断ができる。
また、出力部15は、画面に、2つのフィールドの文字列の金額の金額差を表示してもよい。例えば、比較部14は、金額差を計算する。第1フィールドの金額が「7265」、第2フィールドの金額が「1265」である場合、金額差は、7265−1265=6000である。出力部15は、画面に、「金額差=6000」のような情報を表示する。
更に、比較部14は、上記金額差を、閾値と比較し、金額差が閾値以上に大きい場合に、上記第2のアラートを出力するようにしてもよいし、あるいは、第2のアラートよりも更に強いレベルのアラートを出力するようにしてもよい。ユーザは、金額差を考慮して確認や判断ができる。
上記のように、PC2は、比較結果が不一致である原因を推定し、比較結果や原因の推定に応じたアラートを含む結果画面をユーザに出力し、ユーザの判断を支援する。ユーザは、結果画面で、日本や中国の帳票における二重エントリの2つの金額等の文字列について、文字認識結果の文字列データ、比較や判定の結果、及びアラートの内容を見て確認することができる。よって、ユーザは、確認や判断がしやすく、効率的に作業ができる。なお、実施の形態1では、アラートについて、第1及び第2のアラートのように大別して2種類としたが、これに限らず可能である。
[不読低減モードの場合]
次に、図17〜図21を用いて、「不読低減モード」の場合について説明する。不読低減モードの場合の処理は、誤読低減モードの場合の処理に対して、主に異なる点として、以下が挙げられる。
PC2は、2つのフィールドの文字列についての第1の文字認識の結果において、不読が有る場合、不読が有る場合に対応した特有の処理を行う。この特有の処理は、第2の文字認識の処理、改ざん可能性判定を含む比較処理を含む。なお、説明上、文字認識部12による文字認識処理を、二段階の処理に分け、第1の文字認識、第2の文字認識とする。第1の文字認識の処理は、従来の処理と同様であり、一旦、不読の有無を含む結果を出す。第2の文字認識の処理は、新たな処理であり、第1の文字認識の結果の不読の文字について、不読を解消するための文字変換を行う。
[不読低減モードの場合の処理フロー]
図17は、PC2における不読低減モードの場合の処理フローを示す。以下、図17のステップS401〜S409の処理について、例を挙げながら説明する。
(S401) ユーザは、PC2の画面で、帳票の二重エントリの2つの対象箇所のフィールドの読み取り、拡張機能、及び「不読低減モード」等を指定し、実行指示を入力する。
(S402〜S404) S402〜S404の処理は、図4のS102,S104,S106の処理と基本的に同様である。S402では、文字認識部12による第1の文字認識の処理により、認識結果文字データ22を得る。この際、文字認識結果として「不読」が発生する場合がある。「不読低減モード」では、PC2は、文字認識結果に「不読」の文字が有る場合でも、終了せずに、次のS403以降の処理を行う。S403では位置ずれ補正処理が行われ、S404では桁数比較処理が行われる。
(S405) S405で、PC2は、不読の有無を確認する。不読が無い場合(S405−Y)は、S406へ移り、不読が有る場合(S405−N)は、S407へ移る。
(S406) 比較部14は、一方のフィールドの文字列と、他方のフィールドの文字列とについて、不読が無い場合に対応した変換及び比較処理を行う。この変換及び比較処理は、図4のS108やS109と同様である。
(S407) 比較部14は、一方のフィールドの文字列と、他方のフィールドの文字列とについて、不読が有る場合に対応した変換及び比較処理を行う。変換部13は、変換処理では、S402の文字認識結果の文字列における「不読」以外の文字について、図10の変換表に従い、文字種を変換する。
(S408) S406またはS407の後、比較部14は、変換結果文字データ23における2つの文字列について、改ざん等の可能性を判定する処理を行う。比較部14は、処理の結果を比較結果データ24として出力する。
(S409) 出力部15は、比較結果データ24に基づいて、出力データ25を構成し、出力データ25を保存し、結果画面をユーザに表示する。
[変換及び比較処理(3)]
図18は、図17のS407、及び第1の変換の場合に対応した、変換処理及び比較処理を含むフローを示す。以下、図18のステップS501〜S508の処理を説明する。
(S501) 変換部13は、変換対象の第2フィールドの文字列の開始文字から順に調べ、数漢字及び桁漢字の文字を探す。
(S502) 対象の文字列について、文字認識結果で不読が無い場合(S502−Y)は、S503へ移り、不読が有る場合(S502−N)は、S504へ移る。
(S503) 変換部13は、不読が無い場合に対応した文字種の変換処理を図4のS108と同様に行う。第1の変換の場合、図10の変換表を用いて、漢数字が算用数字へ変換される。
(S504,S505) 変換部13は、不読が有る場合に対応した処理を行う。この処理については後述する。この処理の結果、不読の文字について、第2の文字認識による文字変換が可能であり当該文字変換がされた場合(S505−Y)、S506へ移り、不可能であり当該文字変換がされていない場合(S505−N)、処理を終了する。
(S506) S503またはS505の後、変換部13は、変換結果の算用数字を加算する。
(S507) 変換部13は、第2フィールドの文字列のうち、対象の文字が、最終文字になるまで、S501〜S506の処理を繰り返す。対象の文字が最終文字になると(S507−Y)、S508へ移る。なお、対象が中国の帳票の場合、「元」以降の文字について、最終文字になるまで、同様に処理が行われる。
(S508) 変換部13は、S507までの第2フィールドの変換結果の数字と、第1フィールドの算用数字とを比較し、一致/不一致を判定し、その結果を比較結果データ24として保存する。
[変換及び比較処理(4)]
図19は、図17のS407、及び第2の変換の場合に対応した、変換処理及び比較処理を含むフローを示す。以下、図19のステップS601〜S609の処理を説明する。
(S601) 変換部13は、図12のS301と同様に、変換対象の第1フィールドの文字列の開始文字から順に調べ、着目の[数字]毎に、([桁数]−n)を計算する。
(S602) 対象の文字列について、文字認識結果で不読が無い場合(S602−Y)は、S603へ移り、不読が有る場合(S602−N)は、S604へ移る。
(S603) 変換部13は、不読が無い場合に対応した文字種の変換処理を、図4のS108と同様に行う。第2の変換の場合、図10の変換表を用いて、算用数字が漢数字へ変換される。
(S604,S605) 変換部13は、不読が有る場合に対応した処理を行う。この処理の結果、不読の文字について、不読を解消する文字変換が可能であり当該文字変換がされた場合(S605−Y)、S606へ移り、不可能であり当該文字変換がされていない場合(S605−N)、S609へ移る。なお、変換部13は、文字変換が不可能の場合、S608へ移り、不読の文字以降の文字について同様に処理を繰り返してもよい。
(S606〜S608) S603またはS605の後、変換部13は、第1フィールドの変換結果の漢数字の部分文字と、第2フィールドの漢数字の対応する位置の部分文字とを比較する。比較の結果、一致する場合(S607−Y)、S608へ移り、一致しない場合(S607−N)、文字列単位での比較結果を不一致と判定し、S609へ移る。S608で、変換部13は、n回繰り返しのためにnを1増加し、その結果、着目の数字が最終文字になる場合(S608−Y)はS609へ移り、最終文字でない場合(S608−Y)はS601へ戻って同様に繰り返す。なお、対象が中国の帳票の場合、ピリオド以降の数字について、最終文字になるまで、同様に処理が行われる。
(S609) 変換部13は、文字列の一致/不一致の結果に応じた比較結果データ24を保存し、処理を終了する。
[不読が有る場合の処理]
図20及び図21を用いて、図17のS407に対応した、不読が有る場合の処理について説明する。PC2は、文字認識部12及び比較部14等を用いて、この処理を行う。この処理は、第1の文字認識において不読が有る場合に、第1の文字認識の候補の文字を比較対象として含めて、改ざん等の可能性を判定しつつ、不読の文字をできるだけ文字変換して不読を解消する処理である。
図20は、不読が有る場合の処理として、第1の変換の場合の例を示す。第1フィールドに記入されている算用数字は「1,265」である。第2フィールドに記入されている漢数字は「金壱千弐百陸拾伍円」である。第1フィールドの算用数字に対する第1の文字認識の結果は不読が有る。文字列「1,265」のうち文字「1」が不読の例である。文字列「1,265」のうち他の文字については、誤読及び不読が無い。第2フィールドの漢数字に対する第1の文字認識の結果は、誤読及び不読が無い。第1の変換により、第2フィールドの漢数字は算用数字へ変換される。第1の変換の後の文字列の算用数字は「1,265」である。
PC2は、算用数字に不読が有る場合、その不読の文字について、所定の組合せの値を比較し、不読の解消のために第2の文字認識による文字変換を試みる。所定の組合せは、(1)第2フィールドの漢数字の第1の文字認識の結果の文字と、(2)第1フィールドの算用数字の第1の文字認識における候補文字と、を含む。PC2は、算用数字に不読が有る場合、図21の不読が有る場合の処理表210、及び図14の改ざん可能性判定用の判定表140を参照し、上記組合せの値の比較に基づいて、第2の文字認識を行う。
第1の文字認識における候補文字の例として、第1の候補文字がX、第2の候補文字がY、等とする。第1の文字認識の処理では、これらの候補文字のいずれかに確定して文字変換することができず、結果が不読となっている。
図21は、不読が有る場合の処理用の表の構成例を示す。図21の(a)は、不読が有る場合の処理表210として、日本の帳票の場合及び第1の変換の場合に対応した一部分を示す。この処理表210は、図20の例、即ち記入された算用数字「1」に不読が有る場合に対応した部分を示す。
処理表210において、列として、「記入算用数字」、「認識結果漢数字」、「文字認識の第1候補」、「文字認識の第2候補」、「文字変換、出力」がある。「記入算用数字」は、図20の第1フィールドに記入された算用数字、特に「1」の場合を示す。「認識結果漢数字」は、図20の第2フィールドの漢数字の第1の文字認識の結果の漢数字、特に「壱」の場合を示す。「文字認識の第1候補」及び「文字認識の第2候補」は、図20の第1の文字認識における候補文字のうちの第1の候補文字X及び第2の候補文字Yが対応する。「文字変換、出力」は、第2の文字認識における文字変換の結果とする文字またはアラート等の出力の値を示す。
PC2は、処理表210のうち、「認識結果漢数字」、「文字認識の第1候補」、「文字認識の第2候補」の3つの列の値の組合せを参照し、第2の文字認識に関する判断を行う。PC2は、図20のような比較対象の組合せの値から、処理表210のその組合せに該当する行を参照し、「文字変換、出力」列の値を採用する。図20の組合せの例では、{壱,X,Y}である。PC2は、「認識結果漢数字」として「壱」であるため、図21の処理表210を参照する。PC2は、処理表210のうち、第1の候補文字X及び第2の候補文字Yの組合せに応じた行を参照する。
処理表210における「第1候補」及び「第2候補」の列は、「1」のような正しい記入を想定した文字と、「改ざん候補」の文字と、「その他」の文字との組合せが設定されている。
処理表210の第1行及び第2行は、「第1候補」列の値が「1」である。例えば、文字Xが「1」、文字Yが「改ざん候補」である場合、第1行が該当する。よって、PC2は、第1行の「文字変換、出力」列の値である「第1候補(1)」を採用する。「第1候補(1)」は、「第1候補」列の文字Xである「1」を指している。即ち、PC2は、不読の文字を「1」へ文字変換して不読を解消する。
「改ざん候補」とは、図14の判定表140において「改ざん候補算用数字」列に設定されている値を指す。判定表140から、例えば、漢数字「壱」及び算用数字「1」に関しては、「改ざん候補」の文字として、{4,7,9}である。処理表210の第1行の「第2候補」列の「改ざん候補」は、第2の候補文字Yがこれらの文字{4,7,9}のいずれかである場合を指す。組合せが{壱,1,4}等である場合、不読の文字は「1」へ文字変換される。
例えば、文字Xが「1」、文字Yが「その他」である場合、第2行が該当する。よって、PC2は、第2行の「文字変換、出力」列の値である「第1候補(1)」を採用する。「その他」とは、「1」自体及び「改ざん候補」を除いた文字を指す。例えば漢数字「壱」及び算用数字「1」に関しては、「0」〜「9」のうち、「1」と{4,7,9}を除いて、{0,2,3,5,6,8}である。組合せが{壱,1,2}等である場合、不読の文字は「1」へ文字変換される。
処理表210の第3行〜第5行は、「第1候補」列の値が「改ざん候補」である。例えば、文字Xが「改ざん候補」の文字、文字Yが「1」である場合、第3行が該当し、「第2候補(1)」が採用される。「第2候補(1)」は、「第2候補」列の文字Yである「1」を指す。また、文字X及び文字Yが「改ざん候補」の文字である場合、第4行が該当し、「強いアラート」が採用される。「強いアラート」は、改ざん等の可能性が高いという判定に応じた、強いレベルのアラートの出力を指す。「強いアラート」は前述の第2のアラートと同じでもよい。例えば、組合せが{壱,4,7}等である場合、PC2は、「1」が「4」や「7」へ改ざん等がされた可能性が高いと推測し、この「強いアラート」を出力する。また、文字Xが「改ざん候補」の文字、文字Yが「その他」の文字である場合、第5行が該当し、「強いアラート」が採用される。
処理表210の第6行〜第8行は、「第1候補」列の値が「その他」である。例えば、文字Xが「その他」の文字、文字Yが「1」である場合、第6行が該当し、「第2候補(1)」が採用される。また、文字Xが「その他」の文字、文字Yが「改ざん候補」の文字である場合、第7行が該当し、「弱いアラート」が採用される。「弱いアラート」は、改ざん等の可能性が低いという判定に応じた、「強いアラート」よりも弱いレベルのアラートの出力を指す。「弱いアラート」は前述の第1のアラートと同じでもよい。例えば、組合せが{壱,2,4}等である場合、PC2は、「1」が「4」等へ改ざん等がされた可能性が有ると推定し、この「弱いアラート」を出力する。また、文字X及び文字Yが共に「その他」の文字の場合、第8行が該当し、「弱いアラート」が採用される。
組合せが第1行、第2行、第3行、または第6行に該当する場合、不読の文字は第2の文字認識により文字変換され、不読が解消される結果となる。組合せが第4行、第5行、第7行、または第8行に該当する場合、特定のアラートが出力される結果となる。
また、PC2は、漢数字に不読が有る場合、その不読の文字について、所定の組合せの値を比較し、不読の解消のための第2の文字変換を試みる。所定の組合せは、(1)第1フィールドの算用数字の第1の文字認識の結果の文字と、(2)第2フィールドの漢数字の第1の文字認識における候補の文字と、を含む。PC2は、漢数字に不読が有る場合、図21の(b)の表120B、及び図14の判定表140を参照し、上記組合せの値の比較に基づいて、第2の文字変換を行う。
図21の(b)は、不読が有る場合の処理表210Bを示す。この処理表210Bは、日本の帳票の場合及び第2の変換の場合に対応した一部分を示す。この処理表210は、記入された漢数字「壱」に不読が有る場合に対応した部分を示す。
表210Bにおいて、列として、「記入漢数字」、「認識結果算用数字」、「文字認識の第1候補」、「文字認識の第2候補」、「文字変換、出力」がある。「記入漢数字」は、第2フィールドに記入された漢数字、特に「壱」の場合を示す。「認識結果算用数字」は、第1フィールドの算用数字の第1の文字認識の結果の算用数字、特に「1」の場合を示す。「文字認識の第1候補」及び「文字認識の第2候補」は、第1の文字認識における候補文字を示す。
PC2は、処理表210Bのうち、「認識結果算用数字」、「文字認識の第1候補」、「文字認識の第2候補」の3つの列の値の組合せを参照し、第2の文字認識に関する判断を行う。PC2は、比較対象の組合せ{1,X,Y}の値から、処理表210Bのその組合せに該当する行を参照し、「文字変換、出力」列の値を採用する。
処理表210Bの第1行は、「文字認識の第1候補」列の値が「壱」であり、「文字認識の第2候補」列の値が「壱 以外」である。文字Xが「壱」であり、文字Yが「壱」以外の文字である場合、第1行に該当し、「文字変換、出力」列の値である「第1候補(壱)」が採用される。「第1候補(壱)」は、「第1候補」列の文字Xである「壱」を指している。即ち、PC2は、不読の文字を「壱」へ文字変換して不読を解消する。
処理表210Bの第2行は、「第1候補」列の値が「壱 以外」であり、「第2候補」列の値が「壱」である。文字Xが「壱」以外の文字であり、文字Yが「壱」である場合、第2行に該当し、「第2候補(壱)」が採用される。「第2候補(壱)」は、「第2候補」列の文字Yである「壱」を指している。
処理表210Bの第3行は、「第1候補」及び「第2候補」列の値が共に「壱 以外」である。文字X及び文字Yが「壱」以外の文字である場合、第3行に該当し、「弱いアラート」が採用される。
「1」以外の算用数字及び「壱」以外の漢数字についても、同様に、処理表210や処理表210Bの情報が用意されている。PC2は、「1」以外の算用数字及び「壱」以外の漢数字についても、処理表210や処理表210Bを用いて、同様に不読が有る場合の処理を行う。中国の帳票の場合、日本とは異なる使用文字による処理表210や処理表210Bを用いて、同様に不読が有る場合の処理が行われる。
上記例のように、不読低減モードでは、第1の変換及び第2の変換のいずれの場合でも、不読を低減できる。また、ユーザは、改ざん等の可能性を判断しやすい。
[効果等]
以上説明したように、実施の形態1の文字認識システム及び文字認識方法によれば、文字の種類が異なる二重エントリを含む帳票の場合にも、精度や効率を高め、ユーザの作業の負担を軽減できる。ユーザは、帳票の記載内容の確認や、データの修正や確定等の作業が容易になる。
特許文献1を含め、従来の文字認識システムは、二重エントリの文字種が異なる2つの金額を自動的に比較及び判定するような高度な機能を持たない。一方、実施の形態1の文字認識システムは、二重エントリの2つの金額の文字種が異なる場合、自動的に文字種を変換して比較及び判定等を行う高度な機能を提供する。よって、ユーザは、2つの文字列の比較等の手間が軽減され、一見してすぐに判断がしやすい。
実施の形態1の文字認識システムは、二重エントリの金額の比較や、改ざん等の可能性の判定を含め、自動的なチェックを行い、判定結果に応じたアラートを出力する。よって、ユーザは、金額の不一致、改ざん等の可能性を認識及び検出しやすい。
実施の形態1の文字認識システムは、誤読低減モードや不読低減モードを備えており、帳票のOCR処理、即ち帳票データを得る処理に関して、精度を高めることができる。ユーザは、信頼性が高い帳票データを得ることができる。
実施の形態1の文字認識システムは、多数の帳票のOCR処理の場合にも、帳票毎に自動的なチェックを行い、出力データを保存し、必要に応じて結果画面を出力する。これにより、多数の帳票のOCR処理及びユーザの作業の効率を高めることができる。
(実施の形態2)
図22を用いて、本発明の実施の形態2の文字認識システム及び文字認識方法について説明する。実施の形態2の文字認識方法は、実施の形態2の文字認識システム上において、ユーザの操作に基づいてコンピュータにより実行される処理手順を含む方法である。
図22は、実施の形態2の文字認識システムの構成を示す。実施の形態2の文字認識システムは、OCR装置3とPC4との接続により構成される。実施の形態2の文字認識システムは、帳票5のOCR処理に関する主な処理を、PC4ではなく、OCR装置3で行う。言い換えると、実施の形態2の文字認識システムは、ハードOCR方式のシステムである。OCR装置3は、帳票5のOCR処理のうち、帳票5の画像データ41を得る処理から比較結果データ44を出力する処理までを行う装置である。PC4は、ソフトウェア処理により、OCR処理のうち、比較結果データ44を含む出力データ45をユーザへ出力する出力処理等を行う装置である。
ユーザは、OCR装置3及びPC4を操作する。ユーザは、作業のため、帳票5をOCR装置3にセットして入力する。ユーザは、PC4で作業に関する設定や指示入力を行う。PC4は、指示入力に従い、OCR装置3へ命令を送信する。OCR装置3は、PC4からの命令に従い、帳票5のOCR処理を開始する。
OCR装置3は、図示しないスキャナやスタッカの他、制御装置301、記憶装置302、及び通信インタフェース装置303を有する。
制御装置301は、CPU、ROM、RAM等により構成される。記憶装置302は、メモリやディスク等を含む。通信インタフェース装置303は、PC4との通信インタフェースに対応した通信処理を行う。
制御装置301は、記憶装置302に格納されているプログラム30をロードしてソフトウェア処理を実行することにより、帳票入力部31等の各処理部を実現する。プログラム30は、OCR装置3に特有のOCR処理を実行させるプログラムである。なお、このプログラム処理は、ハードウェア回路に実装されていてもよい。制御装置301は、帳票入力部31、文字認識部32、変換部33、及び比較部34を有する。
記憶装置302は、OCR処理に係わる各データとして、画像データ41、認識結果文字データ42、変換結果文字データ43、及び比較結果データ44等を記憶する。
OCR装置3は、帳票入力部31により、帳票5を読み込んでスキャンし、帳票5の画像データ41を得て、記憶装置302に格納する。
文字認識部32は、記憶装置302の帳票5の画像データ41を入力し、画像データ41に対して文字認識処理を行い、その結果である認識結果文字データ42を記憶装置302に格納する。
変換部33は、記憶装置302の認識結果文字データ42を入力し、認識結果文字データ42に対して、所定の変換処理を行い、その結果である変換結果文字データ43を記憶装置302に格納する。
比較部34は、記憶装置302の変換結果文字データ43を入力し、変換結果文字データ43に対して、所定の比較処理を行い、その結果である比較結果データ44を記憶装置302に格納する。
OCR装置3は、OCR処理の結果である、比較結果データ44や認識結果文字データ42を、通信インタフェース装置303による通信処理を介し、PC4へ転送する。
PC4は、図示しない制御装置、記憶装置、通信インタフェース装置、入力装置、表示装置、等の一般的な要素を有する。PC4は、それらの要素の上に構成される、出力部35、及びユーザインタフェース部36を有する。PC4は、OCR装置1から転送された比較結果データ44や認識文字結果データ42を受信し、内部の記憶装置に格納する。
出力部35は、記憶装置の比較結果データ44を入力し、所定の出力処理として、比較結果データ44を含む出力データ45を構成し、出力データ45を記憶装置に保存する。また、出力部35は、ユーザインタフェース部36及び表示装置を用いて、出力データ45に対応したOCR処理の結果画面をユーザへ表示する。
ユーザインタフェース部36は、文字認識システム及びOCRの作業に関するユーザインタフェースとしての画面をユーザに提供する処理を行う。ユーザインタフェース部36は、出力データ45に基づいて、Webページ等による画面データを構成し、画面データに基づいて表示装置に結果画面を表示させる。
実施の形態2の文字認識システム及び文字認識方法によっても、実施の形態1と同様の効果が得られる。
以上、本発明を実施の形態に基づき具体的に説明したが、本発明は前記実施の形態に限定されず、その要旨を逸脱しない範囲で種々変更可能である。
本発明は、帳票のOCR処理を行う業務に利用可能である。
1…OCR装置、2…PC、5…帳票、11…帳票入力部、12…文字認識部、13…変換部、14…比較部、15…出力部、16…ユーザインタフェース部、20…プログラム、21…画像データ、22…認識結果文字データ、23…変換結果文字データ、24…比較結果データ、25…出力データ、101…制御装置、102…記憶装置、103…入力装置、104…表示装置、105…印刷装置、106…通信インタフェース装置。

Claims (14)

  1. 帳票を入力して当該帳票の画像データを得る帳票入力部と、
    前記帳票の前記画像データから、2つのフィールドの2つの文字列として、第1のフィールドの第1の文字列、及び第2のフィールドの第2の文字列を文字認識し、認識結果文字データを得る文字認識部と、
    前記認識結果文字データから、前記第1の文字列の文字種と前記第2の文字列の文字種とが異なる場合に、一方の文字列の文字種を他方の文字列の文字種に合わせるように前記一方の文字列を変換し、変換結果文字データを得る変換部と、
    前記変換結果文字データから、前記第1の文字列と前記第2の文字列とを比較し、一致または不一致を判定し、比較結果データを得る比較部と、
    前記比較結果データを含む出力データをユーザへ出力する出力部と、
    を有する、文字認識システム。
  2. 請求項1記載の文字認識システムにおいて、
    前記帳票は、前記第1の文字列に、算用数字による金額を含み、前記第2の文字列に、漢数字による金額を含み、
    前記文字種が異なる前記2つの文字列に関する文字毎の対応関係が設定された変換表を有し、
    前記変換部は、前記変換表を用いて、前記第2の文字列の漢数字を前記第1の文字列の算用数字に合わせるように前記第2の文字列を変換する、文字認識システム。
  3. 請求項1記載の文字認識システムにおいて、
    前記帳票は、前記第1の文字列に、算用数字による金額を含み、前記第2の文字列に、漢数字による金額を含み、
    前記文字種が異なる前記2つの文字列に関する文字毎の対応関係が設定された変換表を有し、
    前記変換部は、前記変換表を用いて、前記第1の文字列の算用数字を前記第2の文字列の漢数字に合わせるように前記第1の文字列を変換する、文字認識システム。
  4. 請求項1記載の文字認識システムにおいて、
    前記第1の文字列の文字と、前記第2の文字列の文字と、前記第1の文字列の文字についての改ざん候補文字と、の組合せが設定された判定表を有し、
    前記比較部は、前記不一致と判定した前記第1の文字列の文字及び前記第2の文字列の文字について、前記判定表の前記組合せに該当するかどうかにより、前記第1の文字列の文字についての改ざんを含む可能性を判定し、判定結果を出力する、文字認識システム。
  5. 請求項1記載の文字認識システムにおいて、
    前記認識結果文字データに基づいて、前記フィールドの領域内に前記文字列が見つからない場合、当該領域よりも外側に拡げた範囲で前記文字列を探し、前記文字列が見つからない場合は、空白有りの結果とし、前記文字列が見つかった場合は、当該文字列を前記認識結果文字データに含めて、空白無しの結果とし、当該結果を出力する、文字認識システム。
  6. 請求項1記載の文字認識システムにおいて、
    前記認識結果文字データに基づいて、前記第1の文字列の桁数と、前記第2の文字列の桁数と、を判定し、前記第1の文字列の桁数と、前記第2の文字列の桁数と、を比較し、当該桁数の一致または不一致を判定し、当該判定の結果を出力する、文字認識システム。
  7. 請求項1記載の文字認識システムにおいて、
    前記ユーザの操作に基づいた指示入力の画面と、前記出力データに基づいた結果画面と、を前記ユーザへ出力するユーザインタフェース部を有し、
    前記指示入力の画面は、前記2つのフィールドと、前記2つの文字列のそれぞれの文字種と、前記変換の対象の文字列と、を指定する項目を含む、文字認識システム。
  8. 請求項1記載の文字認識システムにおいて、
    前記ユーザの操作に基づいた指示入力の画面と、前記出力データに基づいた結果画面と、を前記ユーザへ出力するユーザインタフェース部を有し、
    前記結果画面は、前記第1の文字列の前記文字認識の結果のデータと、前記第2の文字列の前記文字認識の結果のデータ、または前記第2の文字列の前記変換の結果のデータと、前記一致または不一致の判定結果と、前記不一致の場合のアラートと、を含む、文字認識システム。
  9. 請求項4記載の文字認識システムにおいて、
    前記ユーザの操作に基づいた指示入力の画面と、前記出力データに基づいた結果画面と、を前記ユーザへ出力するユーザインタフェース部を有し、
    前記結果画面は、前記第1の文字列の前記文字認識の結果のデータと、前記第2の文字列の前記文字認識の結果のデータ、または前記第2の文字列の前記変換の結果のデータと、前記一致または不一致の判定結果と、前記不一致の場合には、前記第1の文字列の文字についての改ざんを含む可能性の判定結果と、前記改ざんを含む可能性のアラートと、を含む、文字認識システム。
  10. 請求項1記載の文字認識システムにおいて、
    前記ユーザの操作に基づいた指示入力の画面と、前記出力データに基づいた結果画面と、を前記ユーザへ出力するユーザインタフェース部を有し、
    前記指示入力の画面は、誤読低減モードを指定する項目を含み、
    前記誤読低減モードが指定されている場合、前記第1の文字列の前記文字認識の結果、または前記第2の文字列の前記文字認識の結果の少なくとも一方において、不読の文字が有る場合、当該不読が有る旨の結果とし、前記結果画面に、当該不読の文字の箇所と、当該不読が有る旨のアラートと、を含む情報を出力する、文字認識システム。
  11. 請求項1記載の文字認識システムにおいて、
    前記ユーザの操作に基づいた指示入力の画面と、前記出力データに基づいた結果画面と、を前記ユーザへ出力するユーザインタフェース部を有し、
    前記第1の文字列の前記文字認識の結果のデータにおける第1の金額と、前記第2の文字列の前記変換の結果のデータにおける第2の金額と、の金額差を計算し、前記結果画面に、前記金額差と、前記金額差が有る場合または前記金額差が閾値以上である場合のアラートと、を含む情報を出力する、文字認識システム。
  12. 請求項1記載の文字認識システムにおいて、
    前記ユーザの操作に基づいた指示入力の画面と、前記出力データに基づいた結果画面と、を前記ユーザへ出力するユーザインタフェース部を有し、
    前記指示入力の画面は、不読低減モードを指定する項目を含み、
    前記第1の文字列の前記第1の文字認識の候補文字と、前記第2の文字列の前記第1の文字認識の結果の文字と、第2の文字認識の結果出力として文字またはアラートと、を含む対応関係の情報が設定された処理表を有し、
    前記不読低減モードが指定されている場合、前記第1の文字列の第1の文字認識の結果、または前記第2の文字列の第1の文字認識の結果の少なくとも一方に、不読の文字が有る場合に、当該不読が有る場合の処理として、前記第1の文字列の前記第1の文字認識の候補文字と、前記第2の文字列の前記第1の文字認識の結果の文字と、の組合せから、前記処理表を参照して、前記第2の文字認識の結果出力を決定し、
    前記第2の文字認識の結果出力として前記文字が決定された場合、前記不読の文字を、当該文字へ文字変換することにより当該不読を解消し、
    前記結果画面は、前記第2の文字認識の結果出力を含む、文字認識システム。
  13. 請求項12記載の文字認識システムにおいて、
    前記処理表は、前記第1の文字列の前記第1の文字認識の候補文字として、第1の候補文字、及び第2の候補文字を含み、当該候補文字として、正しい記入を想定した文字と、改ざん候補の文字と、その他の文字と、の組合せが設定されており、
    前記比較部は、前記第1の文字列の前記第1の文字認識の候補文字における前記第1の候補文字及び前記第2の候補文字と、前記第2の文字列の前記第1の文字認識の結果の文字との組合せから、前記処理表を参照して、前記第2の文字認識の結果出力を決定し、前記結果出力として、前記第1の候補文字または前記第2の候補文字が前記正しい記入を想定した文字である場合には、当該文字を出力し、前記第1の候補文字が前記改ざん候補の文字である場合には、前記アラートを出力する、文字認識システム。
  14. 帳票を入力して当該帳票の画像データを得る帳票入力ステップと、
    前記帳票の前記画像データから、2つのフィールドの2つの文字列として、第1のフィールドの第1の文字列、及び第2のフィールドの第2の文字列を文字認識し、認識結果文字データを得る文字認識ステップと、
    前記認識結果文字データから、前記第1の文字列の文字種と前記第2の文字列の文字種とが異なる場合に、一方の文字列の文字種を他方の文字列の文字種に合わせるように前記一方の文字列を変換し、変換結果文字データを得る変換ステップと、
    前記変換結果文字データから、前記第1の文字列と前記第2の文字列とを比較し、一致または不一致を判定し、比較結果データを得る比較ステップと、
    前記比較結果データを含む出力データをユーザへ出力する出力ステップと、
    を有する、文字認識方法。
JP2014232521A 2014-11-17 2014-11-17 文字認識システム及び文字認識方法 Active JP6472218B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2014232521A JP6472218B2 (ja) 2014-11-17 2014-11-17 文字認識システム及び文字認識方法
CN201510785494.3A CN105608453B (zh) 2014-11-17 2015-11-16 字符识别系统及字符识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2014232521A JP6472218B2 (ja) 2014-11-17 2014-11-17 文字認識システム及び文字認識方法

Publications (2)

Publication Number Publication Date
JP2016095753A true JP2016095753A (ja) 2016-05-26
JP6472218B2 JP6472218B2 (ja) 2019-02-20

Family

ID=55988379

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014232521A Active JP6472218B2 (ja) 2014-11-17 2014-11-17 文字認識システム及び文字認識方法

Country Status (2)

Country Link
JP (1) JP6472218B2 (ja)
CN (1) CN105608453B (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019125099A (ja) * 2018-01-15 2019-07-25 富士通フロンテック株式会社 帳票認識プログラム、帳票認識方法、及び帳票認識装置
JP2019153212A (ja) * 2018-03-06 2019-09-12 オムロン株式会社 偽造判定装置、偽造判定方法、及び偽造判定プログラム

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107622263B (zh) * 2017-02-20 2018-08-21 平安科技(深圳)有限公司 单据图像的字符识别方法和装置
CN107507334A (zh) * 2017-08-31 2017-12-22 深圳怡化电脑股份有限公司 一种纸币面额识别方法、装置、设备及存储介质
CN107622266B (zh) * 2017-09-21 2019-05-07 平安科技(深圳)有限公司 一种ocr识别的处理方法、存储介质和服务器
CN111126400A (zh) * 2018-10-31 2020-05-08 上海迈弦网络科技有限公司 一种基于ocr识别结果的大小写金额相互演算推测方法
CN110378784A (zh) * 2019-07-24 2019-10-25 中国工商银行股份有限公司 金额输入方法及装置
CN111639646B (zh) * 2020-05-18 2021-04-13 山东大学 一种基于深度学习的试卷手写英文字符识别方法及系统
CN113435993A (zh) * 2021-08-27 2021-09-24 聆笙(北京)科技有限公司 一种收据数据识别系统及其方法
CN113743902A (zh) * 2021-09-08 2021-12-03 未鲲(上海)科技服务有限公司 基于人工智能的信息审核方法、装置、终端设备及介质
CN114155361A (zh) * 2021-12-11 2022-03-08 浙江正泰中自控制工程有限公司 一种摄像直读表抄表方法及系统
CN114629707B (zh) * 2022-03-16 2024-05-24 深信服科技股份有限公司 一种乱码检测方法、装置及电子设备和存储介质

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5668880A (en) * 1979-11-10 1981-06-09 Fujitsu Ltd Character reader
JPH0374785A (ja) * 1989-08-15 1991-03-29 Oki Electric Ind Co Ltd 光学式文字又は図形読取り装置を用いた数字表示方法
JP2001076093A (ja) * 1999-09-03 2001-03-23 Oki Software Kk 為替集中処理システム
JP2005266923A (ja) * 2004-03-16 2005-09-29 Oki Electric Ind Co Ltd 手書き数字認識方法
JP2009169827A (ja) * 2008-01-18 2009-07-30 Mitsubishi Heavy Ind Ltd ナンバープレート認識装置、ナンバープレート認識方法、ナンバープレート認識プログラム
JP2009200794A (ja) * 2008-02-21 2009-09-03 Fuji Xerox Co Ltd 文書の改竄検出プログラム及び改竄検出装置
JP2014026421A (ja) * 2012-07-26 2014-02-06 Fujitsu Frontech Ltd 照合装置、照合方法および照合プログラム

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3425408B2 (ja) * 2000-05-31 2003-07-14 株式会社東芝 文書読取装置
JP2010217996A (ja) * 2009-03-13 2010-09-30 Omron Corp 文字認識装置、文字認識プログラム、および文字認識方法
JP5508359B2 (ja) * 2011-08-03 2014-05-28 シャープ株式会社 文字認識装置、文字認識方法及びプログラム
CN103824373B (zh) * 2014-01-27 2016-06-08 深圳辰通智能股份有限公司 一种票据图像金额分类方法及系统

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5668880A (en) * 1979-11-10 1981-06-09 Fujitsu Ltd Character reader
JPH0374785A (ja) * 1989-08-15 1991-03-29 Oki Electric Ind Co Ltd 光学式文字又は図形読取り装置を用いた数字表示方法
JP2001076093A (ja) * 1999-09-03 2001-03-23 Oki Software Kk 為替集中処理システム
JP2005266923A (ja) * 2004-03-16 2005-09-29 Oki Electric Ind Co Ltd 手書き数字認識方法
JP2009169827A (ja) * 2008-01-18 2009-07-30 Mitsubishi Heavy Ind Ltd ナンバープレート認識装置、ナンバープレート認識方法、ナンバープレート認識プログラム
JP2009200794A (ja) * 2008-02-21 2009-09-03 Fuji Xerox Co Ltd 文書の改竄検出プログラム及び改竄検出装置
JP2014026421A (ja) * 2012-07-26 2014-02-06 Fujitsu Frontech Ltd 照合装置、照合方法および照合プログラム

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019125099A (ja) * 2018-01-15 2019-07-25 富士通フロンテック株式会社 帳票認識プログラム、帳票認識方法、及び帳票認識装置
JP2019153212A (ja) * 2018-03-06 2019-09-12 オムロン株式会社 偽造判定装置、偽造判定方法、及び偽造判定プログラム
JP7006382B2 (ja) 2018-03-06 2022-01-24 オムロン株式会社 偽造判定装置、偽造判定方法、及び偽造判定プログラム

Also Published As

Publication number Publication date
CN105608453A (zh) 2016-05-25
JP6472218B2 (ja) 2019-02-20
CN105608453B (zh) 2019-05-03

Similar Documents

Publication Publication Date Title
JP6472218B2 (ja) 文字認識システム及び文字認識方法
US9697193B2 (en) Associating captured image data with a spreadsheet
US20090226090A1 (en) Information processing system, information processing apparatus, information processing method, and storage medium
CN107045632A (zh) 用于从成像文件提取文本的方法和设备
US20070174482A1 (en) Table format data processing method and table format data processing
JPH0830722A (ja) 文書書式認識実行方法および装置
EP2107505B1 (en) Character recognition device
JP2014228953A (ja) 画像処理装置および画像処理方法
US20150254869A1 (en) Image processing apparatus, image processing method, and storage medium
US20100189360A1 (en) Information processing apparatus and information processing method
JP2007179395A (ja) 媒体処理装置,媒体処理方法,媒体処理システム,及び媒体処理プログラムを記録したコンピュータ読取可能な記録媒体
JP2008021068A (ja) 帳票認識装置及び帳票認識プログラム
US7680329B2 (en) Character recognition apparatus and character recognition method
JP2021043775A (ja) 情報処理装置及びプログラム
JP2013077157A (ja) 光学式文字認識で生成したテキストデータの校正を支援するためのシステム、方法、プログラム
CN112528889B (zh) Ocr信息检测修正方法、装置、终端及存储介质
JP2015185157A (ja) 文字データ修正方法、文字データ修正装置およびプログラム
CN104992136B (zh) 识别条形码的方法及装置
JP2003242441A (ja) 帳票処理方法および装置並びにプログラム
US20220292857A1 (en) Information processing apparatus, information processing method, and recording medium
JP5632110B1 (ja) 文字データ修正方法、文字データ修正装置およびプログラム
US20210042555A1 (en) Information Processing Apparatus and Table Recognition Method
JP2005165978A (ja) 帳票ocrプログラム、方法及び装置
JP5712415B2 (ja) 帳票処理システム及び帳票処理方法
CN109409370B (zh) 一种远程桌面字符识别方法和装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20171006

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20181010

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20181023

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20181126

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20190108

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20190122

R150 Certificate of patent or registration of utility model

Ref document number: 6472218

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250