JP4241820B2 - 文字認識方法および文字認識システム - Google Patents

文字認識方法および文字認識システム Download PDF

Info

Publication number
JP4241820B2
JP4241820B2 JP2006340044A JP2006340044A JP4241820B2 JP 4241820 B2 JP4241820 B2 JP 4241820B2 JP 2006340044 A JP2006340044 A JP 2006340044A JP 2006340044 A JP2006340044 A JP 2006340044A JP 4241820 B2 JP4241820 B2 JP 4241820B2
Authority
JP
Japan
Prior art keywords
area
character recognition
reading
deletion
image data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP2006340044A
Other languages
English (en)
Other versions
JP2007073080A (ja
Inventor
由紀子 稲本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP2006340044A priority Critical patent/JP4241820B2/ja
Publication of JP2007073080A publication Critical patent/JP2007073080A/ja
Application granted granted Critical
Publication of JP4241820B2 publication Critical patent/JP4241820B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Description

本発明は、文字認識方法および文字認識システムに関するものである。
一般に、OCR(Optical Character Reader)等の文字認識装置では、帳票上の所定領域内に記載された文字に対して文字認識を行うようになっている。つまり、文字認識装置では、例えば図3に示すような帳票であれば、その帳票上の「氏名欄」及び「住所欄」内に記載された文字について文字認識を行う。
ところで、従来、帳票上の所定領域、すなわち帳票上における認識対象領域は、矩形を用いて指定されるようになっている。具体的には、文字認識装置と接続するCRT(Cathode Ray Tube)画面に表示された帳票のフォーマットを示すイメージデータ上で、認識対象領域が周知のGUIツール等によって矩形で囲まれたり、あるいは文字認識装置と接続するキーボード等で認識対象領域を囲む矩形の座標値が入力されることによって、認識対象領域の指定が行われている。
しかしながら、上述した従来の指定方法では、以下のような課題が生じてしまう。
例えば、図3に示す帳票のように、帳票上の「氏名欄」や「住所欄」には、「お名前」や「ご住所」といった領域タイトルが予め印刷されていることが多い。したがって、これらの「氏名欄」や「住所欄」を認識対象領域として矩形で指定すると、その認識対象領域内に領域タイトルを含んでしまうこととなり、文字認識装置で文字認識を行う際に、誤認識の原因となってしまう可能性がある。
そのために、認識対象領域を多角形を用いて指定し、その認識対象領域内に領域タイトルが含まれないようにすることが考えられるが、この場合には、矩形で指定する場合に比べて、指定ポイントの増加等により手間の掛かるものとなってしまい、しかもそのために指定ミスが発生する可能性も高くなる。
そこで、本発明は、認識対象領域の指定が容易かつ簡便に行うことができ、しかも文字認識の際に誤認識等が発生することを軽減した文字認識方法および文字認識システムを提供することを目的とする。
本発明は、上記目的を達成するために案出された文字認識方法および文字認識システムである。
請求項1に記載の発明は、帳票の読取領域が記憶されている場合は、読み取られた帳票の前記読取領域に該当する領域内の画像データを自動的に表示し表示した該読取領域内の削除領域を指定し、読取領域が記憶されていない場合は、読み取られた帳票の画像データを表示して読取領域を指定した上で、読取領域内の削除領域を指定し、読み取られた帳票の画像データに対して、読取領域と削除領域の情報に基づき決定された認識対象領域の文字認識を行うことを特徴とする文字認識方法である。
請求項2に記載の発明は、前記認識対象領域が、前記読取領域から前記削除領域を除いた領域であることを特徴とする請求項1に記載の文字認識方法である。
請求項3に記載の発明は、前記削除領域が、文字認識に不要な文字を指定する領域であることを特徴とする請求項1又は請求項2に記載の文字認識方法である。
請求項4に記載の発明は、前記削除領域が、予め帳票に印刷された領域タイトルであることを特徴とする請求項1又は請求項2に記載の文字認識方法である。
請求項5に記載の発明は、帳票の読取領域が記憶されている場合は、読み取られた帳票の前記読取領域に該当する領域内の画像データを自動的に表示し、読取領域が記憶されていない場合は、読み取られた帳票の画像データを表示する表示手段と、帳票の読取領域が記憶されている場合は、前記領域内の画像データに対して該読取領域内の削除領域を指定し、読取領域が記憶されていない場合は、前記帳票の画像データに対して読取領域を指定した上で、該読取領域内の削除領域を指定する入力手段と、読み取られた帳票の画像データに対して、読取領域と削除領域の情報に基づき認識対象領域を決定するレイアウト解析手段と、認識対象領域の文字認識を行う文字認識手段とを有することを特徴とする文字認識システムである。
請求項6に記載の発明は、前記認識対象領域が、前記読取領域から前記削除領域を除いた領域であることを特徴とする請求項5に記載の文字認識システムである。
請求項7に記載の発明は、前記削除領域が、文字認識に不要な文字を指定する領域であることを特徴とする請求項5又は請求項6に記載の文字認識システムである。
請求項8に記載の発明は、前記削除領域が、予め帳票に印刷された領域タイトルであることを特徴とする請求項5又は請求項6に記載の文字認識システムである。
本発明の文字認識方法および文字認識システムによれば、帳票上の認識対象領域を矩形で指定しても、その認識対象領域内に不要な領域が含まれてしまうことがなく、文字認識装置での文字認識の際に、誤認識等が発生してしまうことが軽減できる。しかも、認識対象領域を矩形により指定可能になるため、多角形等を用いて指定する場合に比べて、認識対象領域の指定が容易かつ簡便なものとなり、認識対象領域の指定ミスが発生する可能性も低くなる。
以下、図面に基づき本発明に係わる文字認識方法および文字認識システムについて説明する。
〔第1の実施の形態〕
先ず、本発明の第1の実施の形態を説明する。
図1は、本実施の形態の文字読取領域指定の具体例を示す概要説明図であり、図2は、本実施の形態の文字認識システムの概略構成を示すブロック図である。
はじめに、文字認識装置10について説明する。
文字認識装置10は、OCR等からなるものであり、帳票1上の認識対象領域内に記載された文字に対して、文字認識を行うものである。そのために、文字認識装置10では、図2に示すように、画像入力部11と、レイアウト解析部12と、フォーマットデータベース(以下、データベースをDBと略す)部13と、文字認識部14と、出力形成部15とを備えている。なお、フォーマットDB部13には、CRT、キーボード、マウス等を有する入力装置20が接続可能になっており、この入力装置が接続されてシステムを構成している。
画像入力部11は、読み取り対象である帳票1から、その記載内容を画像データとして読み取るものである。
レイアウト解析部12は、帳票1上における認識対象領域の位置を解析し、画像入力部1が読み取った画像データから、その認識対象領域内の画像データのみを取り出すものである。
フォーマットDB部13は、レイアウト解析部12での解析に必要な情報、すなわち読み取り対象である帳票1の認識対象領域に関する情報を、予め記憶しているものである。
文字認識部14は、レイアウト解析部12によって認識対象領域と判断された領域内の画像データに対し、文字認識を行うものである。
出力形成部15は、文字認識部14による文字認識結果を、帳票上の認識対象領域内に記載された文字として、テキストデータ等により出力するものである。
このように構成された文字認識装置10では、帳票1に対する文字認識を行う際に、その帳票1上の認識対象領域に関する情報を、予めフォーマットDB部13に記憶している。ただし、その認識対象領域に関する情報は、フォーマットDB部13に接続する入力装置20において入力されるようになっている。
ここで、認識対象領域に関する情報の入力の手順、すなわち本実施の形態の文字認識方法の手順について、図1の概要説明図を参照しながら説明する。
入力装置20では、認識対象領域に関する情報の入力にあたって、図1(a)に示すように、先ず、帳票上で文字認識の対象となるおおまかな領域を、読取領域2として、矩形によって入力装置20のオペレータに指定させる。この指定は、入力装置20のCRT画面に表示された帳票のフォーマットを示すイメージデータ上で、GUIツール等によって読取領域2を矩形で囲んだり、あるいは入力装置20のキーボード等で読取領域2を囲む矩形の座標値を入力することによって行われる。例えば、図3に示す帳票であれば、その帳票上の「氏名欄」や「住所欄」のそれぞれが、矩形によって読取領域2として指定される。
ここまでは、従来の手順と同様である。
ただし、帳票上の「氏名欄」及び「住所欄」内に記載された文字を認識する場合に、各欄内の「お名前」や「ご住所」といった領域タイトルは不要である。そこで、入力装置20では、読取領域2が矩形によって指定されると、これに続いて、図1(b)に示すように、文字認識に不要な領域を、削除領域3として、読取領域2とは別の矩形によって指定させる。例えば、図3に示す帳票であれば、読取領域2が指定された後に、「お名前」や「ご住所」といった領域タイトルが、それぞれ読取領域2とは別の矩形によって削除領域3として指定される。
読取領域2と削除領域3とのそれぞれが矩形によって指定されると、入力装置20では、これらの矩形データ、すなわち読取領域2及び削除領域3に関する情報を、認識対象領域に関する情報として、文字認識装置10のフォーマットDB部13へ送出する。これにより、フォーマットDB部13には、認識対象領域に関する情報が記憶される。
フォーマットDB部13が認識対象領域に関する情報を記憶すると、文字認識装置10では、その情報に基づいて、帳票1に対する文字認識を行う。
具体的には、画像入力部11が帳票1から画像データを読み取ると、レイアウト解析部12は、フォーマットDB部13内の情報に基づいて、先ず、読取領域2に該当する領域内の画像データを確保する。この画像データには、「お名前」や「ご住所」といった領域タイトルも含まれている。
続いて、レイアウト解析部12では、確保した画像データから、削除領域3に該当する領域内の画像データを削除する。そして、文字認識部14は、削除後の画像データに対して文字認識を行う。
つまり、レイアウト解析部12は、図1(c)に示すように、読取領域2から削除領域3を除いた領域を認識対象領域4とし、その認識対象領域4内の画像データについてのみ、文字認識部14での文字認識を行わせる。これにより、文字認識部14では、領域タイトルが含まれていない画像データ、すなわち文字認識に必要な画像データに対して文字認識を行うようになる。したがって、文字認識部14では、誤認識等が発生することが軽減でき、正しい文字認識を行うことができるようになる。
以上のように、本実施の形態の文字認識方法および文字認識システムによれば、帳票上の認識対象領域4が、読取領域2と削除領域3との二つの矩形によって指定されるようになっている。つまり、読取領域2から削除領域3を除いた領域を認識対象領域4とし、この認識対象領域4に記載された文字についてのみ文字認識を行わせるようになっている。
したがって、帳票上の認識対象領域4を矩形で指定しても、その認識対象領域4内に、領域タイトルといった文字認識に不要な領域が含まれてしまうことがなく、文字認識装置10での文字認識の際に、誤認識等が発生してしまうことが軽減できる。しかも、認識対象領域4を二つの矩形により指定可能になるため、多角形等を用いて指定する場合に比べて、認識対象領域4の指定が容易かつ簡便なものとなり、認識対象領域4の指定ミスが発生する可能性も低くなる。
つまり、本実施の形態の文字認識方法は、文字認識装置10のフォーマットDB部13に認識対象領域に関する情報を記憶させる際、すなわち読み取り対象となる帳票のフォーマットを文字認識装置10に登録する際に用いて好適な方法である。
〔第2の実施の形態〕
次に、本発明の第2の実施の形態を説明する。
本実施の形態は、第1の実施の形態の場合と同様に、図2に示す文字認識装置10において用いられるものである。ただし、本実施の形態では、フォーマットDB部13が、帳票1上の認識対象領域4に関する情報を予め記憶していなくてもよい。
本実施の形態では、帳票1に対する文字認識を行う際に、画像入力部11がその帳票1から画像データを読み取ると、入力装置20がその画像データをCRT画面上にイメージデータとして表示する。なお、従来のものと同様に、既にフォーマットDB部13内に読取領域2に関する情報が記憶されている場合には、入力装置20は、図1(a)に示すように、読取領域2に該当する領域内の画像データのみをイメージ表示してもよい。また、フォーマットDB部13内に読取領域2に関する情報が記憶されてなければ、入力装置20では、読み取った画像データをイメージ表示した時点で、この入力装置20のオペレータに読取領域2を指定させてもよい。
ここで、入力装置20では、イメージ表示した画像データ中において、図1(b)に示すように、文字認識に不要な領域を、削除領域3として、矩形によって指定させる。例えば、図3に示す帳票であれば、「お名前」や「ご住所」といった領域タイトルが、それぞれ矩形によって削除領域3として指定される。
入力装置20で削除領域3が指定されると、レイアウト解析部12は、入力装置20によってイメージ表示されている画像データから、削除領域3に該当する領域内の画像データを削除する。そして、文字認識部14は、削除後の画像データに対して文字認識を行う。
つまり、レイアウト解析部12は、図1(c)に示すように、イメージ表示された画像データから削除領域3を除いた領域を認識対象領域4とし、その認識対象領域4内の画像データについてのみ、文字認識部14での文字認識を行わせる。これにより、文字認識部14では、誤認識等が発生することが軽減され、正しい文字認識を行うことができるようになる。
以上のように、本実施の形態の文字認識方法および文字認識システムによれば、文字認識に不要な領域が削除領域3として指定されると、その削除領域3を除いた領域を認識対象領域4とし、この認識対象領域4に記載された文字についてのみ文字認識を行わせるようになっている。
したがって、帳票上において文字認識に不要な領域を矩形で指定すれば、認識対象領域4内に、領域タイトルといった文字認識に不要な領域が含まれてしまうことがなく、文字認識装置10での文字認識の際に、誤認識等が発生してしまうことが軽減できる。しかも、削除領域3を矩形により指定できるため、多角形等を用いて指定する場合に比べて、その指定を容易かつ簡便に行うことができ、認識対象領域4の指定ミスが発生する可能性も低くなる。
つまり、本実施の形態の文字認識方法は、帳票上に記載された文字に対する文字認識の実行中に用いて好適な方法である。例えば、帳票から取得した画像データ上に「ゴミ」等の不要物があっても、本実施の形態の文字認識方法を用いれば、その不要物を容易に取り除くことができる。
なお、上述した第1及び第2の実施の形態では、OCR等の文字認識装置10で用いられる場合を例に挙げて説明したが、データファイリングシステム等の画像処理システムのように、限られた領域の画像データを取得するシステムにおいて用いることも可能である。
本発明に係わる文字読取領域指定の実施の形態の具体例を示す概要説明図であり、(a)は読取領域を示す図、(b)は削除領域を示す図、(c)は認識対象領域を示す図である。 本発明の文字認識方法が用いられる文字認識システムの概略構成を示すブロック図である。 文字認識装置で文字認識を行う帳票の具体例を示す説明図である。
符号の説明
1…帳票、2…読取領域、3…削除領域、4…認識対象領域、10…文字認識装置

Claims (8)

  1. 帳票の読取領域が記憶されている場合は、読み取られた帳票の前記読取領域に該当する領域内の画像データを自動的に表示し表示した該読取領域内の削除領域を指定し、
    読取領域が記憶されていない場合は、読み取られた帳票の画像データを表示して読取領域を指定した上で、読取領域内の削除領域を指定し、
    読み取られた帳票の画像データに対して、
    読取領域と削除領域の情報に基づき決定された認識対象領域の文字認識を行う
    ことを特徴とする文字認識方法。
  2. 前記認識対象領域は、前記読取領域から前記削除領域を除いた領域であることを特徴とする請求項1に記載の文字認識方法。
  3. 前記削除領域は、文字認識に不要な文字を指定する領域であることを特徴とする請求項1又は請求項2に記載の文字認識方法。
  4. 前記削除領域は、予め帳票に印刷された領域タイトルであることを特徴とする請求項1又は請求項2に記載の文字認識方法。
  5. 帳票の読取領域が記憶されている場合は、読み取られた帳票の前記読取領域に該当する領域内の画像データを自動的に表示し、読取領域が記憶されていない場合は、読み取られた帳票の画像データを表示する表示手段と、
    帳票の読取領域が記憶されている場合は、前記領域内の画像データに対して該読取領域内の削除領域を指定し、
    読取領域が記憶されていない場合は、前記帳票の画像データに対して読取領域を指定した上で、該読取領域内の削除領域を指定する入力手段と、
    読み取られた帳票の画像データに対して、読取領域と削除領域の情報に基づき認識対象領域を決定するレイアウト解析手段と、
    認識対象領域の文字認識を行う文字認識手段と
    を有することを特徴とする文字認識システム。
  6. 前記認識対象領域は、前記読取領域から前記削除領域を除いた領域であることを特徴とする請求項5に記載の文字認識システム。
  7. 前記削除領域は、文字認識に不要な文字を指定する領域であることを特徴とする請求項5又は請求項6に記載の文字認識システム。
  8. 前記削除領域は、予め帳票に印刷された領域タイトルであることを特徴とする請求項5又は請求項6に記載の文字認識システム。
JP2006340044A 2006-12-18 2006-12-18 文字認識方法および文字認識システム Expired - Lifetime JP4241820B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006340044A JP4241820B2 (ja) 2006-12-18 2006-12-18 文字認識方法および文字認識システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006340044A JP4241820B2 (ja) 2006-12-18 2006-12-18 文字認識方法および文字認識システム

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP9076777A Division JPH10269312A (ja) 1997-03-28 1997-03-28 文字読取領域指定方法

Publications (2)

Publication Number Publication Date
JP2007073080A JP2007073080A (ja) 2007-03-22
JP4241820B2 true JP4241820B2 (ja) 2009-03-18

Family

ID=37934420

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006340044A Expired - Lifetime JP4241820B2 (ja) 2006-12-18 2006-12-18 文字認識方法および文字認識システム

Country Status (1)

Country Link
JP (1) JP4241820B2 (ja)

Also Published As

Publication number Publication date
JP2007073080A (ja) 2007-03-22

Similar Documents

Publication Publication Date Title
JP4271878B2 (ja) 映像中の文字検索方法及び装置並びに文字検索処理プログラム
JP5439454B2 (ja) 電子コミック編集装置、方法及びプログラム
JP4347677B2 (ja) 帳票ocrプログラム、方法及び装置
JP5439455B2 (ja) 電子コミック編集装置、方法及びプログラム
WO2013058397A1 (ja) 電子コミック編集装置及び方法
US6810147B2 (en) Document image processing apparatus for processing line portions manually input to document image, method therefor, and computer readable recording medium recorded with document image processing program therefor
JP2009116825A (ja) 情報処理装置、及び情報処理方法
JP4983464B2 (ja) 帳票画像処理装置及び帳票画像処理プログラム
JP2006277001A (ja) 入力イメージ表示方法および入力イメージ表示プログラム
WO2016170691A1 (ja) 入力処理プログラム、入力処理装置、入力処理方法、文字特定プログラム、文字特定装置、及び文字特定方法
JP4241820B2 (ja) 文字認識方法および文字認識システム
JP4347675B2 (ja) 帳票ocrプログラム、方法及び装置
JP7031465B2 (ja) 情報処理装置及びプログラム
JP5612975B2 (ja) セリフデータ生成装置、セリフデータ生成方法、及びプログラム
WO2016170690A1 (ja) 入力制御プログラム、入力制御装置、入力制御方法、文字修正プログラム、文字修正装置、及び文字修正方法
JP2008004116A (ja) 映像中の文字検索方法及び装置
JP2007073081A (ja) 文字認識方法、文字認識フォーマット登録装置および文字認識装置
JP2006072839A (ja) 画像処理方法、画像処理装置、画像処理プログラム及び記録媒体
JP4830763B2 (ja) 画像処理システムおよび画像処理プログラム
JP4712629B2 (ja) 設備仕様入力装置
JP2019169182A (ja) 情報処理装置、制御方法、プログラム
JP2006277149A (ja) 文字画像切出装置、文字画像切出方法およびプログラム
JP2018085093A (ja) 情報処理装置、制御方法、プログラム
JP4548062B2 (ja) 画像処理装置
JP6743401B2 (ja) 帳票設計・読取設定支援装置、帳票設計・読取設定支援方法、及び、光学文字認識システム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20061218

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080617

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080806

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20080930

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20081008

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20081114

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20081209

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20081222

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120109

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120109

Year of fee payment: 3

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120109

Year of fee payment: 3

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130109

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140109

Year of fee payment: 5

EXPY Cancellation because of completion of term