JP4241820B2 - 文字認識方法および文字認識システム - Google Patents
文字認識方法および文字認識システム Download PDFInfo
- Publication number
- JP4241820B2 JP4241820B2 JP2006340044A JP2006340044A JP4241820B2 JP 4241820 B2 JP4241820 B2 JP 4241820B2 JP 2006340044 A JP2006340044 A JP 2006340044A JP 2006340044 A JP2006340044 A JP 2006340044A JP 4241820 B2 JP4241820 B2 JP 4241820B2
- Authority
- JP
- Japan
- Prior art keywords
- area
- character recognition
- reading
- deletion
- image data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
Images
Description
例えば、図3に示す帳票のように、帳票上の「氏名欄」や「住所欄」には、「お名前」や「ご住所」といった領域タイトルが予め印刷されていることが多い。したがって、これらの「氏名欄」や「住所欄」を認識対象領域として矩形で指定すると、その認識対象領域内に領域タイトルを含んでしまうこととなり、文字認識装置で文字認識を行う際に、誤認識の原因となってしまう可能性がある。
請求項1に記載の発明は、帳票の読取領域が記憶されている場合は、読み取られた帳票の前記読取領域に該当する領域内の画像データを自動的に表示して、表示した該読取領域内の削除領域を指定し、読取領域が記憶されていない場合は、読み取られた帳票の画像データを表示して読取領域を指定した上で、読取領域内の削除領域を指定し、読み取られた帳票の画像データに対して、読取領域と削除領域の情報に基づき決定された認識対象領域の文字認識を行うことを特徴とする文字認識方法である。
請求項2に記載の発明は、前記認識対象領域が、前記読取領域から前記削除領域を除いた領域であることを特徴とする請求項1に記載の文字認識方法である。
請求項3に記載の発明は、前記削除領域が、文字認識に不要な文字を指定する領域であることを特徴とする請求項1又は請求項2に記載の文字認識方法である。
請求項4に記載の発明は、前記削除領域が、予め帳票に印刷された領域タイトルであることを特徴とする請求項1又は請求項2に記載の文字認識方法である。
請求項5に記載の発明は、帳票の読取領域が記憶されている場合は、読み取られた帳票の前記読取領域に該当する領域内の画像データを自動的に表示し、読取領域が記憶されていない場合は、読み取られた帳票の画像データを表示する表示手段と、帳票の読取領域が記憶されている場合は、前記領域内の画像データに対して該読取領域内の削除領域を指定し、読取領域が記憶されていない場合は、前記帳票の画像データに対して読取領域を指定した上で、該読取領域内の削除領域を指定する入力手段と、読み取られた帳票の画像データに対して、読取領域と削除領域の情報に基づき認識対象領域を決定するレイアウト解析手段と、認識対象領域の文字認識を行う文字認識手段とを有することを特徴とする文字認識システムである。
請求項6に記載の発明は、前記認識対象領域が、前記読取領域から前記削除領域を除いた領域であることを特徴とする請求項5に記載の文字認識システムである。
請求項7に記載の発明は、前記削除領域が、文字認識に不要な文字を指定する領域であることを特徴とする請求項5又は請求項6に記載の文字認識システムである。
請求項8に記載の発明は、前記削除領域が、予め帳票に印刷された領域タイトルであることを特徴とする請求項5又は請求項6に記載の文字認識システムである。
先ず、本発明の第1の実施の形態を説明する。
図1は、本実施の形態の文字読取領域指定の具体例を示す概要説明図であり、図2は、本実施の形態の文字認識システムの概略構成を示すブロック図である。
文字認識装置10は、OCR等からなるものであり、帳票1上の認識対象領域内に記載された文字に対して、文字認識を行うものである。そのために、文字認識装置10では、図2に示すように、画像入力部11と、レイアウト解析部12と、フォーマットデータベース(以下、データベースをDBと略す)部13と、文字認識部14と、出力形成部15とを備えている。なお、フォーマットDB部13には、CRT、キーボード、マウス等を有する入力装置20が接続可能になっており、この入力装置が接続されてシステムを構成している。
レイアウト解析部12は、帳票1上における認識対象領域の位置を解析し、画像入力部1が読み取った画像データから、その認識対象領域内の画像データのみを取り出すものである。
フォーマットDB部13は、レイアウト解析部12での解析に必要な情報、すなわち読み取り対象である帳票1の認識対象領域に関する情報を、予め記憶しているものである。
文字認識部14は、レイアウト解析部12によって認識対象領域と判断された領域内の画像データに対し、文字認識を行うものである。
出力形成部15は、文字認識部14による文字認識結果を、帳票上の認識対象領域内に記載された文字として、テキストデータ等により出力するものである。
ここまでは、従来の手順と同様である。
具体的には、画像入力部11が帳票1から画像データを読み取ると、レイアウト解析部12は、フォーマットDB部13内の情報に基づいて、先ず、読取領域2に該当する領域内の画像データを確保する。この画像データには、「お名前」や「ご住所」といった領域タイトルも含まれている。
続いて、レイアウト解析部12では、確保した画像データから、削除領域3に該当する領域内の画像データを削除する。そして、文字認識部14は、削除後の画像データに対して文字認識を行う。
次に、本発明の第2の実施の形態を説明する。
本実施の形態は、第1の実施の形態の場合と同様に、図2に示す文字認識装置10において用いられるものである。ただし、本実施の形態では、フォーマットDB部13が、帳票1上の認識対象領域4に関する情報を予め記憶していなくてもよい。
つまり、レイアウト解析部12は、図1(c)に示すように、イメージ表示された画像データから削除領域3を除いた領域を認識対象領域4とし、その認識対象領域4内の画像データについてのみ、文字認識部14での文字認識を行わせる。これにより、文字認識部14では、誤認識等が発生することが軽減され、正しい文字認識を行うことができるようになる。
したがって、帳票上において文字認識に不要な領域を矩形で指定すれば、認識対象領域4内に、領域タイトルといった文字認識に不要な領域が含まれてしまうことがなく、文字認識装置10での文字認識の際に、誤認識等が発生してしまうことが軽減できる。しかも、削除領域3を矩形により指定できるため、多角形等を用いて指定する場合に比べて、その指定を容易かつ簡便に行うことができ、認識対象領域4の指定ミスが発生する可能性も低くなる。
Claims (8)
- 帳票の読取領域が記憶されている場合は、読み取られた帳票の前記読取領域に該当する領域内の画像データを自動的に表示して、表示した該読取領域内の削除領域を指定し、
読取領域が記憶されていない場合は、読み取られた帳票の画像データを表示して読取領域を指定した上で、読取領域内の削除領域を指定し、
読み取られた帳票の画像データに対して、
読取領域と削除領域の情報に基づき決定された認識対象領域の文字認識を行う
ことを特徴とする文字認識方法。 - 前記認識対象領域は、前記読取領域から前記削除領域を除いた領域であることを特徴とする請求項1に記載の文字認識方法。
- 前記削除領域は、文字認識に不要な文字を指定する領域であることを特徴とする請求項1又は請求項2に記載の文字認識方法。
- 前記削除領域は、予め帳票に印刷された領域タイトルであることを特徴とする請求項1又は請求項2に記載の文字認識方法。
- 帳票の読取領域が記憶されている場合は、読み取られた帳票の前記読取領域に該当する領域内の画像データを自動的に表示し、読取領域が記憶されていない場合は、読み取られた帳票の画像データを表示する表示手段と、
帳票の読取領域が記憶されている場合は、前記領域内の画像データに対して該読取領域内の削除領域を指定し、
読取領域が記憶されていない場合は、前記帳票の画像データに対して読取領域を指定した上で、該読取領域内の削除領域を指定する入力手段と、
読み取られた帳票の画像データに対して、読取領域と削除領域の情報に基づき認識対象領域を決定するレイアウト解析手段と、
認識対象領域の文字認識を行う文字認識手段と
を有することを特徴とする文字認識システム。 - 前記認識対象領域は、前記読取領域から前記削除領域を除いた領域であることを特徴とする請求項5に記載の文字認識システム。
- 前記削除領域は、文字認識に不要な文字を指定する領域であることを特徴とする請求項5又は請求項6に記載の文字認識システム。
- 前記削除領域は、予め帳票に印刷された領域タイトルであることを特徴とする請求項5又は請求項6に記載の文字認識システム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006340044A JP4241820B2 (ja) | 2006-12-18 | 2006-12-18 | 文字認識方法および文字認識システム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006340044A JP4241820B2 (ja) | 2006-12-18 | 2006-12-18 | 文字認識方法および文字認識システム |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP9076777A Division JPH10269312A (ja) | 1997-03-28 | 1997-03-28 | 文字読取領域指定方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2007073080A JP2007073080A (ja) | 2007-03-22 |
JP4241820B2 true JP4241820B2 (ja) | 2009-03-18 |
Family
ID=37934420
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006340044A Expired - Lifetime JP4241820B2 (ja) | 2006-12-18 | 2006-12-18 | 文字認識方法および文字認識システム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4241820B2 (ja) |
-
2006
- 2006-12-18 JP JP2006340044A patent/JP4241820B2/ja not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
JP2007073080A (ja) | 2007-03-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4271878B2 (ja) | 映像中の文字検索方法及び装置並びに文字検索処理プログラム | |
JP5439454B2 (ja) | 電子コミック編集装置、方法及びプログラム | |
JP4347677B2 (ja) | 帳票ocrプログラム、方法及び装置 | |
JP5439455B2 (ja) | 電子コミック編集装置、方法及びプログラム | |
WO2013058397A1 (ja) | 電子コミック編集装置及び方法 | |
US6810147B2 (en) | Document image processing apparatus for processing line portions manually input to document image, method therefor, and computer readable recording medium recorded with document image processing program therefor | |
JP2009116825A (ja) | 情報処理装置、及び情報処理方法 | |
JP4983464B2 (ja) | 帳票画像処理装置及び帳票画像処理プログラム | |
JP2006277001A (ja) | 入力イメージ表示方法および入力イメージ表示プログラム | |
WO2016170691A1 (ja) | 入力処理プログラム、入力処理装置、入力処理方法、文字特定プログラム、文字特定装置、及び文字特定方法 | |
JP4241820B2 (ja) | 文字認識方法および文字認識システム | |
JP4347675B2 (ja) | 帳票ocrプログラム、方法及び装置 | |
JP7031465B2 (ja) | 情報処理装置及びプログラム | |
JP5612975B2 (ja) | セリフデータ生成装置、セリフデータ生成方法、及びプログラム | |
WO2016170690A1 (ja) | 入力制御プログラム、入力制御装置、入力制御方法、文字修正プログラム、文字修正装置、及び文字修正方法 | |
JP2008004116A (ja) | 映像中の文字検索方法及び装置 | |
JP2007073081A (ja) | 文字認識方法、文字認識フォーマット登録装置および文字認識装置 | |
JP2006072839A (ja) | 画像処理方法、画像処理装置、画像処理プログラム及び記録媒体 | |
JP4830763B2 (ja) | 画像処理システムおよび画像処理プログラム | |
JP4712629B2 (ja) | 設備仕様入力装置 | |
JP2019169182A (ja) | 情報処理装置、制御方法、プログラム | |
JP2006277149A (ja) | 文字画像切出装置、文字画像切出方法およびプログラム | |
JP2018085093A (ja) | 情報処理装置、制御方法、プログラム | |
JP4548062B2 (ja) | 画像処理装置 | |
JP6743401B2 (ja) | 帳票設計・読取設定支援装置、帳票設計・読取設定支援方法、及び、光学文字認識システム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20061218 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20080617 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080806 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20080930 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20081008 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20081114 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20081209 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20081222 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120109 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120109 Year of fee payment: 3 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120109 Year of fee payment: 3 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130109 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140109 Year of fee payment: 5 |
|
EXPY | Cancellation because of completion of term |