JP2011123825A - 文字認識方法、文字認識装置および文字認識プログラム - Google Patents
文字認識方法、文字認識装置および文字認識プログラム Download PDFInfo
- Publication number
- JP2011123825A JP2011123825A JP2009283087A JP2009283087A JP2011123825A JP 2011123825 A JP2011123825 A JP 2011123825A JP 2009283087 A JP2009283087 A JP 2009283087A JP 2009283087 A JP2009283087 A JP 2009283087A JP 2011123825 A JP2011123825 A JP 2011123825A
- Authority
- JP
- Japan
- Prior art keywords
- character string
- data
- character
- heading
- headline
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 37
- 238000012545 processing Methods 0.000 claims description 65
- 239000000284 extract Substances 0.000 claims description 16
- 238000013500 data storage Methods 0.000 claims description 7
- 230000010354 integration Effects 0.000 claims description 6
- 230000008030 elimination Effects 0.000 abstract description 2
- 238000003379 elimination reaction Methods 0.000 abstract description 2
- 238000010586 diagram Methods 0.000 description 17
- 238000012546 transfer Methods 0.000 description 10
- 238000004891 communication Methods 0.000 description 4
- 238000011156 evaluation Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
Images
Landscapes
- Character Input (AREA)
Abstract
【解決手段】見出しと明細行の文字列との対応付けは、特定しやすい順に行い、残った解析しにくい項目を最後に消去法で特定する。まず、見出しと明細行の文字列とが1対1で対応する行を特定し(S12)、次に、固定長の文字列を特定し(S14)、文字列の折り返しのない可変長の文字列を特定し(S15)、文字列の折り返しがあり1対1で対応する可変長の文字列を特定し(S16)、文字列の折り返しのあり1対Nで対応する可変長の文字列を特定し(S17)、それぞれ対応付けする。そして、1明細が複数行の明細行を特定し(S18)、折り返した文字列を1つに統合する(S19)。
【選択図】図5
Description
連記式の帳票の例として、ここでは、振込依頼書を示している。この帳票100によれば、その上部に、これが「振込依頼書」であり、振込人が「(株)あいうシステム」であり、振込指定日が何時であるかが記載されている。
文字認識装置10は、スキャナ1の出力が接続されたレイアウト解析処理部11と、文字列の対応付けの処理を行う対応付け処理部12と、文字列の認識を行う文字認識処理部13と、処理に必要なデータ等を格納するデータ記憶部14とを備えている。
データ記憶部14は、見出し文言辞書21およびカテゴリ/フォント別辞書22を格納しており、レイアウト解析処理部11、対応付け処理部12および文字認識処理部13の処理に使用される。見出し文言辞書21は、あらかじめ定められた見出し文言とそのイメージデータおよび見出しに対応した文字列の属性および文字列の特徴を格納している。カテゴリ/フォント別辞書22は、データ部分の文字認識のための辞書として、文字認識カテゴリ/文字フォント別に用意している。
図2は見出しに対するデータが一列に整列していない帳票例を示す図、図3は複数行の明細行が混在する帳票例を示す図である。
図4はレイアウト解析処理部の処理の流れを示すフローチャートである。
レイアウト解析処理部11は、まず、スキャナ1で走査して得られたデータを受けて帳票をイメージ化する(ステップS1)。次に、レイアウト解析処理部11は、帳票のイメージデータを基に文字列を抽出する(ステップS2)。この文字列の抽出は、既存の技術を用いて行われる。たとえば、帳票のイメージデータを走査し、黒画素が連続する部分に接した外接矩形をラベルとして抽出する。抽出したラベルのうち、しきい値以内の距離にあるラベルは、1つの文字列を構成するラベルとして抽出する。
まず、対応付け処理部12は、見出し文言辞書21を参照して、見出しに対応するデータ部分の文字列の属性および文字列の特徴の情報を取得する(ステップS11)。図6に示したように、文字列の属性としては、文字数、文字種、データ形式、文字列折り返しおよび見出しの総数と1明細行のデータの文字列の数との比を定義している。文字列の特徴としては、見出し部分の行に出現する見出しの項目の順番と、見出しに対応するデータが固定長であるときの文字列幅を定義している。
まず、対応付け処理部12の折り返しデータ統合部20は、固定長データ特定部16が抽出した文字列が固定長のデータ(科目または口座番号のデータ)に着目し、文字列が存在する隣接行の間隔から、文字列の折り返しがある明細行であるか判断し、それぞれの明細行の行数を特定する(ステップS18)。図22を見ると、たとえば、口座番号のデータのある行がデータ部分の1行目と2行目とに連続して存在するため、1行目は、1明細が1行であると判断する。口座番号のデータのある行で2行目の次は、5行目となって2行分の空きがあるので、2行目は、1明細が3行であると判断する。口座番号のデータのある行で5行目の次は、7行目となって1行分の空きがあるので、5行目は、1明細が2行であると判断する。
図23は文字認識装置に用いられるコンピュータのハードウェア構成例を示す図である。
2,7,100 帳票
3,101 明細
4,102 見出し部分
5 データ部分
6 見出しフッタ
10 文字認識装置
11 レイアウト解析処理部
12 対応付け処理部
13 文字認識処理部
14 データ記憶部
15 標準データ特定部
16 固定長データ特定部
17 第1可変長データ特定部
18 第2可変長データ特定部
19 第3可変長データ特定部
20 折り返しデータ統合部
21 見出し文言辞書
22 カテゴリ/フォント別辞書
50 コンピュータ
51 CPU
52 RAM
53 HDD
54 グラフィック処理装置
55 入力インタフェース
56 通信インタフェース
57 バス
58 モニタ
59 キーボード
60 マウス
Claims (10)
- 見出し部分の文字列とデータ部分の文字列とを有する帳票の文字列を認識する文字認識方法において、
前記帳票のイメージデータから抽出した文字列の前記帳票上の位置関係から文字列が横方向に並んだ論理行を抽出し、前記論理行の文字列を認識して明細の見出しの文字列が並ぶ見出し行を抽出し、
見出しの文字列の総数とデータ部分の文字列の数との比が同じ明細行を抽出して見出し部分の見出しの項目をデータ部分の文字列と1対1で対応させ、
見出しに対応するデータ部分の文字列が固定長のデータを特定して見出しの項目と対応させ、
見出しに対応するデータ部分の文字列が可変長であって、文字列の折り返しのない第1可変長データを特定して見出しの項目と対応させ、
見出しに対応するデータ部分の文字列が可変長、かつ文字列の折り返しの可能性があって、見出しとデータ部分の文字列の数とが1対1で対応する第2可変長データを特定して見出しの項目と対応させ、
見出しに対応するデータ部分の文字列が可変長、かつ文字列の折り返しの可能性があって、見出しとデータ部分の文字列の数とが1対Nで対応する第3可変長データを特定して見出しの項目と対応させ、
折り返しにより複数行に跨っている文字列を1つのデータとして統合し、
データ部分の文字列をその見出しの内容に対応したカテゴリの辞書を用いて文字認識する、
ことを特徴とする文字認識方法。 - 前記見出し行を抽出した後に、データ部分の文字列の属性と文字列の特徴とを取得し、見出しに対応する前記明細行の文字列を解析する際に、取得した文字列の属性と文字列の特徴とを基にして見出しに対応する文字列を特定することを特徴とする請求項1記載の文字認識方法。
- 文字列の属性は、文字数、全角漢字か半角数字か半角英数か全角全カテゴリかを示す文字種、固定長か可変長かを示すデータ形式、文字列の折り返しの有無を示す文字列折り返し、および見出しの総数とデータの文字列の数との比を示す文字列数比を含み、文字列の特徴は、見出しの順番および固定長データの幅を示す文字列幅を含んでいることを特徴とする請求項2記載の文字認識方法。
- 見出しの項目をデータ部分の文字列と1対1で対応させた後に、取得した文字列の属性と文字列の特徴とから特定した見出しに対するデータ部分の固定長の文字列に対して文字列の幅を算出し、固定長のデータを特定する際に使用することを特徴とする請求項2記載の文字認識方法。
- 固定長のデータの特定は、データ部分の文字列を、算出された文字列の幅と、取得した文字列の属性および文字列の特徴を基にした文字列の文字数、文字列の文字種および文字列の位置との判断要素で比較し、それぞれの比較の一致率を得点換算し、合計得点で判断されることを特徴とする請求項4記載の文字認識方法。
- 前記第1ないし第3可変長データの特定は、データ部分の文字列を、取得した文字列の属性および文字列の特徴を基にした文字列の文字数、文字列の文字種および文字列の位置との判断要素で比較し、それぞれの比較の一致率を得点換算し、合計得点で判断されることを特徴とする請求項2記載の文字認識方法。
- 文字列の統合は、データ部分の固定長のデータの文字列が存在する隣接行の間隔から1明細行の行数を算出し、複数行の明細行にて折り返しによる前記第2および第3可変長データの文字列を統合することを特徴とする請求項1記載の文字認識方法。
- 帳票のイメージデータから文字列を抽出し、文字列の位置関係から論理行を抽出し、文字列を認識して見出し行を抽出するレイアウト解析処理部と、
見出し部分の文字列とデータ部分の文字列とを対応付ける対応付け処理部と、
データ部分の文字列を認識する文字認識処理部と、
文字列の認識および特定に必要な辞書を格納しているデータ記憶部と、
を備え、
前記対応付け処理部は、
見出しの総数と行のデータの文字列の数との比が同じ行を抽出して見出し部とデータ部とを無条件に対応させる標準データ特定部と、
見出しに対応するデータ部分の文字列が固定長であるデータを特定する固定長データ特定部と、
見出しに対応するデータ部分の文字列が可変長であって、文字列の折り返しのないデータを特定する第1可変長データ特定部と、
見出しに対応するデータ部分の文字列が可変長、かつ文字列の折り返しの可能性があって、見出しと文字列の数とが1対1に対応するデータを特定する第2可変長データ特定部と、
見出しに対応するデータ部分の文字列が可変長、かつ文字列の折り返しの可能性があって、見出しと文字列の数とが1対Nに対応するデータを特定する第3可変長データ特定部と、
折り返しにより複数行に跨っている文字列を1つのデータとして統合する折り返しデータ統合部と、
を有していることを特徴とする文字認識装置。 - 見出し部分の文字列とデータ部分の文字列とを有する帳票の文字列を認識する処理をコンピュータに実行させる文字認識プログラムであって、
前記コンピュータに、
前記帳票のイメージデータから抽出した文字列の前記帳票上の位置関係から文字列が横方向に並んだ論理行を抽出し、前記論理行の文字列を認識して明細の見出しの文字列が並ぶ見出し行を抽出し、
見出しの文字列の総数とデータ部分の文字列の数との比が同じ明細行を抽出して見出し部分の見出しの項目をデータ部分の文字列と1対1で対応させ、
見出しに対応するデータ部分の文字列が固定長のデータを特定して見出しの項目と対応させ、
見出しに対応するデータ部分の文字列が可変長であって、文字列の折り返しのない第1可変長データを特定して見出しの項目と対応させ、
見出しに対応するデータ部分の文字列が可変長、かつ文字列の折り返しの可能性があって、見出しとデータ部分の文字列の数とが1対1で対応する第2可変長データを特定して見出しの項目と対応させ、
見出しに対応するデータ部分の文字列が可変長、かつ文字列の折り返しの可能性があって、見出しとデータ部分の文字列の数とが1対Nで対応する第3可変長データを特定して見出しの項目と対応させ、
折り返しにより複数行に跨っている文字列を1つのデータとして統合し、
データ部分の文字列をその見出しの内容に対応したカテゴリの辞書を用いて文字認識する、
処理を実行させることを特徴とする文字認識プログラム。 - 文字列を統合する処理は、データ部分の固定長のデータの文字列が存在する隣接行の間隔から1明細行の行数を算出し、複数行の明細行にて折り返しによる前記第2および第3可変長データの文字列を統合することを特徴とする請求項9記載の文字認識プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009283087A JP5318742B2 (ja) | 2009-12-14 | 2009-12-14 | 文字認識方法、文字認識装置および文字認識プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009283087A JP5318742B2 (ja) | 2009-12-14 | 2009-12-14 | 文字認識方法、文字認識装置および文字認識プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2011123825A true JP2011123825A (ja) | 2011-06-23 |
JP5318742B2 JP5318742B2 (ja) | 2013-10-16 |
Family
ID=44287627
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009283087A Active JP5318742B2 (ja) | 2009-12-14 | 2009-12-14 | 文字認識方法、文字認識装置および文字認識プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5318742B2 (ja) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2014010795A (ja) * | 2012-07-03 | 2014-01-20 | Fujitsu Ltd | 電子帳票システム及び電子帳票の管理方法並びに電子帳票の管理プログラム |
JP2020030722A (ja) * | 2018-08-24 | 2020-02-27 | ネットスマイル株式会社 | 帳票画像処理システム、帳票画像処理方法、および帳票画像処理プログラム |
JP2020119152A (ja) * | 2019-01-22 | 2020-08-06 | 富士ゼロックス株式会社 | 情報処理装置、及び情報処理プログラム |
JP2021086479A (ja) * | 2019-11-29 | 2021-06-03 | 株式会社リコー | 情報処理システム、情報処理方法及びプログラム |
JP2021193549A (ja) * | 2020-06-05 | 2021-12-23 | ベイジン バイドゥ ネットコム サイエンス テクノロジー カンパニー リミテッド | テーブル認識方法及び装置、電子機器、記憶媒体並びにコンピュータプログラム |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH05334490A (ja) * | 1992-05-29 | 1993-12-17 | Fuji Xerox Co Ltd | 表認識装置 |
JPH07110841A (ja) * | 1993-03-18 | 1995-04-25 | At & T Global Inf Solutions Internatl Inc | 証券処理方法および処理装置 |
JPH11161736A (ja) * | 1997-12-01 | 1999-06-18 | Fujitsu Ltd | 文字認識方法 |
-
2009
- 2009-12-14 JP JP2009283087A patent/JP5318742B2/ja active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH05334490A (ja) * | 1992-05-29 | 1993-12-17 | Fuji Xerox Co Ltd | 表認識装置 |
JPH07110841A (ja) * | 1993-03-18 | 1995-04-25 | At & T Global Inf Solutions Internatl Inc | 証券処理方法および処理装置 |
JPH11161736A (ja) * | 1997-12-01 | 1999-06-18 | Fujitsu Ltd | 文字認識方法 |
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2014010795A (ja) * | 2012-07-03 | 2014-01-20 | Fujitsu Ltd | 電子帳票システム及び電子帳票の管理方法並びに電子帳票の管理プログラム |
JP2020030722A (ja) * | 2018-08-24 | 2020-02-27 | ネットスマイル株式会社 | 帳票画像処理システム、帳票画像処理方法、および帳票画像処理プログラム |
JP2021140831A (ja) * | 2018-08-24 | 2021-09-16 | ネットスマイル株式会社 | 帳票画像処理システム、帳票画像処理方法、および帳票画像処理プログラム |
JP7026386B2 (ja) | 2018-08-24 | 2022-02-28 | ネットスマイル株式会社 | 帳票画像処理システム、帳票画像処理方法、および帳票画像処理プログラム |
JP2020119152A (ja) * | 2019-01-22 | 2020-08-06 | 富士ゼロックス株式会社 | 情報処理装置、及び情報処理プログラム |
JP7383882B2 (ja) | 2019-01-22 | 2023-11-21 | 富士フイルムビジネスイノベーション株式会社 | 情報処理装置、及び情報処理プログラム |
JP2021086479A (ja) * | 2019-11-29 | 2021-06-03 | 株式会社リコー | 情報処理システム、情報処理方法及びプログラム |
JP7456131B2 (ja) | 2019-11-29 | 2024-03-27 | 株式会社リコー | 情報処理システム、情報処理方法及びプログラム |
JP2021193549A (ja) * | 2020-06-05 | 2021-12-23 | ベイジン バイドゥ ネットコム サイエンス テクノロジー カンパニー リミテッド | テーブル認識方法及び装置、電子機器、記憶媒体並びにコンピュータプログラム |
US11636699B2 (en) | 2020-06-05 | 2023-04-25 | Beijing Baidu Netcom Science and Technology Co., Ltd | Method and apparatus for recognizing table, device, medium |
JP7299939B2 (ja) | 2020-06-05 | 2023-06-28 | ベイジン バイドゥ ネットコム サイエンス テクノロジー カンパニー リミテッド | テーブル認識方法及び装置、電子機器、記憶媒体並びにコンピュータプログラム |
Also Published As
Publication number | Publication date |
---|---|
JP5318742B2 (ja) | 2013-10-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4347677B2 (ja) | 帳票ocrプログラム、方法及び装置 | |
JP4996940B2 (ja) | 帳票認識装置およびそのプログラム | |
JP4461769B2 (ja) | 文書検索・閲覧手法及び文書検索・閲覧装置 | |
JP2004139484A (ja) | 帳票処理装置、該装置実行のためのプログラム、及び、帳票書式作成プログラム | |
US20040202352A1 (en) | Enhanced readability with flowed bitmaps | |
JP5318742B2 (ja) | 文字認識方法、文字認識装置および文字認識プログラム | |
JP5385349B2 (ja) | レシート定義データ作成装置およびそのプログラム | |
US11475688B2 (en) | Information processing apparatus and information processing method for extracting information from document image | |
GB2487600A (en) | System for extracting data from an electronic document | |
US20080008391A1 (en) | Method and System for Document Form Recognition | |
JP2005216203A (ja) | 表フォーマットデータ処理方法並びに表フォーマットデータ処理装置 | |
JP2012212293A (ja) | 文書認識装置、文書認識方法、プログラム及び記憶媒体 | |
CN102685347B (zh) | 图像处理装置和图像处理方法 | |
JPH11219394A (ja) | 財務諸表自動入力装置 | |
JP6325218B2 (ja) | 文字認識結果検証装置及び文字読取システム | |
KR20100115048A (ko) | 복사 문서 판별 시스템 및 그 방법 | |
JP6379676B2 (ja) | 出力プログラム、出力装置、および出力方法 | |
JP2007280413A (ja) | 財務諸表自動入力装置 | |
US20240184985A1 (en) | Information representation structure analysis device, and information representation structure analysis method | |
JP2003132078A (ja) | データベース構築装置、データベース構築方法、データベース構築プログラム、記録媒体 | |
JP2020030722A (ja) | 帳票画像処理システム、帳票画像処理方法、および帳票画像処理プログラム | |
WO2023074008A1 (ja) | 文書マスキング装置、文書マスキング方法およびプログラム記憶媒体 | |
WO2023021636A1 (ja) | データ処理装置、データ処理方法及びプログラム | |
JP2010262578A (ja) | 帳票辞書生成装置、帳票識別装置、帳票辞書生成方法、及びプログラム | |
JP2011197844A (ja) | 差分検知システム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20120403 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20130626 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130709 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130710 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5318742 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |