JP4974794B2 - 文書認識装置、文書認識方法、コンピュータプログラム - Google Patents
文書認識装置、文書認識方法、コンピュータプログラム Download PDFInfo
- Publication number
- JP4974794B2 JP4974794B2 JP2007184601A JP2007184601A JP4974794B2 JP 4974794 B2 JP4974794 B2 JP 4974794B2 JP 2007184601 A JP2007184601 A JP 2007184601A JP 2007184601 A JP2007184601 A JP 2007184601A JP 4974794 B2 JP4974794 B2 JP 4974794B2
- Authority
- JP
- Japan
- Prior art keywords
- characteristic value
- cell
- calculation
- document
- value
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Image Analysis (AREA)
Description
上記課題を解決するために、本発明の文書認識装置は、入力文書画像を複数のセルに分割する分割手段と、前記分割手段で分割された各セルについての特性値を導出する特性値導出手段と、前記特性値導出手段で導出された前記入力文書画像についての各セルの特性値と記憶手段に記憶されている登録文書についての各セルの特性値とを用いて、各セルの演算結果を出力する特性値演算手段と、前記特性値演算手段で演算処理の対象となったセルの演算結果の合計値を、当該演算処理の対象となったセルの数で割ることにより、前記登録文書と前記入力文書画像との類似度を計算する類似度計算手段とを有し、前記特性値演算手段は、前記登録文書において前景による特性値がないセルであっても、前記入力文書において前景による特性値があるセルである場合は、前記登録文書において前景による特性値があるセルで且つ前記入力文書において前景による特性値がないセルの場合の演算結果より高い値で、かつ、前記登録文書および前記入力文書の両方において前景による特性値があるセルの場合の演算結果よりも低い値を、前記演算結果として出力することを特徴とする。
上記課題を解決するために、本発明の文書認識装置は、入力文書画像を複数のセルに分割する分割手段と、前記分割手段で分割された各セルについての特性値を導出する特性値導出手段と、前記特性値導出手段で導出された前記入力文書画像についての各セルの特性値と記憶手段に記憶されている登録文書についての各セルの特性値とを用いて、各セルの演算結果を出力する特性値演算手段と、前記特性値演算手段で演算処理の対象となったセルの演算結果の合計値を、当該演算処理の対象となったセルの数で割ることにより、前記登録文書と前記入力文書画像との類似度を計算する類似度計算手段とを有し、前記特性値演算手段は、前記入力文書画像のセルの特性値が前記登録文書のセルの特性値より小さければ前記演算結果は0とし、前記入力文書のセルの特性値が前記登録文書のセルの特性値より大きければ前記演算結果は0よりも大きい第1の値とし、前記入力文書のセルの特性値と前記登録文書のセルの特性値とが0より大きい同じ値であれば前記演算結果は前記第1の値よりも大きい第2の値とすることを特徴とする。
まず、文書フォーム認識技術を適用可能な例について説明する。例えば、病院では、外部の検査機関に検査を依頼するために、医療カルテなどのように個人情報が記載された文書をコピーして、当該コピーを渡す場合がある。そのとき、個人情報が漏洩しないようにするために、カルテ内の個人情報が記載されている部分を黒インクなどで塗りつぶすことが行われているが、作業能率が低く不便である。そこで、医療カルテをコピーする際に、コピー機が、個人情報の記載されている部分を自動的にマスクしてからコピーしてくれれば、ユーザの作業を軽減することができる。しかしながら、医療カルテには、複数の文書フォーマットがあり、個人情報の記載領域は固定位置・固定サイズではない。そこで、予めフォーム(書式)ごとにマスキングテンプレートを対応づけておけば、文書フォーム認識技術を用いて文書のフォーマットを自動識別し、該フォーマットに対応するマスキングテンプレートで、個人情報記載領域を自動的にマスクさせることが可能になる。
また、文書画像のサイズ(大きさ)の正規化は次のようにすればよい。例えば、図11の矩形1106が一定の大きさになるように領域画像1106を拡大または縮小する。その際、所定の大きさと矩形1106が相似形でない場合は、水平方向と垂直方向の拡大・縮小率が異なることになる。以下、所定の大きさに正規化した領域画像1106を正規化文書画像と呼ぶこととする。なお、正規化の手法はこれに限るものではなく、例えば、上下左右の紙端位置が容易に識別できるような場合であれば、その紙端位置に基づいて正規化してもよい。
(類似度)=G+T+H
で計算される。なお、各特性値の種別に応じて適当な重み付けを行って、
(類似度)=α×G+β×T+(1−α−β)×H
という式を用いて類似度を計算してもよい。ここで、α、βは重み付けパラメータであり、また、文書の種類によって適切な重み付け値は異なると考えられるので、対象とする文書を用いて実験的に定めるのが望ましい。
実施形態1では、各セルの特性値として、1、0の2値で表したが、これに限るものではない。例えば、黒画素密度特性値として、黒画素密度が75%以上ならば2、75%より小さく50%以上ならば1、50%より小さければ0というように3値で導出するようにしてもよい。なお、特性値の導出はこれに限るものではない。また、このような場合の演算結果は、例えば、入力文書の特性値の方が登録文書の特性値より小さければ演算結果は0、入力文書の特性値の方が登録文書の特性値より大きければ演算結果は1、どちらの特性値も1または2であれば演算結果は2とする。また、どちらの特性値も0であれば演算対象としないようにする。
なお、本発明の目的は、前述した実施形態の機能を実現するソフトウェアのプログラムコード(コンピュータプログラム)を記憶した、コンピュータ読取可能な記憶媒体を、システムあるいは装置に外部から供給することによっても達成される。また、システムあるいは装置のコンピュータ(CPU)が記憶媒体に格納されたプログラムコードを読出し実行することによっても達成される。
Claims (12)
- 入力文書画像を複数のセルに分割する分割手段と、
前記分割手段で分割された各セルについての特性値を導出する特性値導出手段と、
前記特性値導出手段で導出された前記入力文書画像についての各セルの特性値と記憶手段に記憶されている登録文書についての各セルの特性値とを用いて、各セルの演算結果を出力する特性値演算手段と、
前記特性値演算手段での演算結果に基づいて、前記登録文書と前記入力文書画像との類似度を計算する類似度計算手段と
を有し、
前記特性値導出手段は、前景の特性があるセルの特性値を1、前景の特性がないセルの特性値を0として導出し、
前記特性値演算手段は、前記入力文書画像のセルの特性値が1で前記登録文書のセルの特性値が1ならば前記演算結果を2として出力し、前記入力文書画像のセルの特性値が0で前記登録文書のセルの特性値が1ならば前記演算結果を0として出力し、前記入力文書画像のセルの特性値が1で前記登録文書のセルの特性値が0ならば前記演算結果を1として出力し、前記入力文書画像のセルの特性値と前記登録文書のセルの特性値が共に0ならば特性値演算処理の対象とせず、
前記類似度計算手段は、前記特性値演算手段で演算処理の対象となったセルの演算結果の合計値を、当該演算処理の対象となったセルの数で割ることにより、前記類似度を計算することを特徴とする文書認識装置。 - 入力文書画像を複数のセルに分割する分割手段と、
前記分割手段で分割された各セルについての特性値を導出する特性値導出手段と、
前記特性値導出手段で導出された前記入力文書画像についての各セルの特性値と記憶手段に記憶されている登録文書についての各セルの特性値とを用いて、各セルの演算結果を出力する特性値演算手段と、
前記特性値演算手段で演算処理の対象となったセルの演算結果の合計値を、当該演算処理の対象となったセルの数で割ることにより、前記登録文書と前記入力文書画像との類似度を計算する類似度計算手段と
を有し、
前記特性値演算手段は、前記登録文書において前景による特性値がないセルであっても、前記入力文書において前景による特性値があるセルである場合は、前記登録文書において前景による特性値があるセルで且つ前記入力文書において前景による特性値がないセルの場合の演算結果より高い値で、かつ、前記登録文書および前記入力文書の両方において前景による特性値があるセルの場合の演算結果よりも低い値を、前記演算結果として出力することを特徴とする文書認識装置。 - 前記各セルの特性値は、2値の値もしくは3値の値のいずれかであることを特徴とする請求項2に記載の文書認識装置。
- 入力文書画像を複数のセルに分割する分割手段と、
前記分割手段で分割された各セルについての特性値を導出する特性値導出手段と、
前記特性値導出手段で導出された前記入力文書画像についての各セルの特性値と記憶手段に記憶されている登録文書についての各セルの特性値とを用いて、各セルの演算結果を出力する特性値演算手段と、
前記特性値演算手段で演算処理の対象となったセルの演算結果の合計値を、当該演算処理の対象となったセルの数で割ることにより、前記登録文書と前記入力文書画像との類似度を計算する類似度計算手段と
を有し、
前記特性値演算手段は、前記入力文書画像のセルの特性値が前記登録文書のセルの特性値より小さければ前記演算結果は0とし、前記入力文書のセルの特性値が前記登録文書のセルの特性値より大きければ前記演算結果は0よりも大きい第1の値とし、前記入力文書のセルの特性値と前記登録文書のセルの特性値とが0より大きい同じ値であれば前記演算結果は前記第1の値よりも大きい第2の値とすることを特徴とする文書認識装置。 - 前記特性値導出手段は、前記各セルについての特性値として、複数の種類の特性値を導出することを特徴とする請求項2乃至4のいずれか一項に記載の文書認識装置。
- 前記特性値導出手段で前記特性値を導出するよりも前に、前記入力文書画像の大きさの正規化を行うことを特徴とする請求項1乃至5のいずれか一項に記載の文書認識装置。
- 前記特性値演算手段は、入力文書画像に関する特性値と登録文書に関する特性値とに対して前記演算結果が対応付けられている特性値演算テーブルを用いて、前記各セルに対する演算を行い、前記各セルの演算結果を出力することを特徴とする請求項1乃至6のいずれか一項に記載の文書認識装置。
- 分割手段が、入力文書画像を複数のセルに分割する分割ステップと、
特性値導出手段が、前記分割ステップで分割された各セルについての特性値を導出する特性値導出ステップと、
特性値演算手段が、前記特性値導出ステップで導出された前記入力文書画像についての各セルの特性値と記憶手段に記憶されている登録文書についての各セルの特性値とを用いて、各セルの演算結果を出力する特性値演算ステップと、
類似度計算手段が、前記特性値演算ステップでの演算結果に基づいて、前記登録文書と前記入力文書画像との類似度を計算する類似度計算ステップと
を有し、
前記特性値導出ステップでは、前景の特性があるセルの特性値を1、前景の特性がないセルの特性値を0として導出し、
前記特性値演算ステップでは、前記入力文書画像のセルの特性値が1で前記登録文書のセルの特性値が1ならば前記演算結果を2として出力し、前記入力文書画像のセルの特性値が0で前記登録文書のセルの特性値が1ならば前記演算結果を0として出力し、前記入力文書画像のセルの特性値が1で前記登録文書のセルの特性値が0ならば前記演算結果を1として出力し、前記入力文書画像のセルの特性値と前記登録文書のセルの特性値が共に0ならば特性値演算処理の対象とせず、
前記類似度計算ステップでは、前記特性値演算ステップで演算処理の対象となったセルの演算結果の合計値を、当該演算処理の対象となったセルの数で割ることにより、前記類似度を計算することを特徴とする文書認識方法。 - コンピュータを、
入力文書画像を複数のセルに分割する分割手段、
前記分割手段で分割された各セルについての特性値を導出する特性値導出手段、
前記特性値導出手段で導出された前記入力文書画像についての各セルの特性値と記憶手段に記憶されている登録文書についての各セルの特性値とを用いて、各セルの演算結果を出力する特性値演算手段、
前記特性値演算手段での演算結果に基づいて、前記登録文書と前記入力文書画像との類似度を計算する類似度計算手段、
として機能させるためのコンピュータプログラムであって、
前記特性値導出手段は、前景の特性があるセルの特性値を1、前景の特性がないセルの特性値を0として導出し、
前記特性値演算手段は、前記入力文書画像のセルの特性値が1で前記登録文書のセルの特性値が1ならば前記演算結果を2として出力し、前記入力文書画像のセルの特性値が0で前記登録文書のセルの特性値が1ならば前記演算結果を0として出力し、前記入力文書画像のセルの特性値が1で前記登録文書のセルの特性値が0ならば前記演算結果を1として出力し、前記入力文書画像のセルの特性値と前記登録文書のセルの特性値が共に0ならば特性値演算処理の対象とせず、
前記類似度計算手段は、前記特性値演算手段で演算処理の対象となったセルの演算結果の合計値を、当該演算処理の対象となったセルの数で割ることにより、前記類似度を計算することを特徴とするコンピュータプログラム。 - コンピュータを、
入力文書画像を複数のセルに分割する分割手段、
前記分割手段で分割された各セルについての特性値を導出する特性値導出手段、
前記特性値導出手段で導出された前記入力文書画像についての各セルの特性値と記憶手段に記憶されている登録文書についての各セルの特性値とを用いて、各セルの演算結果を出力する特性値演算手段、
前記特性値演算手段で演算処理の対象となったセルの演算結果の合計値を、当該演算処理の対象となったセルの数で割ることにより、前記登録文書と前記入力文書画像との類似度を計算する類似度計算手段、
として機能させるためのコンピュータプログラムであって、
前記特性値演算手段は、前記登録文書において前景による特性値がないセルであっても、前記入力文書において前景による特性値があるセルである場合は、前記登録文書において前景による特性値があるセルで且つ前記入力文書において前景による特性値がないセルの場合の演算結果より高い値で、かつ、前記登録文書および前記入力文書の両方において前景による特性値があるセルの場合の演算結果よりも低い値を、前記演算結果として出力することを特徴とするコンピュータプログラム。 - コンピュータを、
入力文書画像を複数のセルに分割する分割手段、
前記分割手段で分割された各セルについての特性値を導出する特性値導出手段、
前記特性値導出手段で導出された前記入力文書画像についての各セルの特性値と記憶手段に記憶されている登録文書についての各セルの特性値とを用いて、各セルの演算結果を出力する特性値演算手段、
前記特性値演算手段で演算処理の対象となったセルの演算結果の合計値を、当該演算処理の対象となったセルの数で割ることにより、前記登録文書と前記入力文書画像との類似度を計算する類似度計算手段、
として機能させるためのコンピュータプログラムであって、
前記特性値演算手段は、前記入力文書画像のセルの特性値が前記登録文書のセルの特性値より小さければ前記演算結果は0とし、前記入力文書のセルの特性値が前記登録文書のセルの特性値より大きければ前記演算結果は0よりも大きい第1の値とし、前記入力文書のセルの特性値と前記登録文書のセルの特性値とが0より大きい同じ値であれば前記演算結果は前記第1の値よりも大きい第2の値とすることを特徴とするコンピュータプログラム。 - 請求項9乃至11のいずれか一項に記載のコンピュータプログラムを記憶した、コンピュータ読み取り可能な記憶媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007184601A JP4974794B2 (ja) | 2007-07-13 | 2007-07-13 | 文書認識装置、文書認識方法、コンピュータプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007184601A JP4974794B2 (ja) | 2007-07-13 | 2007-07-13 | 文書認識装置、文書認識方法、コンピュータプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2009020816A JP2009020816A (ja) | 2009-01-29 |
JP4974794B2 true JP4974794B2 (ja) | 2012-07-11 |
Family
ID=40360386
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007184601A Expired - Fee Related JP4974794B2 (ja) | 2007-07-13 | 2007-07-13 | 文書認識装置、文書認識方法、コンピュータプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4974794B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113536951B (zh) * | 2021-06-22 | 2023-11-24 | 科大讯飞股份有限公司 | 表格识别方法及相关装置和电子设备、存储介质 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006031181A (ja) * | 2004-07-13 | 2006-02-02 | Canon Inc | 画像検索装置、方法、記憶媒体及びプログラム |
JP4895340B2 (ja) * | 2005-03-31 | 2012-03-14 | キヤノン株式会社 | 情報処理装置およびその方法 |
JP2007172077A (ja) * | 2005-12-19 | 2007-07-05 | Fuji Xerox Co Ltd | 画像検索システム及び方法及びプログラム |
JP4533273B2 (ja) * | 2005-08-09 | 2010-09-01 | キヤノン株式会社 | 画像処理装置及び画像処理方法、プログラム |
-
2007
- 2007-07-13 JP JP2007184601A patent/JP4974794B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2009020816A (ja) | 2009-01-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8442319B2 (en) | System and method for classifying connected groups of foreground pixels in scanned document images according to the type of marking | |
US8331670B2 (en) | Method of detection document alteration by comparing characters using shape features of characters | |
CN114299528B (zh) | 一种针对扫描文档的信息提取和结构化方法 | |
US20110222776A1 (en) | Form template definition method and form template definition apparatus | |
US8027539B2 (en) | Method and apparatus for determining an orientation of a document including Korean characters | |
US8280175B2 (en) | Document processing apparatus, document processing method, and computer readable medium | |
CN112183038A (zh) | 一种表格识别套打方法、计算机设备及计算机可读存储介质 | |
US20060285748A1 (en) | Document processing device | |
US7796817B2 (en) | Character recognition method, character recognition device, and computer product | |
US11574489B2 (en) | Image processing system, image processing method, and storage medium | |
US11983910B2 (en) | Image processing system, image processing method, and storage medium each for obtaining pixels of object using neural network | |
US11418658B2 (en) | Image processing apparatus, image processing system, image processing method, and storage medium | |
US20130050765A1 (en) | Method and apparatus for document authentication using image comparison on a block-by-block basis | |
EP3151159A1 (en) | Information processing apparatus, information processing method and program | |
US6968501B2 (en) | Document format identification apparatus and method | |
JP4275973B2 (ja) | 加筆画像抽出装置、プログラム、記憶媒体及び加筆画像抽出方法 | |
US20160343142A1 (en) | Object Boundary Detection in an Image | |
CN112800824A (zh) | 扫描文件的处理方法、装置、设备及存储介质 | |
KR20150099116A (ko) | Ocr를 이용한 컬러 문자 인식 방법 및 그 장치 | |
JP4974794B2 (ja) | 文書認識装置、文書認識方法、コンピュータプログラム | |
JP4281236B2 (ja) | 画像認識装置、画像認識方法、および、画像認識プログラムを記憶したコンピュータ読取り可能な記録媒体 | |
US6678427B1 (en) | Document identification registration system | |
US20220335738A1 (en) | Image processing system, image processing method, and storage medium | |
WO2023062799A1 (ja) | 情報処理システム、原稿種識別方法、モデル生成方法及びプログラム | |
JP2007328652A (ja) | 画像処理装置および画像処理プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20100201 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20100625 |
|
RD01 | Notification of change of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7421 Effective date: 20100630 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110913 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20111114 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120313 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120410 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150420 Year of fee payment: 3 |
|
LAPS | Cancellation because of no payment of annual fees |