JP2012155662A - 文書処理装置及び文書処理方法 - Google Patents
文書処理装置及び文書処理方法 Download PDFInfo
- Publication number
- JP2012155662A JP2012155662A JP2011016490A JP2011016490A JP2012155662A JP 2012155662 A JP2012155662 A JP 2012155662A JP 2011016490 A JP2011016490 A JP 2011016490A JP 2011016490 A JP2011016490 A JP 2011016490A JP 2012155662 A JP2012155662 A JP 2012155662A
- Authority
- JP
- Japan
- Prior art keywords
- character string
- character
- dictionary
- handwritten
- characters
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Character Discrimination (AREA)
Abstract
【解決手段】活字文字の特徴量を示す情報を含む活字文字認識用辞書及び手書き文字の特徴量を示す情報を含む手書き文字認識用辞書を保持し、前記入力装置を介して入力された手書き文字列及び活字文字列を含む画像データを取得し、前記活字文字認識用辞書を用いて前記活字文字列を認識し、前記活字文字列の認識結果として取得した文字列を文字列パターン辞書として前記記憶装置に格納し、前記手書き文字認識用辞書及び前記文字列パターン辞書を用いて前記手書き文字列を認識し、前記出力装置を介して前記手書き文字列の認識結果を出力する文書処理装置。
【選択図】図1
Description
11、110 入力装置
111 画像入力装置
12 表示装置
13 CPU
14 印刷装置
15 ワークエリア
151 OS
152 通信プログラム
153 文書処理プログラム
154 文字認識プログラム
16 情報保持手段
161 活字文字認識用辞書
162 手書き文字認識用辞書
163 外字・ローマ字辞書
164 配置知識辞書
165 項目名辞書
166 データ文字列パターン辞書
19 通信ネットワーク
21 ファイルサーバ
Claims (10)
- 入力装置と、前記入力装置に接続されたプロセッサと、前記プロセッサに接続された記憶装置と、前記プロセッサに接続された出力装置と、を備える文書処理装置であって、
前記記憶装置は、活字文字の特徴量を示す情報を含む活字文字認識用辞書及び手書き文字の特徴量を示す情報を含む手書き文字認識用辞書を保持し、
前記プロセッサは、
前記入力装置を介して入力された手書き文字列及び活字文字列を含む画像データを取得し、
前記活字文字認識用辞書を用いて前記活字文字列を認識し、
前記活字文字列の認識結果として取得した文字列を文字列パターン辞書として前記記憶装置に格納し、
前記手書き文字認識用辞書及び前記文字列パターン辞書を用いて前記手書き文字列を認識し、
前記出力装置を介して前記手書き文字列の認識結果を出力することを特徴とする文書処理装置。 - 前記プロセッサは、
前記手書き文字認識用辞書に基づいて、前記手書き文字列の認識結果の候補として複数の文字列を生成し、
前記生成された複数の文字列から、前記文字列パターン辞書に含まれる文字列を検索し、
前記検索によって取得した文字列を、前記手書き文字列の認識結果として取得することを特徴とする請求項1に記載の文書処理装置。 - 前記記憶装置は、予め、複数の文字、前記複数の文字間の接続、及び前記接続の起こりやすさを示すスコアを含む前記文字列パターン辞書を保持し、
前記プロセッサは、前記活字文字列の認識結果として取得した文字列を前記文字列パターン辞書に追加することを特徴とする請求項1又は2に記載の文書処理装置。 - 前記プロセッサは、前記活字文字列の認識結果として取得した文字列及びその文字列に含まれる文字間の接続が既に前記文字列パターン辞書に登録されている場合、前記登録されている文字間の接続に関する前記スコアの値を増加させ、前記活字文字列の認識結果として取得した文字列及びその文字列に含まれる文字間の接続が前記文字列パターン辞書に登録されていない場合、前記活字文字列の認識結果として取得した文字列に含まれる文字、それらの文字間の接続及びその接続の起こりやすさを示すスコアを新たに前記文字列パターン辞書に登録することによって、前記活字文字列の認識結果として取得した文字列を前記文字列パターン辞書に追加することを特徴とする請求項3に記載の文書処理装置。
- 前記記憶装置は、同一と判定される複数の文字又は文字列を対応付ける置換辞書をさらに保持し、
前記プロセッサは、前記置換辞書に基づいて、前記活字文字列の認識結果として取得した文字列に含まれる文字又は文字列を、それと同一と判定される文字又は文字列に置き換えた文字列を生成し、前記生成された文字列を前記文字列パターン辞書として前記記憶装置に格納することを特徴とする請求項1から4のいずれか一つに記載の文書処理装置。 - 入力装置と、前記入力装置に接続されたプロセッサと、前記プロセッサに接続された記憶装置と、前記プロセッサに接続された出力装置と、を備える装置が実行する文書処理方法であって、
前記記憶装置は、活字文字の特徴量を示す情報を含む活字文字認識用辞書及び手書き文字の特徴量を示す情報を含む手書き文字認識用辞書を保持し、
前記文書処理方法は、
前記プロセッサが、前記入力装置を介して入力された手書き文字列及び活字文字列を含む画像データを取得する第1手順と、
前記プロセッサが、前記活字文字認識用辞書を用いて前記活字文字列を認識する第2手順と、
前記プロセッサが、前記活字文字列の認識結果として取得した文字列を文字列パターン辞書として前記記憶装置に格納する第3手順と、
前記プロセッサが、前記手書き文字認識用辞書及び前記文字列パターン辞書を用いて前記手書き文字列を認識する第4手順と、
前記プロセッサが、前記出力装置を介して前記手書き文字列の認識結果を出力する第5手順と、を含むことを特徴とする文書処理方法。 - 前記第4手順は、
前記プロセッサが、前記手書き文字認識用辞書に基づいて、前記手書き文字列の認識結果の候補として複数の文字列を生成する手順と、
前記プロセッサが、前記生成された複数の文字列から、前記文字列パターン辞書に含まれる文字列を検索する手順と、
前記プロセッサが、前記検索によって取得した文字列を、前記手書き文字列の認識結果として取得する手順と、を含むことを特徴とする請求項6に記載の文書処理方法。 - 前記記憶装置は、予め、複数の文字、前記複数の文字間の接続、及び前記接続の起こりやすさを示すスコアを含む前記文字列パターン辞書を保持し、
前記第3手順は、前記プロセッサが、前記活字文字列の認識結果として取得した文字列を前記文字列パターン辞書に追加する第6手順を含むことを特徴とする請求項6又は7に記載の文書処理方法。 - 前記第6手順は、前記活字文字列の認識結果として取得した文字列及びその文字列に含まれる文字間の接続が既に前記文字列パターン辞書に登録されている場合、前記プロセッサが、前記登録されている文字間の接続に関する前記スコアの値を増加させ、前記活字文字列の認識結果として取得した文字列及びその文字列に含まれる文字間の接続が前記文字列パターン辞書に登録されていない場合、前記プロセッサが、前記活字文字列の認識結果として取得した文字列に含まれる文字、それらの文字間の接続及びその接続の起こりやすさを示すスコアを新たに前記文字列パターン辞書に登録する手順を含むことを特徴とする請求項8に記載の文書処理方法。
- 前記記憶装置は、同一と判定される複数の文字又は文字列を対応付ける置換辞書をさらに保持し、
前記文書処理方法は、さらに、前記プロセッサが、前記置換辞書に基づいて、前記活字文字列の認識結果として取得した文字列に含まれる文字又は文字列を、それと同一と判定される文字又は文字列に置き換えた文字列を生成する手順を含み、
前記第3手順は、前記生成された文字列を前記文字列パターン辞書として前記記憶装置に格納する手順を含むことを特徴とする請求項6から9のいずれか一つに記載の文書処理方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011016490A JP5669041B2 (ja) | 2011-01-28 | 2011-01-28 | 文書処理装置及び文書処理方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011016490A JP5669041B2 (ja) | 2011-01-28 | 2011-01-28 | 文書処理装置及び文書処理方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2012155662A true JP2012155662A (ja) | 2012-08-16 |
JP5669041B2 JP5669041B2 (ja) | 2015-02-12 |
Family
ID=46837293
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011016490A Expired - Fee Related JP5669041B2 (ja) | 2011-01-28 | 2011-01-28 | 文書処理装置及び文書処理方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5669041B2 (ja) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2016139326A (ja) * | 2015-01-28 | 2016-08-04 | キヤノン株式会社 | 個人番号管理システムとその制御方法、及び画像処理装置とその制御方法、及びプログラム |
JP2018101327A (ja) * | 2016-12-21 | 2018-06-28 | 大日本印刷株式会社 | データ登録装置及びデータ登録方法 |
JP2018163413A (ja) * | 2017-03-24 | 2018-10-18 | 沖電気工業株式会社 | 情報処理装置、プログラムおよび情報処理方法 |
US10956509B2 (en) | 2018-09-13 | 2021-03-23 | Hitachi, Ltd. | Material development assistance system and material development assistance method |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH021353A (ja) * | 1988-06-08 | 1990-01-05 | Konica Corp | 画像処理方法及び画像処理システム |
JPH064717A (ja) * | 1992-06-19 | 1994-01-14 | Pfu Ltd | 漢字住所補正処理方法 |
JP2006092027A (ja) * | 2004-09-21 | 2006-04-06 | Fuji Xerox Co Ltd | 文字認識装置、文字認識方法および文字認識プログラム |
-
2011
- 2011-01-28 JP JP2011016490A patent/JP5669041B2/ja not_active Expired - Fee Related
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH021353A (ja) * | 1988-06-08 | 1990-01-05 | Konica Corp | 画像処理方法及び画像処理システム |
JPH064717A (ja) * | 1992-06-19 | 1994-01-14 | Pfu Ltd | 漢字住所補正処理方法 |
JP2006092027A (ja) * | 2004-09-21 | 2006-04-06 | Fuji Xerox Co Ltd | 文字認識装置、文字認識方法および文字認識プログラム |
Non-Patent Citations (2)
Title |
---|
CSNG200600212001; 永崎 健: 'OCRの文字切出し誤りを許容した文書検索システムの開発' 電子情報通信学会技術研究報告 Vol.103 No.658 , 20040212, p.1〜6, 社団法人電子情報通信学会 * |
JPN6014018826; 永崎 健: 'OCRの文字切出し誤りを許容した文書検索システムの開発' 電子情報通信学会技術研究報告 Vol.103 No.658 , 20040212, p.1〜6, 社団法人電子情報通信学会 * |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2016139326A (ja) * | 2015-01-28 | 2016-08-04 | キヤノン株式会社 | 個人番号管理システムとその制御方法、及び画像処理装置とその制御方法、及びプログラム |
JP2018101327A (ja) * | 2016-12-21 | 2018-06-28 | 大日本印刷株式会社 | データ登録装置及びデータ登録方法 |
JP2018163413A (ja) * | 2017-03-24 | 2018-10-18 | 沖電気工業株式会社 | 情報処理装置、プログラムおよび情報処理方法 |
US10956509B2 (en) | 2018-09-13 | 2021-03-23 | Hitachi, Ltd. | Material development assistance system and material development assistance method |
Also Published As
Publication number | Publication date |
---|---|
JP5669041B2 (ja) | 2015-02-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9740692B2 (en) | Creating flexible structure descriptions of documents with repetitive non-regular structures | |
US20170323170A1 (en) | Method and system for data extraction from images of semi-structured documents | |
US8677445B2 (en) | Information processing apparatus and computer readable medium | |
US10963717B1 (en) | Auto-correction of pattern defined strings | |
US20190294912A1 (en) | Image processing device, image processing method, and image processing program | |
JP2016048444A (ja) | 帳票識別プログラム、帳票識別装置、帳票識別システム、および帳票識別方法 | |
JP4733577B2 (ja) | 帳票認識装置及び帳票認識プログラム | |
JP6743445B2 (ja) | 携帯型情報装置およびプログラム | |
JP2005173730A (ja) | 帳票ocrプログラム、方法及び装置 | |
CN110785773A (zh) | 票据识别系统 | |
JP5669041B2 (ja) | 文書処理装置及び文書処理方法 | |
US10896292B1 (en) | OCR error correction | |
JP5357711B2 (ja) | 文書処理装置 | |
JP5243054B2 (ja) | データ管理システムおよび方法並びにプログラム | |
JP2008282094A (ja) | 文字認識処理装置 | |
EP4141818A1 (en) | Document digitization, transformation and validation | |
JP7021496B2 (ja) | 情報処理装置及びプログラム | |
US11972208B2 (en) | Information processing device and information processing method | |
JP4347675B2 (ja) | 帳票ocrプログラム、方法及び装置 | |
JP2020047031A (ja) | 文書検索装置、文書検索システム及びプログラム | |
US20210056301A1 (en) | Information processing apparatus and non-transitory computer readable medium storing information processing program | |
JP6217403B2 (ja) | 手書き金額記入欄のチェック画面出力方法、手書き金額記入欄のチェック画面出力プログラム、および手書き金額記入欄のチェック画面出力装置 | |
JP5252487B2 (ja) | 情報処理装置、その制御方法、制御プログラム、および記録媒体 | |
JP2010205122A (ja) | レイアウト構造解析装置及びレイアウト構造解析方法 | |
US20180267999A1 (en) | Search apparatus, search system, and non-transitory computer readable medium |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20130612 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20140410 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20140513 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20140630 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20141118 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20141205 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5669041 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |