JP2019057174A - スキャン画像から文字情報を取得する画像処理装置、画像処理方法、及びプログラム - Google Patents
スキャン画像から文字情報を取得する画像処理装置、画像処理方法、及びプログラム Download PDFInfo
- Publication number
- JP2019057174A JP2019057174A JP2017181698A JP2017181698A JP2019057174A JP 2019057174 A JP2019057174 A JP 2019057174A JP 2017181698 A JP2017181698 A JP 2017181698A JP 2017181698 A JP2017181698 A JP 2017181698A JP 2019057174 A JP2019057174 A JP 2019057174A
- Authority
- JP
- Japan
- Prior art keywords
- image
- binary image
- ocr
- character
- processing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N1/00—Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
- H04N1/00127—Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture
- H04N1/00326—Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture with a data reading, recognizing or recording apparatus, e.g. with a bar-code apparatus
- H04N1/00328—Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture with a data reading, recognizing or recording apparatus, e.g. with a bar-code apparatus with an apparatus processing optically-read information
- H04N1/00331—Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture with a data reading, recognizing or recording apparatus, e.g. with a bar-code apparatus with an apparatus processing optically-read information with an apparatus performing optical character recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/413—Classification of content, e.g. text, photographs or tables
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N2201/00—Indexing scheme relating to scanning, transmission or reproduction of documents or the like, and to details thereof
- H04N2201/0077—Types of the still picture apparatus
- H04N2201/0094—Multifunctional device, i.e. a device capable of all of reading, reproducing, copying, facsimile transception, file transception
Abstract
【解決手段】スキャン画像から文字情報を取得する画像処理装置であって、第1の二値化手法で前記スキャン画像を二値化して得た二値画像に対し領域分割処理を行って、テキスト領域を抽出する解析手段と、OCR処理で用いる二値画像を決定する決定手段と、前記解析手段で抽出された前記テキスト領域に対し、前記決定手段で決定した二値画像を用いて前記OCR処理を行なう文字認識手段と、を備え、前記決定手段は、前記領域分割処理で用いた二値画像が前記OCR処理に適している場合、当該二値画像を前記OCR処理で用いる二値画像として決定し、前記領域分割処理で用いた二値画像が前記OCR処理に適していない場合、前記第1の二値化手法よりも精度の高い第2の二値化手法によって二値画像を生成し、当該生成した二値画像を前記OCR処理で用いる二値画像として決定する、ことを特徴とする。
【選択図】図11
Description
図1は、本実施例に係る画像処理システムの全体構成を示す図である。画像処理システムは、MFP110とファイルサーバ120とで構成され、LAN(Local Area Network)を介して互いに通信可能に接続されている。
図4は、MFP110のソフトウェア構成図である。MFP110のソフトウェアは、ネイティブ機能モジュール410とアディショナル機能モジュール420の大きく2つに分けられる。ネイティブ機能モジュール410に含まれる各部は、MFP110に標準的に備えられた機能モジュールである。これに対し、アディショナル機能モジュール420に含まれる各部は、MFP110に追加的に備わる機能モジュールであり、例えばアプリケーションのインストールによって実現される機能モジュールである。本実施例におけるアディショナル機能モジュール420は、Java(登録商標)をベースとしたアプリケーションであり、MFP110への機能追加を容易に実現できる。なお、MFP110には図示しない他のアプリケーションがインストールされていても良い。以下、両機能モジュール410及ぶ420を構成する各部について説明する。
図10は、プレビュー表示部426におけるファイル名生成処理(ステップ507)の詳細を示すフローチャートである。以下、図10のフローに沿って説明する。
上述の実施例では、領域分割向けに生成した二値画像がOCR処理に適しているかどうかの状態判定を行い、二値画像の状態がOCR処理に適していない場合だけ、ユーザ選択に係る行領域に対して二値化処理を再度行っていた。このような二値画像の状態判定を行うことなく、ユーザ選択に係る行領域に対しては一律に、高精度の二値化処理を行なうようにしてもよい。この場合、後続のOCR処理に対する影響を考慮する必要がなくなるので、領域分割向けの二値化処理においてより簡易かつ高速な手法を採用することが可能となる。
本発明は、上述の実施形態の1以上の機能を実現するプログラムを、ネットワーク又は記憶媒体を介してシステム又は装置に供給し、そのシステム又は装置のコンピュータにおける1つ以上のプロセッサーがプログラムを読出し実行する処理でも実現可能である。また、1以上の機能を実現する回路(例えば、ASIC)によっても実現可能である。
Claims (14)
- スキャン画像から文字情報を取得する画像処理装置であって、
第1の二値化手法で前記スキャン画像を二値化して得た二値画像に対し領域分割処理を行って、テキスト領域を抽出する解析手段と、
OCR処理で用いる二値画像を決定する決定手段と、
前記解析手段で抽出された前記テキスト領域に対し、前記決定手段で決定した二値画像を用いて前記OCR処理を行なう文字認識手段と、
を備え、
前記決定手段は、
前記領域分割処理で用いた二値画像が前記OCR処理に適している場合、当該二値画像を前記OCR処理で用いる二値画像として決定し、
前記領域分割処理で用いた二値画像が前記OCR処理に適していない場合、前記第1の二値化手法よりも精度の高い第2の二値化手法によって二値画像を生成し、当該生成した二値画像を前記OCR処理で用いる二値画像として決定する
ことを特徴とする画像処理装置。 - 前記決定手段は、抽出された前記テキスト領域に含まれる1文字単位の外接矩形を表す文字枠の縦横比に基づき、二値画像が前記OCR処理に適した状態かどうかを判定することを特徴とする請求項1に記載の画像処理装置。
- 前記領域分割処理では、前記テキスト領域を行単位で分割した行領域を抽出し、
前記決定手段は、前記行領域に含まれる前記文字枠の縦横比の平均値に基づき、前記判定を行う
ことを特徴とする請求項2に記載の画像処理装置。 - 前記決定手段は、前記行領域に含まれる文字枠の縦横比の平均値と、予め保持された所定のフォントにおける文字枠の縦横比の平均値とを比較することにより、前記判定を行うことを特徴とする請求項3に記載の画像処理装置。
- 前記決定手段は、さらに、前記行領域に含まれる文字枠のうち一部の文字枠に対して前記OCR処理を行い、得られた文字認識結果の信頼度に基づいて、前記判定を行うことを特徴とする請求項3乃至4のいずれか1項に記載の画像処理装置。
- 前記決定手段は、前記信頼度の基準となる閾値を予め保持し、前記得られた文字認識結果の信頼度と前記閾値との比較処理によって、前記判定を行うことを特徴とする請求項5に記載の画像処理装置。
- 前記信頼度は、前記文字認識結果における特徴量の一致率であることを特徴とする請求項6に記載の画像処理装置。
- 前記第1の二値化手法は、前記第2の二値化手法よりも処理速度が早い二値化手法であることを特徴とする請求項1乃至7のいずれか1項に記載の画像処理装置。
- 前記第1の二値化手法は、単一の閾値を用いる二値化手法であり、
前記第2の二値化手法は、複数の閾値を用いる二値化手法である
ことを特徴とする請求項1乃至8のいずれか1項に記載の画像処理装置。 - 前記領域分割処理で抽出された複数の行領域のうち、任意の行領域の選択を受け付けるユーザインタフェースをさらに備え、
前記決定手段は、前記ユーザインタフェースを介してユーザが選択した行領域を対象に、前記第2の二値化手法によって二値画像を生成する
ことを特徴とする請求項3乃至7のいずれか1項に記載の画像処理装置。 - 前記文字認識手段は、ユーザが前記選択を行うまでの間、前記第1の二値化手法によって前記スキャン画像を二値化して得られた二値画像に含まれる各行領域に対し、所定の条件にしたがってOCR処理を予め実行し、
前記決定手段は、前記予め実行するOCR処理で得られた文字認識結果の信頼度が所定の基準を満たさない場合、前記第2の二値化手法によって二値画像を生成し、当該生成した二値画像を用いてOCR処理を再度実行する
ことを特徴とする請求項10に記載の画像処理装置。 - 前記所定の条件は、前記ユーザインタフェースに表示されている範囲を少なくとも含む所定の範囲に存在する行領域の方が、当該所定の範囲外に存在する行領域よりも優先順位が高い、であることを特徴とする請求項11に記載の画像処理装置。
- スキャン画像から文字情報を取得する画像処理方法であって、
第1の二値化手法で前記スキャン画像を二値化して得た二値画像に対し領域分割処理を行って、テキスト領域を抽出する解析ステップと、
OCR処理で用いる二値画像を決定する決定ステップと、
前記解析ステップで抽出された前記テキスト領域に対し、前記決定ステップで決定した二値画像を用いて前記OCR処理を行なう文字認識ステップと、
を含み、
前記決定ステップでは、
前記領域分割処理で用いた二値画像が前記OCR処理に適している場合、当該二値画像を前記OCR処理で用いる二値画像として決定し、
前記領域分割処理で用いた二値画像が前記OCR処理に適していない場合、前記第1の二値化手法よりも精度の高い第2の二値化手法によって二値画像を生成し、当該生成した二値画像を前記OCR処理で用いる二値画像として決定する
ことを特徴とする画像処理方法。 - コンピュータを、請求項1乃至12のいずれか1項に記載の画像処理装置として機能させるためのプログラム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017181698A JP7030462B2 (ja) | 2017-09-21 | 2017-09-21 | スキャン画像から文字情報を取得する画像処理装置、画像処理方法、及びプログラム |
US16/128,972 US10574839B2 (en) | 2017-09-21 | 2018-09-12 | Image processing apparatus, method and storage medium for acquiring character information from scanned image |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017181698A JP7030462B2 (ja) | 2017-09-21 | 2017-09-21 | スキャン画像から文字情報を取得する画像処理装置、画像処理方法、及びプログラム |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2019057174A true JP2019057174A (ja) | 2019-04-11 |
JP2019057174A5 JP2019057174A5 (ja) | 2020-08-06 |
JP7030462B2 JP7030462B2 (ja) | 2022-03-07 |
Family
ID=65720853
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017181698A Active JP7030462B2 (ja) | 2017-09-21 | 2017-09-21 | スキャン画像から文字情報を取得する画像処理装置、画像処理方法、及びプログラム |
Country Status (2)
Country | Link |
---|---|
US (1) | US10574839B2 (ja) |
JP (1) | JP7030462B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2023505663A (ja) * | 2019-12-05 | 2023-02-10 | 嘉楠明芯(北京)科技有限公司 | 文字分割方法、装置、および、コンピュータ可読記憶媒体 |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6968647B2 (ja) * | 2017-10-03 | 2021-11-17 | キヤノン株式会社 | スキャン画像にファイル名を設定するための装置、その制御方法及びプログラム |
JP6983675B2 (ja) * | 2018-01-23 | 2021-12-17 | キヤノン株式会社 | スキャン画像に関連する情報を設定するための装置、方法、プログラム、およびシステム |
JP7330742B2 (ja) * | 2019-04-19 | 2023-08-22 | キヤノン株式会社 | スキャン画像にプロパティを設定するための画像処理装置、その制御方法及びプログラム |
JP7225017B2 (ja) * | 2019-04-19 | 2023-02-20 | キヤノン株式会社 | タッチパネルを用いた文字入力のための画像処理装置、その制御方法及びプログラム |
CN111918065A (zh) * | 2019-05-08 | 2020-11-10 | 中兴通讯股份有限公司 | 一种信息压缩/解压缩方法及装置 |
JP7400548B2 (ja) * | 2020-03-03 | 2023-12-19 | 富士フイルムビジネスイノベーション株式会社 | 情報処理装置、画像処理装置、情報処理システム、及びプログラム |
JP2022011034A (ja) * | 2020-06-29 | 2022-01-17 | キヤノン株式会社 | データ入力支援装置、データ入力支援方法及びプログラム |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0535921A (ja) * | 1991-07-26 | 1993-02-12 | Sumitomo Metal Ind Ltd | 文字照合装置及びそのための方法 |
JPH08272902A (ja) * | 1995-04-03 | 1996-10-18 | Fuji Electric Co Ltd | 異字体異品質文字の認識方法 |
JPH09305709A (ja) * | 1996-05-10 | 1997-11-28 | Kobe Steel Ltd | 画像認識方法及びその装置 |
JP2001043313A (ja) * | 1999-07-30 | 2001-02-16 | Toshiba Corp | 文字切出し方法 |
JP2006172284A (ja) * | 2004-12-17 | 2006-06-29 | Canon Inc | 画像処理装置、画像処理方法、コンピュータプログラム |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH11232388A (ja) | 1998-02-10 | 1999-08-27 | Hitachi Ltd | 文書・帳票認識システム |
JP2007304864A (ja) | 2006-05-11 | 2007-11-22 | Fuji Xerox Co Ltd | 文字認識処理システムおよび文字認識処理プログラム |
JP4590433B2 (ja) | 2007-06-29 | 2010-12-01 | キヤノン株式会社 | 画像処理装置、画像処理方法、コンピュータプログラム |
JP5137759B2 (ja) * | 2008-09-18 | 2013-02-06 | キヤノン株式会社 | 画像処理装置 |
US10607381B2 (en) | 2014-07-07 | 2020-03-31 | Canon Kabushiki Kaisha | Information processing apparatus |
-
2017
- 2017-09-21 JP JP2017181698A patent/JP7030462B2/ja active Active
-
2018
- 2018-09-12 US US16/128,972 patent/US10574839B2/en active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0535921A (ja) * | 1991-07-26 | 1993-02-12 | Sumitomo Metal Ind Ltd | 文字照合装置及びそのための方法 |
JPH08272902A (ja) * | 1995-04-03 | 1996-10-18 | Fuji Electric Co Ltd | 異字体異品質文字の認識方法 |
JPH09305709A (ja) * | 1996-05-10 | 1997-11-28 | Kobe Steel Ltd | 画像認識方法及びその装置 |
JP2001043313A (ja) * | 1999-07-30 | 2001-02-16 | Toshiba Corp | 文字切出し方法 |
JP2006172284A (ja) * | 2004-12-17 | 2006-06-29 | Canon Inc | 画像処理装置、画像処理方法、コンピュータプログラム |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2023505663A (ja) * | 2019-12-05 | 2023-02-10 | 嘉楠明芯(北京)科技有限公司 | 文字分割方法、装置、および、コンピュータ可読記憶媒体 |
Also Published As
Publication number | Publication date |
---|---|
JP7030462B2 (ja) | 2022-03-07 |
US10574839B2 (en) | 2020-02-25 |
US20190089849A1 (en) | 2019-03-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7030462B2 (ja) | スキャン画像から文字情報を取得する画像処理装置、画像処理方法、及びプログラム | |
US10652409B2 (en) | Apparatus for setting information relating to scanned image, method and storage medium | |
US10929657B2 (en) | Apparatus, method, and storage medium for setting information related to scanned image | |
JP6953230B2 (ja) | スキャン画像にファイル名等を設定するための装置、その制御方法及びプログラム | |
US11386046B2 (en) | Apparatus for setting file name for scan image, method of controlling same, and storage medium | |
JP6891073B2 (ja) | スキャン画像にファイル名等を設定するための装置、その制御方法及びプログラム | |
US11144189B2 (en) | Determination and relocation of movement targets based on a drag-and-drop operation of a thumbnail across document areas | |
US11843732B2 (en) | Image processing apparatus for inputting characters using touch panel, control method thereof and storage medium | |
US11062134B2 (en) | Apparatus for setting file name and the like for scan image, control method thereof, and storage medium | |
US11252287B2 (en) | Image processing apparatus that displays guidance for user operation, control method thereof and storage medium | |
JP2016021086A (ja) | 電子文書生成システム、電子文書生成装置およびプログラム | |
US11908215B2 (en) | Information processing apparatus, information processing method, and storage medium | |
US11265431B2 (en) | Image processing apparatus for inputting characters using touch panel, control method thereof and storage medium | |
US11393234B2 (en) | Image processing system for computerizing document, control method thereof, and storage medium | |
US11575799B2 (en) | Image processing apparatus for setting property including character strings and separators to scanned image, control method thereof and storage medium | |
JP2021026604A (ja) | 画像処理装置、画像処理方法、及びプログラム | |
JP2019159420A (ja) | 画像処理装置、制御方法、およびそのプログラム | |
US11620840B2 (en) | Image processing apparatus for extracting a desired character string from a scanned image | |
JP2019068323A (ja) | スキャン画像にファイル名を設定するための装置、その制御方法及びプログラム | |
JP2024034740A (ja) | 画像処理装置、画像処理システム、画像処理方法、及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20200622 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20200622 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20210712 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20210720 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210921 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20220125 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20220222 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 7030462 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |