JP7030462B2 - スキャン画像から文字情報を取得する画像処理装置、画像処理方法、及びプログラム - Google Patents
スキャン画像から文字情報を取得する画像処理装置、画像処理方法、及びプログラム Download PDFInfo
- Publication number
- JP7030462B2 JP7030462B2 JP2017181698A JP2017181698A JP7030462B2 JP 7030462 B2 JP7030462 B2 JP 7030462B2 JP 2017181698 A JP2017181698 A JP 2017181698A JP 2017181698 A JP2017181698 A JP 2017181698A JP 7030462 B2 JP7030462 B2 JP 7030462B2
- Authority
- JP
- Japan
- Prior art keywords
- aspect ratio
- area
- ocr
- image
- pixel block
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N1/00—Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
- H04N1/00127—Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture
- H04N1/00326—Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture with a data reading, recognizing or recording apparatus, e.g. with a bar-code apparatus
- H04N1/00328—Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture with a data reading, recognizing or recording apparatus, e.g. with a bar-code apparatus with an apparatus processing optically-read information
- H04N1/00331—Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture with a data reading, recognizing or recording apparatus, e.g. with a bar-code apparatus with an apparatus processing optically-read information with an apparatus performing optical character recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/413—Classification of content, e.g. text, photographs or tables
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N2201/00—Indexing scheme relating to scanning, transmission or reproduction of documents or the like, and to details thereof
- H04N2201/0077—Types of the still picture apparatus
- H04N2201/0094—Multifunctional device, i.e. a device capable of all of reading, reproducing, copying, facsimile transception, file transception
Description
図1は、本実施例に係る画像処理システムの全体構成を示す図である。画像処理システムは、MFP110とファイルサーバ120とで構成され、LAN(Local Area Network)を介して互いに通信可能に接続されている。
図4は、MFP110のソフトウェア構成図である。MFP110のソフトウェアは、ネイティブ機能モジュール410とアディショナル機能モジュール420の大きく2つに分けられる。ネイティブ機能モジュール410に含まれる各部は、MFP110に標準的に備えられた機能モジュールである。これに対し、アディショナル機能モジュール420に含まれる各部は、MFP110に追加的に備わる機能モジュールであり、例えばアプリケーションのインストールによって実現される機能モジュールである。本実施例におけるアディショナル機能モジュール420は、Java(登録商標)をベースとしたアプリケーションであり、MFP110への機能追加を容易に実現できる。なお、MFP110には図示しない他のアプリケーションがインストールされていても良い。以下、両機能モジュール410及ぶ420を構成する各部について説明する。
図10は、プレビュー表示部426におけるファイル名生成処理(ステップ507)の詳細を示すフローチャートである。以下、図10のフローに沿って説明する。
上述の実施例では、領域分割向けに生成した二値画像がOCR処理に適しているかどうかの状態判定を行い、二値画像の状態がOCR処理に適していない場合だけ、ユーザ選択に係る行領域に対して二値化処理を再度行っていた。このような二値画像の状態判定を行うことなく、ユーザ選択に係る行領域に対しては一律に、高精度の二値化処理を行なうようにしてもよい。この場合、後続のOCR処理に対する影響を考慮する必要がなくなるので、領域分割向けの二値化処理においてより簡易かつ高速な手法を採用することが可能となる。
本発明は、上述の実施形態の1以上の機能を実現するプログラムを、ネットワーク又は記憶媒体を介してシステム又は装置に供給し、そのシステム又は装置のコンピュータにおける1つ以上のプロセッサーがプログラムを読出し実行する処理でも実現可能である。また、1以上の機能を実現する回路(例えば、ASIC)によっても実現可能である。
Claims (8)
- スキャン画像から文字情報を取得する画像処理装置であって、
第1の二値化手法を用いて前記スキャン画像を二値化することにより第1の二値画像を取得する第1の二値化手段と、
前記第1の二値画像に対し領域分割処理を行って、テキスト領域を抽出する解析手段と、
前記テキスト領域に含まれる黒画素塊を囲む外接矩形の縦横比が、基準となる縦横比の範囲内であるか否か判定する第1の判定手段と、
前記第1の判定手段において前記黒画素塊を囲む外接矩形の縦横比が前記基準となる縦横比の範囲内であると判定した場合、前記テキスト領域に含まれる黒画素塊の一部に対してOCR処理を行うことにより得られるOCR結果の信頼度が所定の閾値より高いか否か判定する第2の判定手段と、
前記第1の判定手段において前記黒画素塊を囲む外接矩形の縦横比が前記基準となる縦横比の範囲内でないと判定した場合、もしくは、前記第2の判定手段において前記OCR結果の信頼度が前記所定の閾値以下であると判定した場合、第2の二値化手法を用いて少なくとも前記テキスト領域に対応する前記スキャン画像内の領域を二値化することにより第2の二値画像を取得する第2の二値化手段と、
前記第2の判定手段において前記OCR結果の信頼度が前記所定の閾値より高いと判定した場合は、前記第1の二値画像を用いてOCR処理を行い、前記第1の判定手段において前記黒画素塊を囲む外接矩形の縦横比が前記基準となる縦横比の範囲内でないと判定した場合、もしくは、前記第2の判定手段において前記OCR結果の信頼度が前記所定の閾値以下であると判定した場合は、前記第2の二値画像を用いてOCR処理を行なう文字認識手段と、
を備えることを特徴とする画像処理装置。 - 前記第1の判定手段での判定の対象となるテキスト領域は、前記解析手段で抽出されたテキスト領域のうち、ユーザによって選択されたテキスト領域であることを特徴とする請求項1に記載の画像処理装置。
- 前記テキスト領域は、文字行単位で分割された領域であり、
前記第1の判定手段で使用される前記基準となる縦横比の範囲は、前記文字行単位で分割されたテキスト領域に含まれる黒画素塊を囲む外接矩形の縦横比の平均値に基づき決定される
ことを特徴とする請求項1または2に記載の画像処理装置。 - 前記第1の二値化手法は、前記第2の二値化手法よりも処理速度が早い二値化手法であることを特徴とする請求項1乃至3のいずれか1項に記載の画像処理装置。
- 前記第1の二値化手法は、単一の閾値を用いる二値化手法であり、
前記第2の二値化手法は、複数の閾値を用いる二値化手法である
ことを特徴とする請求項1乃至4のいずれか1項に記載の画像処理装置。 - 前記解析手段により文字行単位で抽出された前記テキスト領域のうち、任意の文字行のテキスト領域の選択を受け付けるユーザインタフェースをさらに備え、
前記第1の判定手段は、前記ユーザインタフェースを介してユーザが選択した文字行のテキスト領域に含まれる画素塊を囲む外接矩形の縦横比が、前記基準となる縦横比の範囲内であるか否か判定する
ことを特徴とする請求項1に記載の画像処理装置。 - スキャン画像から文字情報を取得する画像処理方法であって、
第1の二値化手法を用いて前記スキャン画像を二値化することにより第1の二値画像を取得する第1の二値化ステップと、
前記第1の二値画像に対し領域分割処理を行って、テキスト領域を抽出する解析ステップと、
前記テキスト領域に含まれる黒画素塊を囲む外接矩形の縦横比が、基準となる縦横比の範囲内であるか否か判定する第1の判定ステップと、
前記第1の判定ステップにて前記黒画素塊を囲む外接矩形の縦横比が前記基準となる縦横比の範囲内であると判定された場合、前記テキスト領域に含まれる黒画素塊の一部に対してOCR処理を行うことにより得られるOCR結果の信頼度が所定の閾値より高いか否か判定する第2の判定ステップと、
前記第1の判定ステップにて前記黒画素塊を囲む外接矩形の縦横比が前記基準となる縦横比の範囲内でないと判定された場合、もしくは、前記第2の判定ステップにて前記OCR結果の信頼度が前記所定の閾値以下であると判定された場合、第2の二値化手法を用いて少なくとも前記テキスト領域に対応する前記スキャン画像内の領域を二値化することにより第2の二値画像を取得する第2の二値化ステップと、
前記第2の判定ステップにて前記OCR結果の信頼度が前記所定の閾値より高いと判定された場合は、前記第1の二値画像を用いてOCR処理を行い、前記第1の判定ステップにて前記黒画素塊を囲む外接矩形の縦横比が前記基準となる縦横比の範囲内でないと判定された場合、もしくは、前記第2の判定ステップにて前記OCR結果の信頼度が前記所定の閾値以下であると判定された場合は、前記第2の二値画像を用いてOCR処理を行なう文字認識ステップと、
を含むことを特徴とする画像処理方法。 - コンピュータを、請求項1乃至6のいずれか1項に記載の画像処理装置として機能させるためのプログラム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017181698A JP7030462B2 (ja) | 2017-09-21 | 2017-09-21 | スキャン画像から文字情報を取得する画像処理装置、画像処理方法、及びプログラム |
US16/128,972 US10574839B2 (en) | 2017-09-21 | 2018-09-12 | Image processing apparatus, method and storage medium for acquiring character information from scanned image |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017181698A JP7030462B2 (ja) | 2017-09-21 | 2017-09-21 | スキャン画像から文字情報を取得する画像処理装置、画像処理方法、及びプログラム |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2019057174A JP2019057174A (ja) | 2019-04-11 |
JP2019057174A5 JP2019057174A5 (ja) | 2020-08-06 |
JP7030462B2 true JP7030462B2 (ja) | 2022-03-07 |
Family
ID=65720853
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017181698A Active JP7030462B2 (ja) | 2017-09-21 | 2017-09-21 | スキャン画像から文字情報を取得する画像処理装置、画像処理方法、及びプログラム |
Country Status (2)
Country | Link |
---|---|
US (1) | US10574839B2 (ja) |
JP (1) | JP7030462B2 (ja) |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6968647B2 (ja) * | 2017-10-03 | 2021-11-17 | キヤノン株式会社 | スキャン画像にファイル名を設定するための装置、その制御方法及びプログラム |
JP6983675B2 (ja) * | 2018-01-23 | 2021-12-17 | キヤノン株式会社 | スキャン画像に関連する情報を設定するための装置、方法、プログラム、およびシステム |
JP7330742B2 (ja) * | 2019-04-19 | 2023-08-22 | キヤノン株式会社 | スキャン画像にプロパティを設定するための画像処理装置、その制御方法及びプログラム |
JP7225017B2 (ja) * | 2019-04-19 | 2023-02-20 | キヤノン株式会社 | タッチパネルを用いた文字入力のための画像処理装置、その制御方法及びプログラム |
CN111918065A (zh) * | 2019-05-08 | 2020-11-10 | 中兴通讯股份有限公司 | 一种信息压缩/解压缩方法及装置 |
EP4071665A4 (en) * | 2019-12-05 | 2023-11-22 | Canaan Bright Sight Co., Ltd. | CHARACTER SEGMENTATION METHOD AND APPARATUS, AND COMPUTER-READABLE STORAGE MEDIUM |
JP7400548B2 (ja) * | 2020-03-03 | 2023-12-19 | 富士フイルムビジネスイノベーション株式会社 | 情報処理装置、画像処理装置、情報処理システム、及びプログラム |
JP2022011034A (ja) * | 2020-06-29 | 2022-01-17 | キヤノン株式会社 | データ入力支援装置、データ入力支援方法及びプログラム |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001043313A (ja) | 1999-07-30 | 2001-02-16 | Toshiba Corp | 文字切出し方法 |
JP2006172284A (ja) | 2004-12-17 | 2006-06-29 | Canon Inc | 画像処理装置、画像処理方法、コンピュータプログラム |
US20070263930A1 (en) | 2006-05-11 | 2007-11-15 | Fuji Xerox Co., Ltd. | Character recognition processing system and computer readable medium storing program for character recognition processing |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0535921A (ja) * | 1991-07-26 | 1993-02-12 | Sumitomo Metal Ind Ltd | 文字照合装置及びそのための方法 |
JPH08272902A (ja) * | 1995-04-03 | 1996-10-18 | Fuji Electric Co Ltd | 異字体異品質文字の認識方法 |
JP3422896B2 (ja) * | 1996-05-10 | 2003-06-30 | 株式会社神戸製鋼所 | 画像認識方法及びその装置 |
JPH11232388A (ja) | 1998-02-10 | 1999-08-27 | Hitachi Ltd | 文書・帳票認識システム |
JP4590433B2 (ja) | 2007-06-29 | 2010-12-01 | キヤノン株式会社 | 画像処理装置、画像処理方法、コンピュータプログラム |
JP5137759B2 (ja) * | 2008-09-18 | 2013-02-06 | キヤノン株式会社 | 画像処理装置 |
US10607381B2 (en) | 2014-07-07 | 2020-03-31 | Canon Kabushiki Kaisha | Information processing apparatus |
-
2017
- 2017-09-21 JP JP2017181698A patent/JP7030462B2/ja active Active
-
2018
- 2018-09-12 US US16/128,972 patent/US10574839B2/en active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001043313A (ja) | 1999-07-30 | 2001-02-16 | Toshiba Corp | 文字切出し方法 |
JP2006172284A (ja) | 2004-12-17 | 2006-06-29 | Canon Inc | 画像処理装置、画像処理方法、コンピュータプログラム |
US20070263930A1 (en) | 2006-05-11 | 2007-11-15 | Fuji Xerox Co., Ltd. | Character recognition processing system and computer readable medium storing program for character recognition processing |
Also Published As
Publication number | Publication date |
---|---|
US10574839B2 (en) | 2020-02-25 |
US20190089849A1 (en) | 2019-03-21 |
JP2019057174A (ja) | 2019-04-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7030462B2 (ja) | スキャン画像から文字情報を取得する画像処理装置、画像処理方法、及びプログラム | |
JP6953230B2 (ja) | スキャン画像にファイル名等を設定するための装置、その制御方法及びプログラム | |
JP6891073B2 (ja) | スキャン画像にファイル名等を設定するための装置、その制御方法及びプログラム | |
US10652409B2 (en) | Apparatus for setting information relating to scanned image, method and storage medium | |
JP6968647B2 (ja) | スキャン画像にファイル名を設定するための装置、その制御方法及びプログラム | |
US10929657B2 (en) | Apparatus, method, and storage medium for setting information related to scanned image | |
JP7062388B2 (ja) | スキャン画像にファイル名等を設定するための装置、その制御方法及びプログラム | |
US11144189B2 (en) | Determination and relocation of movement targets based on a drag-and-drop operation of a thumbnail across document areas | |
US11341733B2 (en) | Method and system for training and using a neural network for image-processing | |
US11843732B2 (en) | Image processing apparatus for inputting characters using touch panel, control method thereof and storage medium | |
US10306085B2 (en) | Information processing apparatus, control method of information processing apparatus, and recording medium | |
JP2016021086A (ja) | 電子文書生成システム、電子文書生成装置およびプログラム | |
US11265431B2 (en) | Image processing apparatus for inputting characters using touch panel, control method thereof and storage medium | |
US11393234B2 (en) | Image processing system for computerizing document, control method thereof, and storage medium | |
US20230156138A1 (en) | Information processing apparatus, method of controlling information processing apparatus, and storage medium | |
US11528372B2 (en) | Image processing system for providing attribute information, image processing method and storage medium | |
JP2021026604A (ja) | 画像処理装置、画像処理方法、及びプログラム | |
JP2019068323A (ja) | スキャン画像にファイル名を設定するための装置、その制御方法及びプログラム | |
JP7476557B2 (ja) | 機器、処理実行システム、処理実行方法、プログラム | |
JP2019159420A (ja) | 画像処理装置、制御方法、およびそのプログラム | |
JP7150967B2 (ja) | スキャン画像に関連する情報を設定するための装置、方法、およびプログラム | |
JP2024034740A (ja) | 画像処理装置、画像処理システム、画像処理方法、及びプログラム | |
US10713413B2 (en) | Image processing apparatus and recording medium |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20200622 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20200622 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20210712 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20210720 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210921 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20220125 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20220222 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 7030462 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |