JP6950320B2 - 画像処理装置 - Google Patents
画像処理装置 Download PDFInfo
- Publication number
- JP6950320B2 JP6950320B2 JP2017139124A JP2017139124A JP6950320B2 JP 6950320 B2 JP6950320 B2 JP 6950320B2 JP 2017139124 A JP2017139124 A JP 2017139124A JP 2017139124 A JP2017139124 A JP 2017139124A JP 6950320 B2 JP6950320 B2 JP 6950320B2
- Authority
- JP
- Japan
- Prior art keywords
- document file
- unit
- area
- image data
- image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N1/00—Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
- H04N1/0035—User-machine interface; Control console
- H04N1/00405—Output means
- H04N1/00408—Display of information to the user, e.g. menus
- H04N1/00411—Display of information to the user, e.g. menus the display also being used for user input, e.g. touch screen
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N1/00—Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
- H04N1/40—Picture signal circuits
- H04N1/40062—Discrimination between different image types, e.g. two-tone, continuous tone
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/32—Digital ink
- G06V30/333—Preprocessing; Feature extraction
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/412—Layout analysis of documents structured with printed lines or input boxes, e.g. business forms or tables
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N1/00—Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
- H04N1/00127—Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture
- H04N1/00326—Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture with a data reading, recognizing or recording apparatus, e.g. with a bar-code apparatus
- H04N1/00328—Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture with a data reading, recognizing or recording apparatus, e.g. with a bar-code apparatus with an apparatus processing optically-read information
- H04N1/00331—Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture with a data reading, recognizing or recording apparatus, e.g. with a bar-code apparatus with an apparatus processing optically-read information with an apparatus performing optical character recognition
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N1/00—Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
- H04N1/46—Colour picture communication systems
- H04N1/56—Processing of colour picture signals
- H04N1/60—Colour correction or control
- H04N1/6072—Colour correction or control adapting to different types of images, e.g. characters, graphs, black and white image portions
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N1/00—Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
- H04N1/46—Colour picture communication systems
- H04N1/64—Systems for the transmission or the storage of the colour picture signal; Details therefor, e.g. coding or decoding means therefor
- H04N1/642—Adapting to different types of images, e.g. characters, graphs, black and white image portions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N2201/00—Indexing scheme relating to scanning, transmission or reproduction of documents or the like, and to details thereof
- H04N2201/0077—Types of the still picture apparatus
- H04N2201/0094—Multifunctional device, i.e. a device capable of all of reading, reproducing, copying, facsimile transception, file transception
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Human Computer Interaction (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Processing Or Creating Images (AREA)
- Document Processing Apparatus (AREA)
- Character Discrimination (AREA)
- Editing Of Facsimile Originals (AREA)
- Facsimile Image Signal Circuits (AREA)
- Character Input (AREA)
Description
文書ファイルの生成処理を自動的に選択し、使用者の煩わしさを無くす。
図1を用いて、実施形態に係る複合機100の一例を説明する。図1は、実施形態に係る複合機100の一例を示す図である。
次に、図2、図3を用いて、実施形態に係る画像読取部6と制御部1の一例を説明する。図2は、実施形態に係る画像読取部6と制御部1の一例を示す図である。図3は、原稿を読み取って得られた画像データの一例を示す図である。
次に、図4、図5を用いて、実施形態に係る第1生成処理の一例を説明する。図4は実施形態に係る第1生成処理で生成された文書ファイル10の一例を示す図である。図5は実施形態に係る第1生成処理で生成されるXML形式のファイルの一例を示す図である。
次に、図6〜図8を用いて、実施形態に係る第2生成処理の一例を説明する。図6は、画像データ(原稿)の他の一例を示す図である。図7は、実施形態に係る第2生成処理で生成された文書ファイル10の一例を示す図である。図8は、実施形態に係る第2生成処理で生成されるXML形式のファイルの一例を示す図である。
次に、図9を用いて、実施形態に係る複合機100での文書ファイル10の生成の流れの一例を説明する。図9は、実施形態に係る複合機100での文書ファイル10の生成の流れの一例を示す図である。
7 原稿搬送部 81 レイアウト解析部
82 OCR処理部 83 文書ファイル生成部
84 色数認識部 85 サイズ認識部
91 文字領域 92 図領域
93 表領域 10a テキストボックス
10b イメージオブジェクト 10c テーブルデータ
T1 テキストデータ
Claims (6)
- 画像データのレイアウトを解析し、文字のみからなる文字領域を前記画像データから抽出するレイアウト解析部と、
前記文字領域の前記文字を認識し、テキストデータを生成するOCR処理部と、
前記文字領域の面積を、前記文字領域と前記文字領域以外の領域の合計面積で除して比率を求め、
前記比率が閾値未満のとき、第1生成処理により文書ファイルを生成し、
前記比率が前記閾値以上のとき、第2生成処理により前記文書ファイルを生成する文書ファイル生成部と、を含み、
前記第1生成処理は、前記テキストデータを含むテキストボックスを貼りつけた前記文書ファイルを生成する処理であり、
前記第2生成処理は、前記テキストボックスを用いずに、直接、前記テキストデータを記入して前記文書ファイルを生成する処理であることを特徴とする画像処理装置。 - 1枚ずつ原稿を読み取り位置に搬送する原稿搬送部と、
搬送される原稿を読み取り、前記画像データを生成する画像読取部と、を含み、
連続して原稿が搬送され、前記画像読取部が前記画像データを連続して生成したとき、
前記レイアウト解析部は、1ページずつ、前記画像読取部が生成した前記画像データのレイアウトの解析と前記文字領域と前記文字領域以外の領域の抽出を行い、
前記文書ファイル生成部は、
1ページずつ、前記第1生成処理と前記第2生成処理のうち何れを行うかを選択し、
選択した処理を行って各ページの前記画像データを変換した前記文書ファイルを生成することを特徴とする請求項1に記載の画像処理装置。 - 前記レイアウト解析部は、前記画像データから前記文字領域と、図を含む図領域と、表を含む表領域を抽出し、
前記文書ファイル生成部は、
前記文字領域と前記図領域と前記表領域の合計を前記合計面積とし、
前記図領域をイメージオブジェクトとして貼りつけた前記文書ファイルを生成し、
前記表領域をテーブルデータとして貼りつけた前記文書ファイルを生成することを特
徴とする請求項1又は2に記載の画像処理装置。 - 前記文字領域に含まれる文字で使用される色数をカウントする色数認識部を含み、
前記文書ファイル生成部は、前記色数が多いほど、前記閾値を大きくすることを特徴とする請求項1乃至3の何れか1項に記載の画像処理装置。 - 前記文字領域に含まれる文字のサイズを認識するサイズ認識部を含み、
前記文書ファイル生成部は、前記文字のサイズの種類が多いほど、前記閾値を大きくすることを特徴とする請求項1乃至4の何れか1項に記載の画像処理装置。 - 前記文書ファイル生成部は、前記文書ファイルとして、XML形式のファイルを生成することを特徴とする請求項1乃至5の何れか1項に記載の画像処理装置。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017139124A JP6950320B2 (ja) | 2017-07-18 | 2017-07-18 | 画像処理装置 |
US16/029,283 US10455116B2 (en) | 2017-07-18 | 2018-07-06 | Image processing device and method for controlling image processing device |
CN201810750630.9A CN109274850B (zh) | 2017-07-18 | 2018-07-10 | 图像处理装置和图像处理装置的控制方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017139124A JP6950320B2 (ja) | 2017-07-18 | 2017-07-18 | 画像処理装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2019022085A JP2019022085A (ja) | 2019-02-07 |
JP6950320B2 true JP6950320B2 (ja) | 2021-10-13 |
Family
ID=65014465
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017139124A Active JP6950320B2 (ja) | 2017-07-18 | 2017-07-18 | 画像処理装置 |
Country Status (3)
Country | Link |
---|---|
US (1) | US10455116B2 (ja) |
JP (1) | JP6950320B2 (ja) |
CN (1) | CN109274850B (ja) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2020160553A (ja) * | 2019-03-25 | 2020-10-01 | 東芝テック株式会社 | 画像処理プログラム、及び画像処理装置 |
US11556610B2 (en) * | 2019-11-08 | 2023-01-17 | Accenture Global Solutions Limited | Content alignment |
JP2022018202A (ja) * | 2020-07-15 | 2022-01-27 | 株式会社リコー | 情報処理装置およびプログラム |
US11651606B1 (en) * | 2022-05-31 | 2023-05-16 | Intuit, Inc. | Method and system for document data extraction |
Family Cites Families (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003131863A (ja) * | 2001-08-15 | 2003-05-09 | Square Co Ltd | 表示制御方法、情報処理装置、プログラム及び記録媒体 |
JP4135752B2 (ja) * | 2006-06-12 | 2008-08-20 | コニカミノルタビジネステクノロジーズ株式会社 | 画像処理装置、画像処理方法及び画像処理プログラム |
JP2008072352A (ja) * | 2006-09-13 | 2008-03-27 | Sharp Corp | 画像処理方法、画像処理装置、原稿読取装置、画像形成装置及びコンピュータプログラム |
JP5020698B2 (ja) | 2007-05-09 | 2012-09-05 | キヤノン株式会社 | 画像処理装置、画像処理方法、画像処理プログラム |
JP4442701B2 (ja) * | 2008-06-04 | 2010-03-31 | コニカミノルタビジネステクノロジーズ株式会社 | 領域判別方法、画像圧縮方法、画像圧縮装置、およびコンピュータプログラム |
JP4725645B2 (ja) * | 2008-12-26 | 2011-07-13 | コニカミノルタビジネステクノロジーズ株式会社 | 画像処理装置、データ量削減方法およびデータ量削減プログラム |
JP4893815B2 (ja) * | 2009-12-11 | 2012-03-07 | コニカミノルタビジネステクノロジーズ株式会社 | バリアブル印刷制御装置及び制御プログラム |
US8594422B2 (en) * | 2010-03-11 | 2013-11-26 | Microsoft Corporation | Page layout determination of an image undergoing optical character recognition |
JP5733907B2 (ja) * | 2010-04-07 | 2015-06-10 | キヤノン株式会社 | 画像処理装置、画像処理方法、コンピュータプログラム |
CN105094757A (zh) * | 2014-04-29 | 2015-11-25 | 阿里巴巴集团控股有限公司 | 在安卓系统上清空文本内容的方法、装置和终端设备 |
JP6559415B2 (ja) * | 2014-11-20 | 2019-08-14 | シャープ株式会社 | 文書画像処理装置、それを備えた情報処理装置、プログラム、及び記録媒体 |
CN107977658B (zh) * | 2017-12-27 | 2021-09-28 | 深圳Tcl新技术有限公司 | 图像文字区域的识别方法、电视机和可读存储介质 |
-
2017
- 2017-07-18 JP JP2017139124A patent/JP6950320B2/ja active Active
-
2018
- 2018-07-06 US US16/029,283 patent/US10455116B2/en not_active Expired - Fee Related
- 2018-07-10 CN CN201810750630.9A patent/CN109274850B/zh not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
US10455116B2 (en) | 2019-10-22 |
JP2019022085A (ja) | 2019-02-07 |
CN109274850B (zh) | 2020-07-31 |
CN109274850A (zh) | 2019-01-25 |
US20190028607A1 (en) | 2019-01-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8941864B2 (en) | Image processing apparatus, image reading apparatus, image forming apparatus, and image processing method | |
JP6950320B2 (ja) | 画像処理装置 | |
US7681121B2 (en) | Image processing apparatus, control method therefor, and program | |
US7664321B2 (en) | Image processing method, system, program, program storage medium and information processing apparatus | |
US9454696B2 (en) | Dynamically generating table of contents for printable or scanned content | |
US20100245870A1 (en) | Image processing apparatus, image forming apparatus, and image processing method | |
US8073255B2 (en) | Keyword generation process | |
US20060008114A1 (en) | Image processing system and image processing method | |
US7421124B2 (en) | Image processing system and image processing method | |
JP2007174270A (ja) | 画像処理装置、画像処理方法、記憶媒体、プログラム | |
US20120250048A1 (en) | Image processing apparatus and image processing method | |
WO2013108757A1 (ja) | 画像処理装置、画像形成装置、プログラム、記録媒体 | |
JP6254002B2 (ja) | 変換処理装置、それを備えた情報処理装置、プログラム、及び記録媒体 | |
WO2014045788A1 (ja) | 画像処理装置、画像形成装置、および記録媒体 | |
JP2011008549A (ja) | 画像処理装置、画像読取装置、複合機、画像処理方法、プログラム、記録媒体 | |
JP4933415B2 (ja) | 画像処理装置、方法、並びにプログラム | |
JP2005107691A (ja) | 画像処理装置、画像処理方法ならびにプログラム、記憶媒体 | |
US7983485B2 (en) | System and method for identifying symbols for processing images | |
JP4213112B2 (ja) | 画像検索装置、画像形成装置、画像検索装置の制御方法、画像検索プログラムおよびコンピュータ読取り可能な記録媒体 | |
US10887491B2 (en) | Image processing apparatus for processing of highlighted regions | |
JP3899872B2 (ja) | 画像処理装置、画像処理方法ならびに画像処理プログラムおよびこれを記録したコンピュータ読み取り可能な記録媒体 | |
US8810827B2 (en) | Image processing apparatus, image processing method, and storage medium | |
JP2007013360A (ja) | 画像形成装置 | |
JP2018018303A (ja) | 情報抽出装置及びこれを備えた画像形成装置 | |
US11113521B2 (en) | Information processing apparatus |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20200624 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20210315 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20210413 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210607 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20210824 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20210906 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6950320 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |