JP7147544B2 - 情報処理装置、及び情報処理方法 - Google Patents
情報処理装置、及び情報処理方法 Download PDFInfo
- Publication number
- JP7147544B2 JP7147544B2 JP2018237331A JP2018237331A JP7147544B2 JP 7147544 B2 JP7147544 B2 JP 7147544B2 JP 2018237331 A JP2018237331 A JP 2018237331A JP 2018237331 A JP2018237331 A JP 2018237331A JP 7147544 B2 JP7147544 B2 JP 7147544B2
- Authority
- JP
- Japan
- Prior art keywords
- image
- image data
- character
- information processing
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/1444—Selective acquisition, locating or processing of specific regions, e.g. highlighted text, fiducial marks or predetermined fields
- G06V30/1448—Selective acquisition, locating or processing of specific regions, e.g. highlighted text, fiducial marks or predetermined fields based on markings or identifiers characterising the document or the area
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/11—Region-based segmentation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/1444—Selective acquisition, locating or processing of specific regions, e.g. highlighted text, fiducial marks or predetermined fields
- G06V30/1456—Selective acquisition, locating or processing of specific regions, e.g. highlighted text, fiducial marks or predetermined fields based on user interactions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/148—Segmentation of character regions
- G06V30/153—Segmentation of character regions using recognition of characters or words
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/414—Extracting the geometrical structure, e.g. layout tree; Block segmentation, e.g. bounding boxes for graphics or text
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N1/00—Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
- H04N1/00795—Reading arrangements
- H04N1/00798—Circuits or arrangements for the control thereof, e.g. using a programmed control device or according to a measured quantity
- H04N1/00822—Selecting or setting a particular reading mode, e.g. from amongst a plurality of modes, simplex or duplex, or high or low resolution
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N1/00—Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
- H04N1/00795—Reading arrangements
- H04N1/00798—Circuits or arrangements for the control thereof, e.g. using a programmed control device or according to a measured quantity
- H04N1/00824—Circuits or arrangements for the control thereof, e.g. using a programmed control device or according to a measured quantity for displaying or indicating, e.g. a condition or state
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N1/00—Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
- H04N1/40—Picture signal circuits
- H04N1/40062—Discrimination between different image types, e.g. two-tone, continuous tone
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N1/00—Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
- H04N1/46—Colour picture communication systems
- H04N1/56—Processing of colour picture signals
- H04N1/60—Colour correction or control
- H04N1/6072—Colour correction or control adapting to different types of images, e.g. characters, graphs, black and white image portions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30242—Counting objects in image
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/28—Character recognition specially adapted to the type of the alphabet, e.g. Latin alphabet
- G06V30/287—Character recognition specially adapted to the type of the alphabet, e.g. Latin alphabet of Kanji, Hiragana or Katakana characters
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N1/00—Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
- H04N1/0035—User-machine interface; Control console
- H04N1/00405—Output means
- H04N1/00408—Display of information to the user, e.g. menus
- H04N1/00411—Display of information to the user, e.g. menus the display also being used for user input, e.g. touch screen
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Signal Processing (AREA)
- Human Computer Interaction (AREA)
- Geometry (AREA)
- Artificial Intelligence (AREA)
- Computer Graphics (AREA)
- Character Input (AREA)
- Character Discrimination (AREA)
- Editing Of Facsimile Originals (AREA)
Description
図1を参照して、実施形態1に係る情報処理装置100を説明する。図1は、実施形態1に係る情報処理装置100の構成を示す図である。情報処理装置100は、例えば、複写機、プリンター、又は複合機である。以下では、一例として、情報処理装置100がプリンター機能と複写機能とファクシミリ機能とを有するモノクロ複合機である場合について説明する。
図2、図6から図9を参照して、本発明の実施形態2について説明する。実施形態2によれば、情報処理装置100は、図2を参照して説明した原稿画像G1に含まれる第1画像T1、T2及びT3の数に応じて、文字認識処理の方法を変更する。この結果、ユーザーの利便性が向上する。
図1、図4、及び図10を参照して、本発明の実施形態3について説明する。実施形態3の情報処理装置100によれば、識別画像がマーキング画像ではなくても文字認識処理を実行できる。この結果、ユーザーの利便性が向上する。
図1、図4、図11(a)、及び図11(b)を参照して、本発明の実施形態4について説明する。実施形態4の処理部33は、文字認識処理によって取得された文字列を翻訳して出力する。この結果、ユーザーの利便性がより向上する。なお、翻訳は、所定処理の一例である。
図1、図4、図12(a)、及び図12(b)を参照して、本発明の実施形態5について説明する。実施形態5の処理部33は、文字認識処理によって取得された文字列の表現方法を変更して出力する。処理部33は、例えば、文字列の色、文字列の大きさ(フォントサイズ)、及び文字列の形状(フォントの種類)のうちの少なくとも一つを変更して出力する。処理部33は、例えば、文字画像に下線を新たに付加してもよく、文字画像にマーキング画像を新たに重ねてもよい。表現方法の変更は、所定処理の一例である。
図1、図4、及び図13を参照して、本発明の実施形態6について説明する。実施形態6の処理部33は、原稿画像G1の第1画像に含まれる文字画像の文字濃度が規定値以上の場合、図1を参照して説明した表示部122に、再読取指示情報Mを表示する。
32 抽出部
33 処理部
100 情報処理装置
331 計数部
332 判定部
333 第1実行部
334 第2実行部
G1 原稿画像
G2 合成画像
N1、N2、N3 第2画像
T1、T2、T3 第1画像
Claims (11)
- 文字認識処理の対象である少なくとも一つの第1画像データと、文字認識処理の対象でない第2画像データとを含む原稿画像データに対して処理を実行する情報処理装置であって、
前記原稿画像データから、前記少なくとも一つの第1画像データを検出する検出部と、
前記原稿画像データから、前記少なくとも一つの第1画像データを抽出する抽出部と、
前記処理を実行する処理部と
を備え、
前記第1画像データは第1画像を示し、
前記第2画像データは第2画像を示し、
前記原稿画像データは、前記第1画像と、前記第2画像とを含む原稿画像を示し、
前記処理部は、
前記第1画像の数を計数する計数部と、
前記第1画像の数が閾値よりも大きいか否かを判定する判定部と、
前記第1画像の数が前記閾値よりも大きいと判定された場合、第1処理を実行する第1実行部と、
前記第1画像の数が前記閾値より大きくないと判定された場合、前記第1処理と異なる第2処理を実行する第2実行部と
を有し、
前記第1処理は、前記第2画像を前記原稿画像の背景色でマスキングして、マスキング後の前記原稿画像を示す画像データに対して文字認識する処理であり、
前記第2処理は、前記第1画像データに対して文字認識する処理である、情報処理装置。 - 前記第1画像データは、
少なくとも1つの文字画像と、
前記文字画像が文字認識処理の対象であることを示す識別画像と
を示し、
前記文字画像は1つの文字を示す、請求項1に記載の情報処理装置。 - 前記第1画像データが、互いに異なる複数の前記識別画像を示す、請求項2に記載の情報処理装置。
- 前記識別画像が、前記文字画像に重なるマーキング画像である、請求項2又は請求項3に記載の情報処理装置。
- 前記識別画像が、前記原稿画像のうち前記文字画像の位置する領域を特定する記号又は図形を含む、請求項2又は請求項3に記載の情報処理装置。
- 前記処理部は、前記識別画像の種類に応じて処理内容を変更する、請求項2から請求項5記載のいずれか1項に記載の情報処理装置。
- 前記処理部は、前記第1処理、又は前記第2処理によって取得された文字列を翻訳する、請求項6に記載の情報処理装置。
- 前記処理部は、前記第1処理、又は前記第2処理によって取得された文字列の色、大きさ、及び形状のうちの少なくとも一つを変更する、請求項6に記載の情報処理装置。
- 前記処理部は、前記文字画像の文字濃度を算出して、前記文字濃度に基づいて所定処理を実行し、
前記文字濃度は、前記文字画像を構成する画素の数に対する前記文字を構成する画素の数の比率を示す、請求項2から請求項8のいずれか1項に記載の情報処理装置。 - 予め設定された解像度で原稿から原稿画像を読取り、前記原稿画像データを生成する画像読取部と、
表示部と
を更に備え、
前記所定処理は、前記文字濃度が規定値以上の場合に、再読取指示情報を表示するように前記表示部を制御する処理であり、
前記再読取指示情報は、前記画像読取部が前記原稿画像を前回読取った際に設定されていた解像度よりも高い解像度で、前記原稿画像を読取ることを指示する情報を示す、請求項9に記載の情報処理装置。 - 文字認識処理の対象である少なくとも一つの第1画像データと、文字認識処理の対象でない第2画像データとを含む原稿画像データに対して処理を実行する情報処理方法であって、
前記原稿画像データから、前記少なくとも一つの第1画像データを検出するステップと、
前記原稿画像データから、前記少なくとも一つの第1画像データを抽出するステップと、
前記処理を実行するステップと
を備え、
前記第1画像データは第1画像を示し、
前記第2画像データは第2画像を示し、
前記原稿画像データは、前記第1画像と、前記第2画像とを含む原稿画像を示し、
前記処理を実行するステップは、
前記第1画像の数を計数するステップと、
前記第1画像の数が閾値よりも大きいか否かを判定するステップと、
前記第1画像の数が前記閾値よりも大きいと判定された場合、第1処理を実行するステップと、
前記第1画像の数が前記閾値より大きくないと判定された場合、前記第1処理と異なる第2処理を実行するステップと
を含み、
前記第1処理は、前記第2画像を前記原稿画像の背景色でマスキングして、マスキング後の前記原稿画像を示す画像データに対して文字認識する処理であり、
前記第2処理は、前記第1画像データに対して文字認識する処理である、情報処理方法。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018237331A JP7147544B2 (ja) | 2018-12-19 | 2018-12-19 | 情報処理装置、及び情報処理方法 |
US16/707,634 US10839206B2 (en) | 2018-12-19 | 2019-12-09 | Information processing device and method performing character recognition on document image data masked or not based on text image count |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018237331A JP7147544B2 (ja) | 2018-12-19 | 2018-12-19 | 情報処理装置、及び情報処理方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2020099031A JP2020099031A (ja) | 2020-06-25 |
JP7147544B2 true JP7147544B2 (ja) | 2022-10-05 |
Family
ID=71097166
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018237331A Active JP7147544B2 (ja) | 2018-12-19 | 2018-12-19 | 情報処理装置、及び情報処理方法 |
Country Status (2)
Country | Link |
---|---|
US (1) | US10839206B2 (ja) |
JP (1) | JP7147544B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2020099030A (ja) * | 2018-12-19 | 2020-06-25 | 京セラドキュメントソリューションズ株式会社 | 情報処理装置、及び情報処理方法 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010231648A (ja) | 2009-03-27 | 2010-10-14 | Sharp Corp | 画像処理装置、画像形成装置、画像処理方法、プログラムおよびその記録媒体 |
JP2016139320A (ja) | 2015-01-28 | 2016-08-04 | Kddi株式会社 | 情報端末装置 |
Family Cites Families (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3536165B2 (ja) * | 1996-04-03 | 2004-06-07 | 株式会社リコー | 画像処理装置及び画像出力装置 |
JPH11175705A (ja) * | 1997-12-17 | 1999-07-02 | Sharp Corp | データファイリング装置 |
JP4189506B2 (ja) * | 2000-06-09 | 2008-12-03 | コニカミノルタビジネステクノロジーズ株式会社 | 画像処理のための装置、方法及び記録媒体 |
JP2005167875A (ja) | 2003-12-05 | 2005-06-23 | Kyocera Mita Corp | 画像形成装置,画像形成装置の印字方法 |
US20090148043A1 (en) * | 2007-12-06 | 2009-06-11 | International Business Machines Corporation | Method for extracting text from a compound digital image |
KR101015663B1 (ko) * | 2008-06-24 | 2011-02-22 | 삼성전자주식회사 | 문자인식장치에서의 문자인식방법 및 그 장치 |
KR101023389B1 (ko) * | 2009-02-23 | 2011-03-18 | 삼성전자주식회사 | 문자 인식 성능을 향상시키기 위한 장치 및 방법 |
US8718365B1 (en) * | 2009-10-29 | 2014-05-06 | Google Inc. | Text recognition for textually sparse images |
KR20110091296A (ko) * | 2010-02-05 | 2011-08-11 | 삼성전자주식회사 | 문서 작성 장치 및 방법 |
AU2012340081A1 (en) * | 2011-11-17 | 2014-05-01 | Bayer Healthcare Llc | Methods and techniques for collecting, reporting, and managing information about medical diagnostic procedures |
JP6139658B2 (ja) * | 2013-02-28 | 2017-05-31 | グローリー株式会社 | 文字認識方法及び文字認識システム |
US9251614B1 (en) * | 2014-08-29 | 2016-02-02 | Konica Minolta Laboratory U.S.A., Inc. | Background removal for document images |
JP6476877B2 (ja) * | 2015-01-14 | 2019-03-06 | 富士ゼロックス株式会社 | 情報処理装置、システム及びプログラム |
JP2020099030A (ja) * | 2018-12-19 | 2020-06-25 | 京セラドキュメントソリューションズ株式会社 | 情報処理装置、及び情報処理方法 |
-
2018
- 2018-12-19 JP JP2018237331A patent/JP7147544B2/ja active Active
-
2019
- 2019-12-09 US US16/707,634 patent/US10839206B2/en active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010231648A (ja) | 2009-03-27 | 2010-10-14 | Sharp Corp | 画像処理装置、画像形成装置、画像処理方法、プログラムおよびその記録媒体 |
JP2016139320A (ja) | 2015-01-28 | 2016-08-04 | Kddi株式会社 | 情報端末装置 |
Also Published As
Publication number | Publication date |
---|---|
US20200202123A1 (en) | 2020-06-25 |
JP2020099031A (ja) | 2020-06-25 |
US10839206B2 (en) | 2020-11-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8423900B2 (en) | Object based adaptive document resizing | |
JP5247601B2 (ja) | 画像処理装置、画像処理方法、コンピュータプログラム | |
US8610929B2 (en) | Image processing apparatus, control method therefor, and program | |
US9614984B2 (en) | Electronic document generation system and recording medium | |
KR102613255B1 (ko) | 화상 처리 방법 및 화상 처리 시스템 | |
US8134739B2 (en) | Information processing device for outputting reduced-size pages | |
JP2010130463A (ja) | 印刷データ生成装置、印刷装置、及び、印刷データ処理システム | |
JP2007148486A (ja) | 文書閲覧支援方法および文書閲覧支援システム並びに文書処理装置およびプログラム | |
JP7147544B2 (ja) | 情報処理装置、及び情報処理方法 | |
JP2022095398A (ja) | 画像形成装置及び画像形成システム | |
JP2020099030A (ja) | 情報処理装置、及び情報処理方法 | |
JP5089524B2 (ja) | 文書処理装置、文書処理システム、文書処理方法、及び、文書処理プログラム | |
JP2020204905A (ja) | 文字認識装置、文書ファイル生成方法、文書ファイル生成プログラム | |
JP6601143B2 (ja) | 印刷装置 | |
JP2009070232A (ja) | 印刷データ生成装置 | |
JP2006270589A (ja) | 情報処理装置、情報処理方法、プログラムおよび記録媒体 | |
JP2012048637A (ja) | 画像処理装置、画像処理方法、コンピュータプログラム | |
JP6201686B2 (ja) | テキストデータの埋め込み装置、該装置を備えた画像処理装置、テキストデータの埋め込み方法及び埋め込みプログラム | |
US20170346961A1 (en) | Modified document generation | |
JP2016139869A (ja) | 画像処理装置 | |
JP2019220906A (ja) | 画像処理システム、印刷指示装置、画像処理装置及びプログラム | |
JP2015041147A (ja) | 変更履歴出力装置、プログラム | |
JP2010109653A (ja) | 画像読取装置、画像形成装置、画像読取方法および画像読取プログラム | |
JP2013130997A (ja) | 画像形成装置 | |
JP2019097049A (ja) | 情報処理装置及び情報処理プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20211130 |
|
TRDD | Decision of grant or rejection written | ||
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20220822 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20220823 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20220905 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7147544 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |