JP2018025885A - 画像処理装置 - Google Patents
画像処理装置 Download PDFInfo
- Publication number
- JP2018025885A JP2018025885A JP2016155938A JP2016155938A JP2018025885A JP 2018025885 A JP2018025885 A JP 2018025885A JP 2016155938 A JP2016155938 A JP 2016155938A JP 2016155938 A JP2016155938 A JP 2016155938A JP 2018025885 A JP2018025885 A JP 2018025885A
- Authority
- JP
- Japan
- Prior art keywords
- character
- ocr
- detection range
- range
- image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000012545 processing Methods 0.000 title claims abstract description 139
- 238000001514 detection method Methods 0.000 claims abstract description 121
- 238000000034 method Methods 0.000 claims abstract description 83
- 239000003550 marker Substances 0.000 claims description 44
- 238000012015 optical character recognition Methods 0.000 description 128
- 238000012986 modification Methods 0.000 description 14
- 230000004048 modification Effects 0.000 description 14
- 238000004891 communication Methods 0.000 description 11
- 230000006870 function Effects 0.000 description 11
- 238000003708 edge detection Methods 0.000 description 8
- 238000010586 diagram Methods 0.000 description 7
- 238000012790 confirmation Methods 0.000 description 5
- 239000013589 supplement Substances 0.000 description 4
- 230000010365 information processing Effects 0.000 description 3
- 239000003643 water by type Substances 0.000 description 3
- 239000000284 extract Substances 0.000 description 2
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/22—Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition
- G06V10/235—Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition based on user input or interaction
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/24—Aligning, centring, orientation detection or correction of the image
- G06V10/243—Aligning, centring, orientation detection or correction of the image by compensating for image skew or non-uniform image deformations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/42—Global feature extraction by analysis of the whole pattern, e.g. using frequency domain transformations or autocorrelation
- G06V10/421—Global feature extraction by analysis of the whole pattern, e.g. using frequency domain transformations or autocorrelation by analysing segments intersecting the pattern
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/44—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/74—Image or video pattern matching; Proximity measures in feature spaces
- G06V10/761—Proximity, similarity or dissimilarity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/148—Segmentation of character regions
- G06V30/153—Segmentation of character regions using recognition of characters or words
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/22—Character recognition characterised by the type of writing
- G06V30/224—Character recognition characterised by the type of writing of printed characters having additional code marks or containing code marks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/416—Extracting the logical structure, e.g. chapters, sections or page numbers; Identifying elements of the document, e.g. authors
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/28—Character recognition specially adapted to the type of the alphabet, e.g. Latin alphabet
- G06V30/287—Character recognition specially adapted to the type of the alphabet, e.g. Latin alphabet of Kanji, Hiragana or Katakana characters
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Multimedia (AREA)
- Artificial Intelligence (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Databases & Information Systems (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Medical Informatics (AREA)
- General Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Software Systems (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- General Engineering & Computer Science (AREA)
- Character Input (AREA)
- Character Discrimination (AREA)
- Editing Of Facsimile Originals (AREA)
Abstract
Description
図6は、変形例1にかかる画像形成装置のOCR処理動作の流れを示すフローチャートである。図4に示したフローチャートと同様の処理については、同符号を付して説明を略する。
変形例2にかかる画像処理装置では、OCR処理部106が、文字の一部分以外の他の部分が存在していると想定される方向に検出範囲を予め定められた長さ分広げ、当該予め定められた長さ分広げた検出範囲において再度OCR処理を実行する。そして、当該OCR処理で線画像が示す文字を特定できなかった場合、OCR処理部106は、文字の一部分以外の他の部分が存在していると想定される方向に検出範囲を予め定められた長さ分更に広げてOCR処理を実行する。
変形例3にかかる画像処理装置では、OCR処理部106が、広げた検出範囲においてOCR処理を再度実行した場合において線画像が示す文字を特定できなかったときに、広げる前の検出範囲においてOCR処理を実行する。
変形例4にかかる画像処理装置では、OCR処理部106が、広げた検出範囲においてOCR処理を再度実行した場合において線画像が示す文字を特定できなかったときに、当該広げた検出範囲を予め定められた長さ分狭め、当該狭めた検出範囲においてOCR処理を実行する。そして、当該OCR処理で線画像が示す文字を特定できなかった場合、OCR処理部106は、検出範囲を予め定められた長さ分更に狭めてOCR処理を実行する。
上記の実施形態および変形例では、マーカーペンを用いたマーキングによりOCR処理を施す検出範囲を指定する場合を説明したが、本発明は必ずしもこの場合に限定されない。補足1にかかる画像形成装置では、OCR処理を施す検出範囲が予め定められている。図8(A)は、画像形成装置10による処理対象となる原稿の一例を示す図である。原稿a2には、文字記入欄hlおよびh2が設けられており、当該文字記入欄h1およびh2の内部がOCR処理を施す検出範囲として予め定められている。原稿a2の文字記入欄h1およびh2には、ユーザーが手書きにより文字を記入する。このため、誤って文字記入欄h1およびh2の枠に重なるように文字が記入される場合がある。図8(A)に示す例では、「海」といった文字が文字記入欄h2の枠に重なっている。
上記の実施形態および変形例では、ひらがなおよび漢字で示された文字に対してOCR処理を行う場合を説明したが、本発明は必ずしもこの場合に限定されない。以下では、アルファベットの文字に対して、上記の実施形態および変形例で示した画像処理装置を適用する場合を説明する。
100 制御ユニット
101 制御部
102 動作制御部
103 操作受付部
104 通信制御部
105 マーカー検出部
106 OCR処理部
110 画像読取部
160 記憶部
Claims (9)
- 画像データの指定された範囲を検出範囲として、当該検出範囲に含まれる線画像を検出するとともに、当該検出された線画像を解析して、当該線画像が示す文字を特定するOCR処理を実行するOCR処理部を備え、
前記OCR処理部は、前記OCR処理において前記線画像が示す文字を特定できなかった場合に、前記線画像が文字の一部分を示しているか否かを判定し、前記線画像が文字の一部分を示していると判定した時に、当該文字の一部分以外の他の部分が存在していると想定される方向に前記検出範囲を広げ、当該広げた検出範囲において再度前記OCR処理を実行する、画像処理装置。 - 前記OCR処理部は、前記検出範囲内に前記線画像が示す文字を特定することができた第1の範囲が存在する場合、当該第1の範囲に含まれる文字の並びに沿った方向を、前記文字の一部分以外の他の部分が存在していると想定される方向として決定して前記検出範囲を広げる、請求項1に記載の画像処理装置。
- 複数の文字を構成する線分の軌跡および位置関係を示す文字データベースを記憶した記憶部を更に備え、
前記OCR処理部は、(i)前記文字データベースに含まれる各文字に対して、前記線分の軌跡および位置関係から算出される前記線画像との類似度を算出し、(ii)当該算出された類似度が予め定められた第1の値以上である文字を、前記線画像が示す文字として特定し、(iii)当該算出された類似度が前記第1の値未満であり、かつ、前記第1の値より小さい予め定められた第2の値以上である文字を、前記線画像が一部分を示している文字として特定する、請求項1または請求項2に記載の画像処理装置。 - 漢字を構成する偏、旁、冠、脚、構、垂、または繞を含む部首を構成する線分の軌跡および位置関係を示す部首データベースを記憶した記憶部を更に備え、
前記OCR処理部は、前記部首データベースに含まれる各部首に対して、前記線分の軌跡および位置関係から算出される前記線画像との類似度を算出し、当該算出された類似度が予め定められた第3の値以上である部首を、前記線画像が示す部首として特定するとともに、前記線画像が文字の一部分を示していると判定する、請求項1に記載の画像処理装置。 - 前記OCR処理部は、前記線画像が示す部首を特定した場合、当該特定した部首が偏、旁、冠、脚、構、垂、または繞の何れであるかに基づいて、前記文字の他の部分が存在していると想定される方向を決定して前記検出範囲を広げる、請求項4に記載の画像処理装置。
- 前記OCR処理部は、前記文字の一部分以外の他の部分が存在していると想定される方向に前記検出範囲を予め定められた長さ分広げ、当該予め定められた長さ分広げた検出範囲において再度前記OCR処理を実行し、当該OCR処理で前記線画像が示す文字を特定できなかった場合、前記文字の一部分以外の他の部分が存在していると想定される方向に前記検出範囲を予め定められた長さ分更に広げて前記OCR処理を実行する、請求項1乃至請求項5の何れか1項に記載の画像処理装置。
- 前記OCR処理部は、前記広げた検出範囲において前記OCR処理を再度実行した場合において前記線画像が示す文字を特定できなかったときに、広げる前の検出範囲において前記OCR処理を実行する、請求項1乃至請求項5の何れか1項に記載の画像処理装置。
- 前記OCR処理部は、前記広げた検出範囲において前記OCR処理を再度実行した場合において前記線画像が示す文字を特定できなかったときに、当該広げた検出範囲を予め定められた長さ分狭め、当該狭めた検出範囲において前記OCR処理を実行し、当該OCR処理で前記線画像が示す文字を特定できなかった場合、前記検出範囲を予め定められた長さ分更に狭めて前記OCR処理を実行する、請求項1乃至請求項5の何れか1項に記載の画像処理装置。
- 前記画像データに示されるマーカー箇所を検出するマーカー検出部を更に備え、
前記OCR処理部は、前記マーカー検出部が検出したマーカー箇所により示される範囲を前記検出範囲として特定する、請求項1乃至請求項8の何れか1項に記載の画像処理装置。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016155938A JP6531738B2 (ja) | 2016-08-08 | 2016-08-08 | 画像処理装置 |
US15/661,394 US10503993B2 (en) | 2016-08-08 | 2017-07-27 | Image processing apparatus |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016155938A JP6531738B2 (ja) | 2016-08-08 | 2016-08-08 | 画像処理装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2018025885A true JP2018025885A (ja) | 2018-02-15 |
JP6531738B2 JP6531738B2 (ja) | 2019-06-19 |
Family
ID=61069308
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016155938A Expired - Fee Related JP6531738B2 (ja) | 2016-08-08 | 2016-08-08 | 画像処理装置 |
Country Status (2)
Country | Link |
---|---|
US (1) | US10503993B2 (ja) |
JP (1) | JP6531738B2 (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2021502628A (ja) * | 2018-02-28 | 2021-01-28 | キヤノン オイローパ エヌ.ヴェー. | 画像処理方法及び画像処理システム |
US11972197B2 (en) | 2018-08-27 | 2024-04-30 | Kyocera Document Solutions Inc. | OCR system |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20220027081A (ko) | 2019-06-10 | 2022-03-07 | 넥스트브이피유 (상하이) 코포레이트 리미티드 | 텍스트 검출 방법, 판독 지원 디바이스 및 매체 |
CN110032994B (zh) * | 2019-06-10 | 2019-09-20 | 上海肇观电子科技有限公司 | 文字检测方法、阅读辅助设备、电路及介质 |
JP7467928B2 (ja) * | 2020-01-20 | 2024-04-16 | 富士フイルムビジネスイノベーション株式会社 | 情報処理装置及びプログラム |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH06187485A (ja) * | 1992-12-17 | 1994-07-08 | Ricoh Co Ltd | 画像比較装置 |
JP2006338578A (ja) * | 2005-06-06 | 2006-12-14 | Mitsubishi Electric Corp | 文字認識装置 |
JP2011076581A (ja) * | 2009-09-04 | 2011-04-14 | Ricoh Co Ltd | 画像処理装置、画像処理システム、画像処理方法、及びプログラム |
JP2011228792A (ja) * | 2010-04-15 | 2011-11-10 | Murata Mach Ltd | 画像処理装置 |
Family Cites Families (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4105998A (en) * | 1976-03-30 | 1978-08-08 | Fujitsu Limited | Pattern recognition processing system |
JP3504054B2 (ja) * | 1995-07-17 | 2004-03-08 | 株式会社東芝 | 文書処理装置および文書処理方法 |
EP1818857B1 (en) * | 1995-07-31 | 2010-06-23 | Fujitsu Limited | Document processor and document processing method |
SG71018A1 (en) * | 1997-03-01 | 2000-03-21 | Inst Of Systems Science Nat Un | Robust identification code recognition system |
JP2004166062A (ja) | 2002-11-14 | 2004-06-10 | Hitachi Ltd | 書類読取装置 |
DE602004005216T2 (de) * | 2003-08-20 | 2007-12-20 | Oce-Technologies B.V. | Dokumentenscanner |
JP5280425B2 (ja) * | 2010-11-12 | 2013-09-04 | シャープ株式会社 | 画像処理装置、画像読取装置、画像形成装置、画像処理方法、プログラムおよびその記録媒体 |
JP5717691B2 (ja) * | 2012-05-28 | 2015-05-13 | 株式会社東芝 | 手書き文字検索装置、方法及びプログラム |
US9171204B2 (en) * | 2012-12-12 | 2015-10-27 | Qualcomm Incorporated | Method of perspective correction for devanagari text |
US9317764B2 (en) * | 2012-12-13 | 2016-04-19 | Qualcomm Incorporated | Text image quality based feedback for improving OCR |
US9213907B2 (en) * | 2013-06-28 | 2015-12-15 | Google Inc. | Hierarchical classification in credit card data extraction |
JP6463066B2 (ja) * | 2014-07-07 | 2019-01-30 | キヤノン株式会社 | 情報処理装置、情報処理方法、プログラム |
JP6119689B2 (ja) * | 2014-07-11 | 2017-04-26 | コニカミノルタ株式会社 | 電子文書生成システム、電子文書生成装置およびプログラム |
JP2016181057A (ja) * | 2015-03-23 | 2016-10-13 | 株式会社東芝 | 画像処理装置、画像処理方法及び画像処理プログラム |
US10474923B2 (en) * | 2016-06-27 | 2019-11-12 | Facebook, Inc. | Systems and methods for incremental character recognition to recognize characters in images |
US10579868B2 (en) * | 2017-03-30 | 2020-03-03 | Myscript | System and method for recognition of objects from ink elements |
-
2016
- 2016-08-08 JP JP2016155938A patent/JP6531738B2/ja not_active Expired - Fee Related
-
2017
- 2017-07-27 US US15/661,394 patent/US10503993B2/en not_active Expired - Fee Related
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH06187485A (ja) * | 1992-12-17 | 1994-07-08 | Ricoh Co Ltd | 画像比較装置 |
JP2006338578A (ja) * | 2005-06-06 | 2006-12-14 | Mitsubishi Electric Corp | 文字認識装置 |
JP2011076581A (ja) * | 2009-09-04 | 2011-04-14 | Ricoh Co Ltd | 画像処理装置、画像処理システム、画像処理方法、及びプログラム |
JP2011228792A (ja) * | 2010-04-15 | 2011-11-10 | Murata Mach Ltd | 画像処理装置 |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2021502628A (ja) * | 2018-02-28 | 2021-01-28 | キヤノン オイローパ エヌ.ヴェー. | 画像処理方法及び画像処理システム |
JP7038988B2 (ja) | 2018-02-28 | 2022-03-22 | キヤノン オイローパ エヌ.ヴェー. | 画像処理方法及び画像処理システム |
US11972197B2 (en) | 2018-08-27 | 2024-04-30 | Kyocera Document Solutions Inc. | OCR system |
Also Published As
Publication number | Publication date |
---|---|
US20180039847A1 (en) | 2018-02-08 |
US10503993B2 (en) | 2019-12-10 |
JP6531738B2 (ja) | 2019-06-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6531738B2 (ja) | 画像処理装置 | |
JP6878034B2 (ja) | 情報処理装置、制御方法、およびプログラム | |
US20140143721A1 (en) | Information processing device, information processing method, and computer program product | |
US8225200B2 (en) | Extracting a character string from a document and partitioning the character string into words by inserting space characters where appropriate | |
JP5372110B2 (ja) | 情報出力装置、情報出力方法、及びコンピュータプログラム | |
EP3522038A1 (en) | Method for translating characters and apparatus therefor | |
JP2018055255A (ja) | 情報処理装置、情報処理方法及びプログラム | |
US11418658B2 (en) | Image processing apparatus, image processing system, image processing method, and storage medium | |
US9614984B2 (en) | Electronic document generation system and recording medium | |
JP2021043775A (ja) | 情報処理装置及びプログラム | |
US10984277B2 (en) | Image analysis apparatus, image analysis method, and non-transitory computer readable medium | |
US20170308507A1 (en) | Image processing apparatus | |
US10638001B2 (en) | Information processing apparatus for performing optical character recognition (OCR) processing on image data and converting image data to document data | |
JP2018055256A (ja) | 情報処理装置、情報処理方法及びプログラム | |
US10015332B2 (en) | Image processing apparatus generating a portion of a page including a heading as a reduced image of the page, and image processing method, and non-transitory computer readable medium thereof | |
US10127478B2 (en) | Electronic apparatus and method | |
JP6593259B2 (ja) | 電子機器 | |
JP6700705B2 (ja) | 振り分けシステム、情報処理方法、及びプログラム | |
JP6601143B2 (ja) | 印刷装置 | |
JP7302175B2 (ja) | 情報処理装置、及び情報処理プログラム | |
JP2016103150A (ja) | 文書処理装置および文書処理プログラム | |
US11354496B2 (en) | Information processing apparatus and non-transitory computer readable medium storing program | |
JP2013182459A (ja) | 情報処理装置、情報処理方法及びプログラム | |
US11765301B2 (en) | Image processing apparatus generating image of review question, control method therefor, and storage medium storing control program therefor | |
WO2022097408A1 (ja) | 画像処理装置及び画像形成装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20180627 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20190409 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20190423 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20190506 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6531738 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |