JP2021128488A - 画像処理システムおよび画像処理プログラム - Google Patents
画像処理システムおよび画像処理プログラム Download PDFInfo
- Publication number
- JP2021128488A JP2021128488A JP2020022093A JP2020022093A JP2021128488A JP 2021128488 A JP2021128488 A JP 2021128488A JP 2020022093 A JP2020022093 A JP 2020022093A JP 2020022093 A JP2020022093 A JP 2020022093A JP 2021128488 A JP2021128488 A JP 2021128488A
- Authority
- JP
- Japan
- Prior art keywords
- image
- tile
- segmentation
- specific
- determination unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000011218 segmentation Effects 0.000 claims abstract description 58
- 238000013527 convolutional neural network Methods 0.000 claims description 21
- 238000000034 method Methods 0.000 description 20
- 238000010586 diagram Methods 0.000 description 12
- 238000011176 pooling Methods 0.000 description 11
- 238000004891 communication Methods 0.000 description 5
- 238000013528 artificial neural network Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N1/00—Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
- H04N1/00002—Diagnosis, testing or measuring; Detecting, analysing or monitoring not otherwise provided for
- H04N1/00026—Methods therefor
- H04N1/00039—Analysis, i.e. separating and studying components of a greater whole
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T3/00—Geometric image transformations in the plane of the image
- G06T3/40—Scaling of whole images or parts thereof, e.g. expanding or contracting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/11—Region-based segmentation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/44—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/19—Recognition using electronic means
- G06V30/191—Design or setup of recognition systems or techniques; Extraction of features in feature space; Clustering techniques; Blind source separation
- G06V30/19173—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/22—Character recognition characterised by the type of writing
- G06V30/226—Character recognition characterised by the type of writing of cursive writing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/413—Classification of content, e.g. text, photographs or tables
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N1/00—Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
- H04N1/00002—Diagnosis, testing or measuring; Detecting, analysing or monitoring not otherwise provided for
- H04N1/00005—Diagnosis, testing or measuring; Detecting, analysing or monitoring not otherwise provided for relating to image data
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N1/00—Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
- H04N1/00002—Diagnosis, testing or measuring; Detecting, analysing or monitoring not otherwise provided for
- H04N1/00026—Methods therefor
- H04N1/00037—Detecting, i.e. determining the occurrence of a predetermined state
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N1/00—Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
- H04N1/38—Circuits or arrangements for blanking or otherwise eliminating unwanted parts of pictures
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N1/00—Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
- H04N1/40—Picture signal circuits
- H04N1/40093—Modification of content of picture, e.g. retouching
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N1/00—Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
- H04N1/46—Colour picture communication systems
- H04N1/64—Systems for the transmission or the storage of the colour picture signal; Details therefor, e.g. coding or decoding means therefor
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10004—Still image; Photographic image
- G06T2207/10008—Still image; Photographic image from scanner, fax or copier
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20021—Dividing image into blocks, subimages or windows
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20084—Artificial neural networks [ANN]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30176—Document
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N2201/00—Indexing scheme relating to scanning, transmission or reproduction of documents or the like, and to details thereof
- H04N2201/0077—Types of the still picture apparatus
- H04N2201/0094—Multifunctional device, i.e. a device capable of all of reading, reproducing, copying, facsimile transception, file transception
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Signal Processing (AREA)
- General Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Editing Of Facsimile Originals (AREA)
- Image Analysis (AREA)
- Image Processing (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Facsimiles In General (AREA)
Abstract
【解決手段】 画像形成装置のCNN31は、画像を特定のサイズに分割したタイル画像毎にタイル画像の情報を圧縮するエンコーダー31aと、エンコーダー31aによって圧縮されたタイル画像の情報を復元するデコーダー31bと、タイル画像が白紙の画像であるか否かを判定する白紙判定部31cとを備え、セグメンテーション画像生成部32は、タイル画像が白紙の画像であると白紙判定部31cによって判定された場合に、セグメンテーション画像22のうち、このタイル画像に対応する部分の画像として、白紙の画像を使用し、タイル画像が白紙の画像ではないと白紙判定部31cによって判定された場合に、セグメンテーション画像22のうち、このタイル画像に対応する部分の画像としてデコーダー31bの出力画像を使用する。
【選択図】 図5
Description
17a 画像処理プログラム
17b 第1の閾値
17c 第2の閾値
17d 白紙データ(特定の画像のデータ)
18d 除去処理部
18e 強調処理部
22 セグメンテーション画像
31 CNN(畳み込みニューラルネットワーク)
31a エンコーダー
31b デコーダー
31c 白紙判定部(特定画像判定部)
32 セグメンテーション画像生成部
Claims (4)
- 手書きである確率を画像の画素毎に判定する畳み込みニューラルネットワークと、
前記畳み込みニューラルネットワークによる判定結果に基づいてセグメンテーション画像を生成するセグメンテーション画像生成部と
を備え、
前記畳み込みニューラルネットワークは、
前記画像を特定のサイズに分割したタイル画像毎に前記タイル画像の情報を圧縮するエンコーダーと、
前記エンコーダーによって圧縮された前記タイル画像の情報を復元するデコーダーと、
前記タイル画像が特定の画像であるか否かを判定する特定画像判定部と
を備え、
前記セグメンテーション画像生成部は、
前記タイル画像が前記特定の画像であると前記特定画像判定部によって判定された場合に、前記セグメンテーション画像のうち、このタイル画像に対応する部分の画像として、前記特定の画像を使用し、
前記タイル画像が前記特定の画像ではないと前記特定画像判定部によって判定された場合に、前記セグメンテーション画像のうち、このタイル画像に対応する部分の画像として、前記デコーダーの出力画像を使用することを特徴とする画像処理システム。 - 前記特定画像判定部は、前記エンコーダーの出力に基づいて前記タイル画像が前記特定の画像であるか否かを判定することを特徴とする請求項1に記載の画像処理システム。
- 手書きの部分が除去された画像を生成する除去処理部と、
手書きの部分が強調された画像を生成する強調処理部と
を備え、
前記除去処理部は、前記確率が第1の閾値以上である画素の画像を除去し、
前記強調処理部は、前記確率が前記第1の閾値より小さい第2の閾値以上である画素の画像を強調することを特徴とする請求項1または請求項2に記載の画像処理システム。 - 手書きである確率を画像の画素毎に判定する畳み込みニューラルネットワークと、
前記畳み込みニューラルネットワークによる判定結果に基づいてセグメンテーション画像を生成するセグメンテーション画像生成部と
をコンピューターに実現させ、
前記畳み込みニューラルネットワークは、
前記画像を特定のサイズに分割したタイル画像毎に前記タイル画像の情報を圧縮するエンコーダーと、
前記エンコーダーによって圧縮された前記タイル画像の情報を復元するデコーダーと、
前記タイル画像が特定の画像であるか否かを判定する特定画像判定部と
を備え、
前記セグメンテーション画像生成部は、
前記タイル画像が前記特定の画像であると前記特定画像判定部によって判定された場合に、前記セグメンテーション画像のうち、このタイル画像に対応する部分の画像として、前記特定の画像を使用し、
前記タイル画像が前記特定の画像ではないと前記特定画像判定部によって判定された場合に、前記セグメンテーション画像のうち、このタイル画像に対応する部分の画像として、前記デコーダーの出力画像を使用することを特徴とする画像処理プログラム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020022093A JP7417192B2 (ja) | 2020-02-13 | 2020-02-13 | 画像処理システムおよび画像処理プログラム |
US17/172,253 US11496644B2 (en) | 2020-02-13 | 2021-02-10 | Image processing system and non-transitory computer-readable recording medium having stored thereon image processing program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020022093A JP7417192B2 (ja) | 2020-02-13 | 2020-02-13 | 画像処理システムおよび画像処理プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2021128488A true JP2021128488A (ja) | 2021-09-02 |
JP7417192B2 JP7417192B2 (ja) | 2024-01-18 |
Family
ID=77273143
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020022093A Active JP7417192B2 (ja) | 2020-02-13 | 2020-02-13 | 画像処理システムおよび画像処理プログラム |
Country Status (2)
Country | Link |
---|---|
US (1) | US11496644B2 (ja) |
JP (1) | JP7417192B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7282314B2 (ja) * | 2019-08-29 | 2023-05-29 | 京セラドキュメントソリューションズ株式会社 | 画像処理装置、画像処理方法及び画像処理プログラム |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2020017274A (ja) * | 2018-07-19 | 2020-01-30 | タタ コンサルタンシー サービシズ リミテッドTATA Consultancy Services Limited | ニューラルネットワークを使用するエンドツーエンド手書きテキスト認識のためのシステムおよび方法 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7120297B2 (en) * | 2002-04-25 | 2006-10-10 | Microsoft Corporation | Segmented layered image system |
JP2005276188A (ja) | 2004-02-26 | 2005-10-06 | Yokohama Tlo Co Ltd | 手書き文字除去画像処理装置、及び手書き文字除去画像処理方法 |
JP6822359B2 (ja) | 2017-09-20 | 2021-01-27 | 京セラドキュメントソリューションズ株式会社 | 画像形成装置 |
-
2020
- 2020-02-13 JP JP2020022093A patent/JP7417192B2/ja active Active
-
2021
- 2021-02-10 US US17/172,253 patent/US11496644B2/en active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2020017274A (ja) * | 2018-07-19 | 2020-01-30 | タタ コンサルタンシー サービシズ リミテッドTATA Consultancy Services Limited | ニューラルネットワークを使用するエンドツーエンド手書きテキスト認識のためのシステムおよび方法 |
Non-Patent Citations (2)
Title |
---|
PALOMA G. S. SILVA 等: "Speeding-up the Handwritten Signature Segmentation Process through an Optimized Fully Convolutional", 2019 INTERNATIONAL CONFERENCE ON DOCUMENT ANALYSIS AND RECOGNITION (ICDAR), JPN6023050013, 25 September 2019 (2019-09-25), US, pages 1417 - 1423, XP033701284, ISSN: 0005213073, DOI: 10.1109/ICDAR.2019.00228 * |
山本 祐美 等: "ホワイトボードからの文字抽出手法の検討", 情報処理学会 研究報告 数理モデル化と問題解決(MPS) 2019−MPS−126, JPN6023050014, 4 December 2019 (2019-12-04), JP, pages 1 - 4, ISSN: 0005213074 * |
Also Published As
Publication number | Publication date |
---|---|
JP7417192B2 (ja) | 2024-01-18 |
US11496644B2 (en) | 2022-11-08 |
US20210258447A1 (en) | 2021-08-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4745830B2 (ja) | 画像処理装置、画像処理方法、コンピュータプログラム | |
JP5699623B2 (ja) | 画像処理装置、画像処理システム、画像処理方法、および、プログラム | |
US8131081B2 (en) | Image processing apparatus, and computer program product | |
US20060010116A1 (en) | Image processing system and image processing method | |
JP2011008549A (ja) | 画像処理装置、画像読取装置、複合機、画像処理方法、プログラム、記録媒体 | |
JP2019057174A (ja) | スキャン画像から文字情報を取得する画像処理装置、画像処理方法、及びプログラム | |
US20220319215A1 (en) | Image processing method, device, electronic apparatus, and storage medium | |
US11496644B2 (en) | Image processing system and non-transitory computer-readable recording medium having stored thereon image processing program | |
JP4544315B2 (ja) | 紙文書処理装置及びプログラム | |
JP4419893B2 (ja) | 画像処理装置及び画像処理方法 | |
US11288536B2 (en) | Image processing apparatus, image processing method, and non-transitory computer-readable storage medium | |
JP4396710B2 (ja) | 画像処理装置、画像処理装置の制御方法、および画像処理装置の制御プログラム | |
JP2012049860A (ja) | 画像処理装置、画像処理方法およびプログラム | |
JP2015177265A (ja) | 画像処理装置、画像処理システム、情報記憶方法およびプログラム | |
US20240062567A1 (en) | Learning Image Generation Apparatus, Learning Image Generation Method, And Non-Transitory Computer-Readable Recording Medium | |
JP2015159427A (ja) | 画像読取装置、画像読取装置の制御方法及び制御プログラム | |
JP2013172260A (ja) | 画像処理装置及びプログラム | |
JP7452060B2 (ja) | 情報処理装置及びプログラム | |
JP7342518B2 (ja) | 画像処理装置及び画像処理プログラム | |
JP2007328652A (ja) | 画像処理装置および画像処理プログラム | |
JP2011070327A (ja) | 画像属性判定装置、画像属性判定方法および画像属性判定プログラム | |
JP2008181383A (ja) | 文字認識装置、文字認識装置の制御方法、および文字認識装置の制御プログラム | |
JP2022015969A (ja) | データ生成システムおよびデータ生成プログラム | |
JP2009071781A (ja) | 画像処理装置及び画像処理プログラム | |
JP2021117649A (ja) | 画像処理装置および画像処理プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20230130 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20231122 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20231206 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20231219 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7417192 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |