JP7417192B2 - 画像処理システムおよび画像処理プログラム - Google Patents
画像処理システムおよび画像処理プログラム Download PDFInfo
- Publication number
- JP7417192B2 JP7417192B2 JP2020022093A JP2020022093A JP7417192B2 JP 7417192 B2 JP7417192 B2 JP 7417192B2 JP 2020022093 A JP2020022093 A JP 2020022093A JP 2020022093 A JP2020022093 A JP 2020022093A JP 7417192 B2 JP7417192 B2 JP 7417192B2
- Authority
- JP
- Japan
- Prior art keywords
- image
- tile
- specific
- handwritten
- segmentation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000011218 segmentation Effects 0.000 claims description 53
- 238000013527 convolutional neural network Methods 0.000 claims description 22
- 238000010586 diagram Methods 0.000 description 21
- 238000000034 method Methods 0.000 description 12
- 238000011176 pooling Methods 0.000 description 11
- 238000004891 communication Methods 0.000 description 5
- 239000000284 extract Substances 0.000 description 2
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N1/00—Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
- H04N1/00002—Diagnosis, testing or measuring; Detecting, analysing or monitoring not otherwise provided for
- H04N1/00026—Methods therefor
- H04N1/00039—Analysis, i.e. separating and studying components of a greater whole
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T3/00—Geometric image transformations in the plane of the image
- G06T3/40—Scaling of whole images or parts thereof, e.g. expanding or contracting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/11—Region-based segmentation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/44—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/19—Recognition using electronic means
- G06V30/191—Design or setup of recognition systems or techniques; Extraction of features in feature space; Clustering techniques; Blind source separation
- G06V30/19173—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/22—Character recognition characterised by the type of writing
- G06V30/226—Character recognition characterised by the type of writing of cursive writing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/413—Classification of content, e.g. text, photographs or tables
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N1/00—Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
- H04N1/00002—Diagnosis, testing or measuring; Detecting, analysing or monitoring not otherwise provided for
- H04N1/00005—Diagnosis, testing or measuring; Detecting, analysing or monitoring not otherwise provided for relating to image data
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N1/00—Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
- H04N1/00002—Diagnosis, testing or measuring; Detecting, analysing or monitoring not otherwise provided for
- H04N1/00026—Methods therefor
- H04N1/00037—Detecting, i.e. determining the occurrence of a predetermined state
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N1/00—Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
- H04N1/38—Circuits or arrangements for blanking or otherwise eliminating unwanted parts of pictures
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N1/00—Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
- H04N1/40—Picture signal circuits
- H04N1/40093—Modification of content of picture, e.g. retouching
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N1/00—Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
- H04N1/46—Colour picture communication systems
- H04N1/64—Systems for the transmission or the storage of the colour picture signal; Details therefor, e.g. coding or decoding means therefor
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10004—Still image; Photographic image
- G06T2207/10008—Still image; Photographic image from scanner, fax or copier
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20021—Dividing image into blocks, subimages or windows
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20084—Artificial neural networks [ANN]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30176—Document
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N2201/00—Indexing scheme relating to scanning, transmission or reproduction of documents or the like, and to details thereof
- H04N2201/0077—Types of the still picture apparatus
- H04N2201/0094—Multifunctional device, i.e. a device capable of all of reading, reproducing, copying, facsimile transception, file transception
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Signal Processing (AREA)
- General Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Editing Of Facsimile Originals (AREA)
- Image Analysis (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Facsimiles In General (AREA)
- Image Processing (AREA)
Description
17a 画像処理プログラム
17b 第1の閾値
17c 第2の閾値
17d 白紙データ(特定の画像のデータ)
18d 除去処理部
18e 強調処理部
22 セグメンテーション画像
31 CNN(畳み込みニューラルネットワーク)
31a エンコーダー
31b デコーダー
31c 白紙判定部(特定画像判定部)
32 セグメンテーション画像生成部
Claims (4)
- 手書きである確率を画像の画素毎に判定する畳み込みニューラルネットワークと、
前記畳み込みニューラルネットワークによる判定結果に基づいてセグメンテーション画像を生成するセグメンテーション画像生成部と
を備え、
前記畳み込みニューラルネットワークは、
前記画像を特定のサイズに分割したタイル画像毎に前記タイル画像の情報を圧縮するエンコーダーと、
前記エンコーダーによって圧縮された前記タイル画像の情報を復元するデコーダーと、
前記タイル画像が特定の画像であるか否かを判定する特定画像判定部と
を備え、
前記セグメンテーション画像生成部は、
前記タイル画像が前記特定の画像であると前記特定画像判定部によって判定された場合に、前記セグメンテーション画像のうち、このタイル画像に対応する部分の画像として、前記特定の画像を使用し、
前記タイル画像が前記特定の画像ではないと前記特定画像判定部によって判定された場合に、前記セグメンテーション画像のうち、このタイル画像に対応する部分の画像として、前記デコーダーの出力画像を使用することを特徴とする画像処理システム。 - 前記特定画像判定部は、前記エンコーダーの出力に基づいて前記タイル画像が前記特定の画像であるか否かを判定することを特徴とする請求項1に記載の画像処理システム。
- 手書きの部分が除去された画像を生成する除去処理部と、
手書きの部分が強調された画像を生成する強調処理部と
を備え、
前記除去処理部は、前記確率が第1の閾値以上である画素の画像を除去し、
前記強調処理部は、前記確率が前記第1の閾値より小さい第2の閾値以上である画素の画像を強調することを特徴とする請求項1または請求項2に記載の画像処理システム。 - 手書きである確率を画像の画素毎に判定する畳み込みニューラルネットワークと、
前記畳み込みニューラルネットワークによる判定結果に基づいてセグメンテーション画像を生成するセグメンテーション画像生成部と
をコンピューターに実現させ、
前記畳み込みニューラルネットワークは、
前記画像を特定のサイズに分割したタイル画像毎に前記タイル画像の情報を圧縮するエンコーダーと、
前記エンコーダーによって圧縮された前記タイル画像の情報を復元するデコーダーと、
前記タイル画像が特定の画像であるか否かを判定する特定画像判定部と
を備え、
前記セグメンテーション画像生成部は、
前記タイル画像が前記特定の画像であると前記特定画像判定部によって判定された場合に、前記セグメンテーション画像のうち、このタイル画像に対応する部分の画像として、前記特定の画像を使用し、
前記タイル画像が前記特定の画像ではないと前記特定画像判定部によって判定された場合に、前記セグメンテーション画像のうち、このタイル画像に対応する部分の画像として、前記デコーダーの出力画像を使用することを特徴とする画像処理プログラム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020022093A JP7417192B2 (ja) | 2020-02-13 | 2020-02-13 | 画像処理システムおよび画像処理プログラム |
US17/172,253 US11496644B2 (en) | 2020-02-13 | 2021-02-10 | Image processing system and non-transitory computer-readable recording medium having stored thereon image processing program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020022093A JP7417192B2 (ja) | 2020-02-13 | 2020-02-13 | 画像処理システムおよび画像処理プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2021128488A JP2021128488A (ja) | 2021-09-02 |
JP7417192B2 true JP7417192B2 (ja) | 2024-01-18 |
Family
ID=77273143
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020022093A Active JP7417192B2 (ja) | 2020-02-13 | 2020-02-13 | 画像処理システムおよび画像処理プログラム |
Country Status (2)
Country | Link |
---|---|
US (1) | US11496644B2 (ja) |
JP (1) | JP7417192B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7282314B2 (ja) * | 2019-08-29 | 2023-05-29 | 京セラドキュメントソリューションズ株式会社 | 画像処理装置、画像処理方法及び画像処理プログラム |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2020017274A (ja) | 2018-07-19 | 2020-01-30 | タタ コンサルタンシー サービシズ リミテッドTATA Consultancy Services Limited | ニューラルネットワークを使用するエンドツーエンド手書きテキスト認識のためのシステムおよび方法 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7120297B2 (en) * | 2002-04-25 | 2006-10-10 | Microsoft Corporation | Segmented layered image system |
JP2005276188A (ja) | 2004-02-26 | 2005-10-06 | Yokohama Tlo Co Ltd | 手書き文字除去画像処理装置、及び手書き文字除去画像処理方法 |
JP6822359B2 (ja) | 2017-09-20 | 2021-01-27 | 京セラドキュメントソリューションズ株式会社 | 画像形成装置 |
-
2020
- 2020-02-13 JP JP2020022093A patent/JP7417192B2/ja active Active
-
2021
- 2021-02-10 US US17/172,253 patent/US11496644B2/en active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2020017274A (ja) | 2018-07-19 | 2020-01-30 | タタ コンサルタンシー サービシズ リミテッドTATA Consultancy Services Limited | ニューラルネットワークを使用するエンドツーエンド手書きテキスト認識のためのシステムおよび方法 |
Non-Patent Citations (2)
Title |
---|
Paloma G. S. Silva 等,Speeding-up the Handwritten Signature Segmentation Process through an Optimized Fully Convolutional Neural Network,2019 International Conference on Document Analysis and Recognition (ICDAR),米国,IEEE,2019年09月25日,第1417-1423頁,https://ieeexplore.ieee.org/document/8977965 |
山本 祐美 等,ホワイトボードからの文字抽出手法の検討,情報処理学会 研究報告 数理モデル化と問題解決(MPS) 2019-MPS-126,日本,情報処理学会,2019年12月04日,第1-4頁 |
Also Published As
Publication number | Publication date |
---|---|
US11496644B2 (en) | 2022-11-08 |
US20210258447A1 (en) | 2021-08-19 |
JP2021128488A (ja) | 2021-09-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4745830B2 (ja) | 画像処理装置、画像処理方法、コンピュータプログラム | |
US8768052B2 (en) | Image processing apparatus, image processing method, and non-transitory computer readable medium | |
CN114299528B (zh) | 一种针对扫描文档的信息提取和结构化方法 | |
US8391607B2 (en) | Image processor and computer readable medium | |
JP4904175B2 (ja) | 低解像度のグリフ・イメージから高忠実度のグリフ・プロトタイプを作成するための方法および装置 | |
JP2007102545A (ja) | 電子文書作成装置、電子文書作成方法及び電子文書作成プログラム | |
US9171218B2 (en) | Image processing apparatus, image processing method, and computer readable medium that recognize overlapping elements in handwritten input | |
US9100518B2 (en) | Information processing apparatus, information processing method, and computer-readable medium | |
JP7417192B2 (ja) | 画像処理システムおよび画像処理プログラム | |
US9818028B2 (en) | Information processing apparatus for obtaining a degree of similarity between elements | |
JP4565396B2 (ja) | 画像処理装置および画像処理プログラム | |
US6983071B2 (en) | Character segmentation device, character segmentation method used thereby, and program therefor | |
US20100134851A1 (en) | Image processing apparatus, method for performing image processing and computer readable medium | |
JP6394579B2 (ja) | 画像読取装置及び画像形成装置 | |
US11288536B2 (en) | Image processing apparatus, image processing method, and non-transitory computer-readable storage medium | |
JP3726415B2 (ja) | 画像処理方法及び装置 | |
JP5262778B2 (ja) | 画像処理装置及び画像処理プログラム | |
JP2015177265A (ja) | 画像処理装置、画像処理システム、情報記憶方法およびプログラム | |
JP2007328652A (ja) | 画像処理装置および画像処理プログラム | |
US20240062567A1 (en) | Learning Image Generation Apparatus, Learning Image Generation Method, And Non-Transitory Computer-Readable Recording Medium | |
US11316995B2 (en) | Bending detection device and image processing apparatus | |
JP2011070327A (ja) | 画像属性判定装置、画像属性判定方法および画像属性判定プログラム | |
Devi et al. | Offline handwritten writer independent Tamil character recognition | |
US8736912B2 (en) | Image processing apparatus, image processing method and computer readable medium | |
WO2023062799A1 (ja) | 情報処理システム、原稿種識別方法、モデル生成方法及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20230130 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20231122 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20231206 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20231219 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7417192 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |