JP7479925B2 - 画像処理システム、画像処理方法、及びプログラム - Google Patents
画像処理システム、画像処理方法、及びプログラム Download PDFInfo
- Publication number
- JP7479925B2 JP7479925B2 JP2020085350A JP2020085350A JP7479925B2 JP 7479925 B2 JP7479925 B2 JP 7479925B2 JP 2020085350 A JP2020085350 A JP 2020085350A JP 2020085350 A JP2020085350 A JP 2020085350A JP 7479925 B2 JP7479925 B2 JP 7479925B2
- Authority
- JP
- Japan
- Prior art keywords
- image
- handwritten
- cpu
- area
- handwriting
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000012545 processing Methods 0.000 title claims description 174
- 238000003672 processing method Methods 0.000 title claims description 5
- PWPJGUXAGUPAHP-UHFFFAOYSA-N lufenuron Chemical compound C1=C(Cl)C(OC(F)(F)C(C(F)(F)F)F)=CC(Cl)=C1NC(=O)NC(=O)C1=C(F)C=CC=C1F PWPJGUXAGUPAHP-UHFFFAOYSA-N 0.000 title 1
- 238000000034 method Methods 0.000 claims description 189
- 230000008569 process Effects 0.000 claims description 160
- 238000013528 artificial neural network Methods 0.000 claims description 123
- 238000000605 extraction Methods 0.000 description 171
- 238000012015 optical character recognition Methods 0.000 description 97
- 238000010586 diagram Methods 0.000 description 63
- 238000003860 storage Methods 0.000 description 51
- 238000006243 chemical reaction Methods 0.000 description 45
- 238000004364 calculation method Methods 0.000 description 37
- 230000007704 transition Effects 0.000 description 31
- 230000006870 function Effects 0.000 description 21
- 238000011176 pooling Methods 0.000 description 16
- 239000000284 extract Substances 0.000 description 14
- 238000009826 distribution Methods 0.000 description 7
- 230000032258 transport Effects 0.000 description 7
- 238000012795 verification Methods 0.000 description 7
- 230000005540 biological transmission Effects 0.000 description 6
- 101150080418 ddp-1 gene Proteins 0.000 description 6
- 238000012549 training Methods 0.000 description 6
- 238000007639 printing Methods 0.000 description 4
- 101100498819 Caenorhabditis elegans ddr-1 gene Proteins 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 238000011156 evaluation Methods 0.000 description 3
- 239000013598 vector Substances 0.000 description 3
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 238000003825 pressing Methods 0.000 description 2
- 230000004913 activation Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000007789 sealing Methods 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 238000004904 shortening Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/22—Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/60—Type of objects
- G06V20/62—Text, e.g. of license plates, overlay texts or captions on TV images
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/148—Segmentation of character regions
- G06V30/153—Segmentation of character regions using recognition of characters or words
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/412—Layout analysis of documents structured with printed lines or input boxes, e.g. business forms or tables
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Multimedia (AREA)
- Artificial Intelligence (AREA)
- Data Mining & Analysis (AREA)
- Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- General Health & Medical Sciences (AREA)
- Software Systems (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Life Sciences & Earth Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Biophysics (AREA)
- Molecular Biology (AREA)
- Biomedical Technology (AREA)
- Mathematical Physics (AREA)
- Medical Informatics (AREA)
- Databases & Information Systems (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Character Discrimination (AREA)
- Character Input (AREA)
- Image Analysis (AREA)
Description
本実施例では、手書き領域推定および手書き抽出を、ニューラルネットワークを用いて構成する例を示す。
図1は画像処理システムの構成を示した図である。画像処理システム100は、画像処理装置101、学習装置102、画像処理サーバ103、OCRサーバ104より構成される。画像処理装置101と学習装置102、画像処理サーバ103、OCRサーバ104は、ネットワーク105を介して接続されている。
本システムにおけるニューラルネットワークの構成について説明する。図11はニューラルネットワークの構成を示す図である。本実施例のニューラルネットワーク1100は、画像の入力に対して複数種類の処理を行う。すなわち、ニューラルネットワーク1100は、入力された画像に対して、手書き領域推定、および手書き抽出を行う。そのため、本実施例のニューラルネットワーク1100は、それぞれ異なるタスクを処理する複数のニューラルネットワークを組み合わせた構造になっている。図11の例は、手書き領域推定ニューラルネットワークと、手書き抽出ニューラルネットワークが組み合わされた構造である。手書き領域推定ニューラルネットワークと手書き抽出ニューラルネットワークとで、エンコーダ(詳細後述)を共有している。なお、本実施例において、ニューラルネットワーク1100への入力画像は、グレースケール(1ch)の画像とするが、例えば、カラー(3ch)の画像など、他の形式でもよい。
本システムにおける学習シーケンスについて説明する。図3Aは画像処理システムの学習シーケンスを示す図である。
本システムにおける利用シーケンスについて説明する。図3Bは画像処理システムの利用シーケンスを示した図である。
上述したシステムを実現するために、各装置は次のような構成を備える。図2(a)は画像処理装置の構成を示す図である。図2(b)は学習装置の構成を示す図である。図2(c)は画像処理サーバの構成を示す図である。図2(d)はOCRサーバの構成を示す図である。
図3Aの学習シーケンスにおけるS301に示したユーザの指示は、次のような操作画面で行われる。図5(a)は学習原稿スキャン画面を示す図である。学習原稿スキャン画面500は、画像処理装置101の表示デバイス210に表示される画面の一例である。図5(a)に示すように、学習原稿スキャン画面500は、プレビュー領域501、スキャンボタン502、送信開始ボタン503を備える。
次に、画像処理装置101による原稿サンプル画像生成処理について説明する。図6(a)は原稿サンプル画像生成処理のフローを示す図である。この処理は、CPU201が、ストレージ208に記録されているコントローラプログラムを読み出し、RAM204に展開して実行することで実現される。これは、ユーザが、画像処理装置101の入力デバイス209を操作することにより開始される。
次に、学習装置102による原稿サンプル画像受信処理について説明する。図6(b)は原稿サンプル画像受信処理のフローを示す図である。この処理は、CPU231が、ストレージ235に記録されている学習データ生成プログラムを読み出し、RAM234に展開して実行することで実現される。これは、ユーザが、学習装置102の電源をON(オン)にすると開始される。
次に、学習装置102による正解データ生成処理について説明する。図6(c)は正解データ生成処理のフローを示す図である。
次に、学習装置102による学習データ生成処理について説明する。図7(a)は学習データ生成処理のフローを示す図である。この処理は、学習装置102の学習データ生成部112により実現される。これは、ユーザが、画像処理装置101の入力デバイス209を介して、所定の操作を行うことで開始される。
次に、学習装置102による学習処理について説明する。図7(b)は学習処理のフローを示す図である。この処理は、学習装置102の学習部113により実現される。これは、ユーザが、学習装置102の入力デバイス236を介して、所定の操作を行うことで開始される。なお、本実施例において、ニューラルネットワーク1100の学習には、ミニバッチ法を用いるものとする。
次に、画像処理装置101による、帳票テキスト化依頼処理について説明する。画像処理装置101は、手書き記入がされた帳票をスキャンして処理対象画像を生成する。そして、処理対象画像データを画像処理サーバ103に送信して、帳票テキスト化を依頼する。図9(a)は帳票テキスト化依頼処理のフローを示す図である。この処理は、画像処理装置101のCPU201が、ストレージ208に記録されているコントローラプログラムを読み出し、RAM204に展開して実行することにより実現される。これは、ユーザが、画像処理装置101の入力デバイス209を介して、所定の操作を行うことで開始される。
次に、画像処理サーバ103による帳票テキスト化処理について説明する。図9(b)は帳票テキスト化処理のフローを示す図である。図10は、帳票テキスト化処理における、データ生成処理の概要を示す図である。画像変換部114として機能する画像処理サーバ103は、画像処理装置101から処理対象画像を受信し、当該スキャン画像データに含まれる活字や手書き文字をOCRしてテキストデータを得る。活字に対するOCRは、活字OCR部117に実行させる。手書き文字に対するOCRは、手書きOCR部116に実行させる。帳票テキスト化処理は、CPU261が、ストレージ265に記憶されている画像処理サーバプログラムを読み出し、RAM264に展開して実行することで実現される。これは、ユーザが、画像処理サーバ103の電源をON(オン)にすると開始される。
本実施例では、手書き領域推定で取得した手書き領域のみに絞った特徴マップを手書き抽出のデコーダ部に入力する際、さらに領域を絞った特徴マップを入力する方法について説明する。実施例1では、例えば、手書き領域の誤抽出や、意図せぬペンの記入用紙への接触により生じる小さなペン汚れなどにより生じてしまう手書き抽出するうえで不要な小領域の存在を考慮していない。本実施例ではこうしたケースに対して、手書き抽出のデコーダ部に入力する特徴マップの領域をさらに絞る方法を説明する。なお、実施例2の画像処理システムの構成は、特徴部分を除いて実施例1の構成と同様である。そのため、同様の構成については、同様の符号を付し、その詳細な説明を省略する。
本実施例における、画像処理サーバ103による帳票テキスト化処理について説明する。図14(a)は実施例2における帳票テキスト化処理のフローを示す図である。この処理は、CPU261が、ストレージ265に記憶されている画像処理サーバプログラムを読み出し、RAM264に展開して実行することで実現される。これは、ユーザが、画像処理サーバ103の電源をON(オン)にすると開始される。
本実施例では、実施例1、2で説明した帳票テキスト化処理の方法に加えて、処理対象画像に手書き記入があるかどうかを判定する方法について説明する。実施例1、2では、処理対象画像の手書き領域のみに絞った特徴マップを手書き抽出のデコーダ部に入力することで、ニューラルネットワーク全体の計算量を低減していた。しかし、処理対象画像に手書き記入がない場合、手書き領域推定に無駄な計算を費やすことになる。例えば、サービス利用に関する申込書は、サービス提供者窓口での配布のみならず、近年ではインターネットにフォーマットが公開されている場合がある。申込者は事前にフォーマットをダウンロードして印刷紙・記入のうえ窓口に赴くことができ、窓口における手続き時間を短縮化することができる。フォーマットは電子ファイルであるため、利用者は、記入内容を電子的に入力して印刷することも可能である。すなわちこの場合、申込書は活字のみから構成される。サービス提供者は、手書きと活字から成る帳票ないし活字のみの帳票を処理してテキスト化する。
本実施例におけるニューラルネットワークの構成について説明する。図15は画像処理システムのニューラルネットワークの構成を示す図である。本実施例のニューラルネットワーク1500は、画像の入力に対して複数種類の処理を行う。例えば、ニューラルネットワーク1500は、入力された画像に対して手書き有無判定、手書き領域推定、手書き抽出を行う。そのため、本実施例のニューラルネットワーク1500は、互いに異なるタスクを処理する複数のニューラルネットワークを組み合わせた構造になっている。図15の例では、手書き有無判定ニューラルネットワーク、手書き領域推定ニューラルネットワーク、手書き抽出ニューラルネットワークが組み合わされた構造である。なお、本実施例において、ニューラルネットワーク1100への入力画像は、グレースケール(1ch)の画像とするが、例えば、カラー(3ch)の画像など、他の形式でもよい。
次に、学習装置102による学習データ生成処理について説明する。図16(a)は学習データ生成処理のフローを示す図である。この処理は、学習装置102の学習データ生成部112により実現される。これは、ユーザが、画像処理装置101の入力デバイス209を介して、所定の操作を行うことで開始される。
次に、学習装置102による学習処理について説明する。図16(b)は学習処理のフローを示す図である。この処理は、学習装置102の学習部113により実現される。これは、ユーザが、学習装置102の入力デバイス236を介して、所定の操作を行うことで開始される。なお、本実施例において、ニューラルネットワーク1500の学習には、ミニバッチ法を用いるものとする。
次に、画像処理サーバ103による帳票テキスト化処理について説明する。図17は帳票テキスト化処理のフローを示す図である。帳票テキスト化処理は、CPU261が、ストレージ265に記憶されている画像処理サーバプログラムを読み出し、RAM264に展開して実行することで実現される。これは、ユーザが、画像処理サーバ103の電源をON(オン)にすると開始される。
本実施例では、本発明のニューラルネットワーク、および構成を、実施例1、2、3とは別のタスクに適用するケースについて説明する。なお、本発明の構成とは、領域推定デコーダ部で推定した認識対象のオブジェクトを含む領域のみに絞った特徴マップを、認識対象のオブジェクトの画素を抽出するデコーダ部に入力する構成である。本実施例では、認識対象のオブジェクトとして、原稿内に含まれる押印画像(押印された印影の画像)を対象とする場合について説明する。すなわち、画素毎に、押印画像を構成する画素を抽出する処理、および、押印画像を含む領域を推定する処理について、ニューラルネットワークを用いて構成する例を示す。例えば、口座振替依頼書などでは、帳票内の押印をデータベース等に登録された押印と照合する場合がある。本実施例に示すように、押印を含む領域およびその画素を抽出することにより、照合対象の押印の抽出を自動化することができる。また、押印背景の印字(「印」などの押印箇所をガイドするための印字)と押印を分離することで、より高い精度で照合することができる。
実施例1と同様に、ユーザは、押印抽出正解データ作成画面および押印領域推定正解データ作成画面の表示内容に基づいて操作し、正解データを作成する。なお、押印抽出正解データ作成画面および押印領域推定正解データ作成画面は、図5に示す画面においてユーザの指定対象が押印になったものであり、操作は同様の形態である。また、本実施例における原稿サンプル画像は、例えば図18(a)および(b)に示すような帳票1800や帳票1850である。
学習装置102の学習データ生成部112により、実施例1と同様の学習データ生成処理が実現される。これは、ユーザが、画像処理装置101の入力デバイス209を介して、所定の操作を行うことで開始される。
次に、画像処理装置101による、押印照合依頼処理について説明する。画像処理装置101は、押印された帳票をスキャンして処理対象画像を生成する。そして、処理対象画像データを画像処理サーバ103に送信して、押印照合を依頼する。図20(a)は押印照合依頼処理のフローを示す図である。この処理は、画像処理装置101のCPU201が、ストレージ208に記録されているコントローラプログラムを読み出し、RAM204に展開して実行することにより実現される。これは、ユーザが、画像処理装置101の入力デバイス209を介して、所定の操作を行うことで開始される。
次に、画像処理サーバ103による押印照合処理について説明する。図20(b)は押印照合処理のフローを示す図である。なお、本実施例のシステムは、実施例1のOCRサーバ104の代わりに、不図示の押印照合サーバを有する。押印照合サーバは、押印画像と当該押印の登録者情報(例えば、氏名、住所、口座番号等)を関連付けて登録して蓄積する押印データベースを有する。また、送信された押印画像とデータベースに登録されている押印画像を照合して当該押印画像が登録されているか否かを出力する押印照合部を有する。画像変換部114として機能する画像処理サーバ103は、画像処理装置101から処理対象画像を受信し、当該スキャン画像データに含まれる押印を、押印照合サーバが有する押印データベースと照合して照合結果を得る。押印と押印データベースの照合は、押印照合部に実行させる。押印照合処理は、CPU261が、ストレージ265に記憶されている画像処理サーバプログラムを読み出し、RAM264に展開して実行することで実現される。これは、ユーザが、画像処理サーバ103の電源をON(オン)にすると開始される。
本発明は、上述の実施例の1以上の機能を実現するプログラムを、ネットワーク又は記憶媒体を介してシステム又は装置に供給し、そのシステム又は装置のコンピュータにおける1つ以上のプロセッサがプログラムを読出し実行する処理でも実現可能である。また、1以上の機能を実現する回路(例えば、ASIC)によっても実現可能である。
Claims (6)
- ニューラルネットワークを用いて、処理対象画像から、認識対象のオブジェクトが含まれる領域と、前記認識対象のオブジェクトに対応する画素とを求める手段を有することを特徴とする画像処理システムであって、
前記ニューラルネットワークは、
前記処理対象画像に対して畳み込み処理を行うことにより特徴マップを得るエンコーダ部と、
前記特徴マップに基づいて、前記認識対象のオブジェクトが含まれる領域を求める第1のデコーダ部と、
前記特徴マップから、前記第1のデコーダ部で求めた前記認識対象のオブジェクトが含まれる領域に対応する部分の部分特徴マップを求める部分特徴マップ取得部と、
前記部分特徴マップに基づいて、前記認識対象のオブジェクトに対応する画素を求める第2のデコーダ部と、
を含む、ことを特徴とする画像処理システム。 - 前記部分特徴マップ取得部は、前記第1のデコーダ部で求めた前記認識対象のオブジェクトが含まれる領域のうち、所定の画素数以下の領域を除く領域に対応する部分の部分特徴マップを求める、ことを特徴とする請求項1に記載の画像処理システム。
- 前記認識対象のオブジェクトは、手書きされた文字であることを特徴とする請求項1または2に記載の画像処理システム。
- 前記認識対象のオブジェクトは、押印された印影であることを特徴とする請求項1または2に記載の画像処理システム。
- コンピュータを、請求項1乃至4のいずれか1項に記載の画像処理システムとして機能させるためのプログラム。
- ニューラルネットワークを用いて、処理対象画像から、認識対象のオブジェクトが含まれる領域と、前記認識対象のオブジェクトに対応する画素とを求めることを特徴とする画像処理方法であって、
前記ニューラルネットワークは、
前記処理対象画像に対して畳み込み処理を行うことにより特徴マップを得るエンコーダ部と、
前記特徴マップに基づいて、前記認識対象のオブジェクトが含まれる領域を求める第1のデコーダ部と、
前記特徴マップから、前記第1のデコーダ部で求めた前記認識対象のオブジェクトが含まれる領域に対応する部分の部分特徴マップを求める部分特徴マップ取得部と、
前記部分特徴マップに基づいて、前記認識対象のオブジェクトに対応する画素を求める第2のデコーダ部と、
を含む、ことを特徴とする画像処理方法。
Priority Applications (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020085350A JP7479925B2 (ja) | 2020-05-14 | 2020-05-14 | 画像処理システム、画像処理方法、及びプログラム |
US17/317,673 US11983910B2 (en) | 2020-05-14 | 2021-05-11 | Image processing system, image processing method, and storage medium each for obtaining pixels of object using neural network |
EP21173730.9A EP3910550A1 (en) | 2020-05-14 | 2021-05-13 | Image processing apparatus and image processing method each for obtaining a region of object and pixels of the object using neural network |
CN202110521173.8A CN113673295A (zh) | 2020-05-14 | 2021-05-13 | 图像处理设备、图像处理方法和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020085350A JP7479925B2 (ja) | 2020-05-14 | 2020-05-14 | 画像処理システム、画像処理方法、及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2021179848A JP2021179848A (ja) | 2021-11-18 |
JP7479925B2 true JP7479925B2 (ja) | 2024-05-09 |
Family
ID=75919237
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020085350A Active JP7479925B2 (ja) | 2020-05-14 | 2020-05-14 | 画像処理システム、画像処理方法、及びプログラム |
Country Status (4)
Country | Link |
---|---|
US (1) | US11983910B2 (ja) |
EP (1) | EP3910550A1 (ja) |
JP (1) | JP7479925B2 (ja) |
CN (1) | CN113673295A (ja) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7559382B2 (ja) * | 2020-07-02 | 2024-10-02 | 京セラドキュメントソリューションズ株式会社 | 画像処理装置、画像処理方法及びプログラム |
JP2022092119A (ja) * | 2020-12-10 | 2022-06-22 | キヤノン株式会社 | 画像処理装置、画像処理方法およびプログラム |
CA3197566A1 (en) * | 2020-12-11 | 2022-06-16 | Raunak DEY | Handwriting recognition |
CN114359905B (zh) * | 2022-01-06 | 2023-05-26 | 北京百度网讯科技有限公司 | 一种文本识别方法、装置、电子设备及存储介质 |
CN114419636A (zh) * | 2022-01-10 | 2022-04-29 | 北京百度网讯科技有限公司 | 文本识别方法、装置、设备以及存储介质 |
US12073642B2 (en) * | 2022-01-18 | 2024-08-27 | Accenture Global Solutions Limited | Object detection using neural networks |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108537146A (zh) | 2018-03-22 | 2018-09-14 | 五邑大学 | 一种印刷体与手写体混合文本行提取系统 |
JP2019008460A (ja) | 2017-06-22 | 2019-01-17 | 株式会社東芝 | 物体検出装置、物体検出方法およびプログラム |
JP2019215647A (ja) | 2018-06-12 | 2019-12-19 | キヤノンマーケティングジャパン株式会社 | 情報処理装置、その制御方法及びプログラム。 |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20030012374A1 (en) * | 2001-07-16 | 2003-01-16 | Wu Jian Kang | Electronic signing of documents |
WO2012093304A1 (en) * | 2011-01-05 | 2012-07-12 | Koninklijke Philips Electronics N.V. | Video coding and decoding devices and methods preserving ppg relevant information |
JP5801237B2 (ja) * | 2012-03-29 | 2015-10-28 | パナソニック株式会社 | 部位推定装置、部位推定方法、および部位推定プログラム |
EP3007448A1 (en) * | 2014-10-07 | 2016-04-13 | Canon Kabushiki Kaisha | Disparity data encoding apparatus and method of controlling the same for |
US11080587B2 (en) * | 2015-02-06 | 2021-08-03 | Deepmind Technologies Limited | Recurrent neural networks for data item generation |
JP2019177032A (ja) | 2018-03-30 | 2019-10-17 | 株式会社ニデック | 眼科画像処理装置、および眼科画像処理プログラム |
JP2019194821A (ja) | 2018-05-06 | 2019-11-07 | 英俊 古川 | 目標認識装置、目標認識方法及びプログラム |
US11501548B2 (en) * | 2019-04-02 | 2022-11-15 | Edgeverve Systems Limited | Method and system for determining one or more target objects in an image |
-
2020
- 2020-05-14 JP JP2020085350A patent/JP7479925B2/ja active Active
-
2021
- 2021-05-11 US US17/317,673 patent/US11983910B2/en active Active
- 2021-05-13 EP EP21173730.9A patent/EP3910550A1/en active Pending
- 2021-05-13 CN CN202110521173.8A patent/CN113673295A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2019008460A (ja) | 2017-06-22 | 2019-01-17 | 株式会社東芝 | 物体検出装置、物体検出方法およびプログラム |
CN108537146A (zh) | 2018-03-22 | 2018-09-14 | 五邑大学 | 一种印刷体与手写体混合文本行提取系统 |
JP2019215647A (ja) | 2018-06-12 | 2019-12-19 | キヤノンマーケティングジャパン株式会社 | 情報処理装置、その制御方法及びプログラム。 |
Non-Patent Citations (2)
Title |
---|
Kiyoaki Itoi, Makoto Nakashizuka,An Extraction Method of Handwritten Characters on Printed Documents by Maxout Filter Networks,2018 International Symposium on Intelligent Signal Processing and Communication Systems (ISPACS),米国,IEEE,2018年11月30日,https://ieeexplore.ieee.org/document/8923153 |
吉田 壮、他3名,深層学習を用いた中国漢代木簡の文字領域検出,電子情報通信学会技術研究報告,第119巻、第458号,日本,一般社団法人電子情報通信学会,2020年02月07日,第39-44頁 |
Also Published As
Publication number | Publication date |
---|---|
EP3910550A1 (en) | 2021-11-17 |
US11983910B2 (en) | 2024-05-14 |
CN113673295A (zh) | 2021-11-19 |
US20210357674A1 (en) | 2021-11-18 |
JP2021179848A (ja) | 2021-11-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7479925B2 (ja) | 画像処理システム、画像処理方法、及びプログラム | |
US9922400B2 (en) | Image display apparatus and image display method | |
US7551753B2 (en) | Image processing apparatus and method therefor | |
US8112706B2 (en) | Information processing apparatus and method | |
JP4533273B2 (ja) | 画像処理装置及び画像処理方法、プログラム | |
US7876471B2 (en) | Image processing apparatus, control method and program thereof which searches for corresponding original electronic data based on a paper document | |
US20040218838A1 (en) | Image processing apparatus and method therefor | |
JP7387339B2 (ja) | 画像処理システム、画像処理方法、及びプログラム | |
US10650489B2 (en) | Image display apparatus, control method therefor, and storage medium | |
US8412705B2 (en) | Image processing apparatus, image processing method, and computer-readable storage medium | |
US11341733B2 (en) | Method and system for training and using a neural network for image-processing | |
US11941903B2 (en) | Image processing apparatus, image processing method, and non-transitory storage medium | |
US20230077608A1 (en) | Information processing apparatus, information processing method, and storage medium | |
US20090290797A1 (en) | Image processing for storing objects separated from an image in a storage device | |
JP7379063B2 (ja) | 画像処理システム、画像処理方法、及びプログラム | |
JP2023040886A (ja) | 画像処理装置、方法及びプログラム | |
JP2021131784A (ja) | 画像処理システム、プログラム、画像処理方法 | |
JP2023015483A (ja) | 画像処理装置、画像処理システム、画像処理方法、及びプログラム | |
JP2023014964A (ja) | 画像処理システム及び画像処理方法 | |
JP2023137094A (ja) | 画像処理装置、画像処理方法、及びプログラム | |
JP2021033577A (ja) | 画像処理システムと画像処理方法、及びプログラム | |
JP7570843B2 (ja) | 画像処理装置、画像形成システム、画像処理方法、およびプログラム | |
JP5988149B2 (ja) | 項目記入装置、項目記入システム及びプログラム | |
JP2022167414A (ja) | 画像処理装置、画像処理方法およびプログラム | |
JP3754721B2 (ja) | 画像処理装置及びその方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD01 | Notification of change of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7421 Effective date: 20200616 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20230508 |
|
RD01 | Notification of change of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7421 Effective date: 20231213 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20240314 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20240326 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20240424 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7479925 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |