JP7338159B2 - 情報処理装置及びプログラム - Google Patents
情報処理装置及びプログラム Download PDFInfo
- Publication number
- JP7338159B2 JP7338159B2 JP2019010053A JP2019010053A JP7338159B2 JP 7338159 B2 JP7338159 B2 JP 7338159B2 JP 2019010053 A JP2019010053 A JP 2019010053A JP 2019010053 A JP2019010053 A JP 2019010053A JP 7338159 B2 JP7338159 B2 JP 7338159B2
- Authority
- JP
- Japan
- Prior art keywords
- character
- noise
- size
- characters
- input image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/60—Type of objects
- G06V20/62—Text, e.g. of license plates, overlay texts or captions on TV images
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/148—Segmentation of character regions
- G06V30/158—Segmentation of character regions using character size, text spacings or pitch estimation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/28—Character recognition specially adapted to the type of the alphabet, e.g. Latin alphabet
- G06V30/287—Character recognition specially adapted to the type of the alphabet, e.g. Latin alphabet of Kanji, Hiragana or Katakana characters
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Computation (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Computing Systems (AREA)
- Databases & Information Systems (AREA)
- General Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Software Systems (AREA)
- Character Discrimination (AREA)
- Character Input (AREA)
Description
Claims (5)
- 入力画像に対して文字認識処理を行うことにより、前記入力画像から認識した各文字について、その文字についての文字認識結果と、その文字の位置と、その文字のサイズと、その文字についての前記文字認識結果の確度と、を出力する文字認識手段と、
文字の位置から求められるその文字とその文字の最近接文字との距離と、その文字のサイズと、その文字についての前記文字認識結果の確度と、を3つの座標軸とする3次元空間の中で、前記入力画像から認識された文字のうちノイズに該当するものの座標の範囲を特定するための範囲情報、を用い、前記入力画像から認識された文字についての前記距離と前記サイズと前記確度とが示す座標が、前記範囲情報に示される前記範囲の中に含まれる場合には、当該文字についての前記文字認識結果をノイズとして、前記文字認識手段の出力した前記各文字についての前記文字認識結果のデータから除去する手段と、
を含む情報処理装置。 - 複数のサンプル画像と、それらサンプル画像の各々に含まれる画像要素がそれぞれ文字又はノイズのいずれに該当するか示す正解データと、の入力を受け付ける手段と、
前記複数のサンプル画像の各々を、前記文字認識手段又は同じ画像が入力された場合に前記文字認識手段と同じデータを出力する認識装置に入力し、この入力に応じて前記文字認識手段又は前記認識装置により認識された各文字についての前記距離と前記サイズと前記確度との組合せが示す座標点を前記3次元空間内にプロットし、プロットした各文字についての座標点と、前記正解データが示す、それら各文字に対応する画像要素が文字又はノイズのいずれに該当するかを示す情報とから、前記3次元空間の中での前記範囲を求めることで、前記範囲情報を生成する手段と、
を含む請求項1に記載の情報処理装置。 - 入力画像に対して文字認識処理を行うことにより、前記入力画像から認識した各文字について、その文字についての文字認識結果と、その文字の位置と、その文字のサイズと、その文字についての前記文字認識結果の確度と、を出力する文字認識手段と、
前記各文字のそれぞれについて、その文字の位置から求められるその文字とその文字の最近接文字との距離と、その文字のサイズと、その文字についての前記文字認識結果の確度と、に基づいて、その文字がノイズに該当するか否かの判定を行い、ノイズと判定した文字を前記文字認識手段の出力した前記各文字についての前記文字認識結果のデータから除去する判定手段と、
を含み、
前記判定手段は、前記距離と前記サイズと前記確度とを入力とし、前記文字認識手段の文字認識結果が文字又はノイズのいずれに該当するかを示す情報を出力するニューラルネットワーク、を用いて前記判定を行う、情報処理装置。 - 入力画像に対して文字認識処理を行うことにより、前記入力画像から認識した各文字について、その文字についての文字認識結果と、その文字の位置と、その文字のサイズと、その文字についての前記文字認識結果の確度と、を出力する文字認識手段と、
前記各文字のそれぞれについて、その文字の位置から求められるその文字とその文字の最近接文字との距離と、その文字のサイズと、その文字についての前記文字認識結果の確度と、に基づいて、その文字がノイズに該当するか否かの判定を行い、ノイズと判定した文字を前記文字認識手段の出力した前記各文字についての前記文字認識結果のデータから除去する判定手段と、
を含み、
前記判定手段は、前記文字がノイズではない真の文字であるために、前記距離が満たすべき値の範囲、前記サイズが満たすべき値の範囲、及び前記確度が満たすべき値の範囲の情報を用いることにより、前記距離、前記サイズ及び前記確度の3つの要素のうちの少なくとも1つの要素の値が当該要素に対応する前記範囲内にない場合に、前記文字がノイズに該当すると判定し、前記3つの要素の値が全て当該要素に対応する前記範囲内にある場合に前記文字がノイズに該当しないと判定する、ことを特徴とする情報処理装置。 - コンピュータを、
入力画像に対して文字認識処理を行うことにより、前記入力画像から認識した各文字について、その文字についての文字認識結果と、その文字の位置と、その文字のサイズと、その文字についての前記文字認識結果の確度と、を出力する文字認識手段、
文字の位置から求められるその文字とその文字の最近接文字との距離と、その文字のサイズと、その文字についての前記文字認識結果の確度と、を3つの座標軸とする3次元空間の中で、前記入力画像から認識された文字のうちノイズに該当するものの座標の範囲を特定するための範囲情報、を用い、前記入力画像から認識された文字についての前記距離と前記サイズと前記確度とが示す座標が、前記範囲情報に示される前記範囲の中に含まれる場合には、当該文字についての前記文字認識結果をノイズとして、前記文字認識手段の出力した前記各文字についての前記文字認識結果のデータから除去する手段、
として機能させるためのプログラム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019010053A JP7338159B2 (ja) | 2019-01-24 | 2019-01-24 | 情報処理装置及びプログラム |
US16/548,799 US11361529B2 (en) | 2019-01-24 | 2019-08-22 | Information processing apparatus and non-transitory computer readable medium |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019010053A JP7338159B2 (ja) | 2019-01-24 | 2019-01-24 | 情報処理装置及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2020119291A JP2020119291A (ja) | 2020-08-06 |
JP7338159B2 true JP7338159B2 (ja) | 2023-09-05 |
Family
ID=71732482
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019010053A Active JP7338159B2 (ja) | 2019-01-24 | 2019-01-24 | 情報処理装置及びプログラム |
Country Status (2)
Country | Link |
---|---|
US (1) | US11361529B2 (ja) |
JP (1) | JP7338159B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112052835B (zh) * | 2020-09-29 | 2022-10-11 | 北京百度网讯科技有限公司 | 信息处理方法、信息处理装置、电子设备和存储介质 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2017162149A (ja) | 2016-03-09 | 2017-09-14 | キヤノン株式会社 | 画像処理装置、プログラムおよび画像処理方法 |
Family Cites Families (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH056461A (ja) | 1991-06-28 | 1993-01-14 | Sanyo Electric Co Ltd | ノイズ除去方式 |
US6212299B1 (en) * | 1992-12-11 | 2001-04-03 | Matsushita Electric Industrial Co., Ltd. | Method and apparatus for recognizing a character |
JPH0749926A (ja) * | 1993-08-04 | 1995-02-21 | Fuji Xerox Co Ltd | 文字認識装置 |
JP3837193B2 (ja) * | 1996-05-13 | 2006-10-25 | 松下電器産業株式会社 | 文字行抽出方法および装置 |
JP2000295406A (ja) * | 1999-04-09 | 2000-10-20 | Canon Inc | 画像処理方法、装置及び記憶媒体 |
JP4275866B2 (ja) * | 2000-01-27 | 2009-06-10 | 富士通株式会社 | カラー画像から文字列パターンを抽出する装置および方法 |
JP2004110128A (ja) * | 2002-09-13 | 2004-04-08 | Ricoh Co Ltd | 画像処理装置、画像処理方法、および画像処理プログラム並びに記録媒体 |
JP2006072839A (ja) * | 2004-09-03 | 2006-03-16 | Ricoh Co Ltd | 画像処理方法、画像処理装置、画像処理プログラム及び記録媒体 |
JP5322517B2 (ja) * | 2008-07-08 | 2013-10-23 | キヤノン株式会社 | 画像処理装置および方法 |
JP5347793B2 (ja) * | 2009-07-17 | 2013-11-20 | 富士通株式会社 | 文字認識装置、文字認識プログラムおよび文字認識方法 |
US9092668B2 (en) * | 2009-07-18 | 2015-07-28 | ABBYY Development | Identifying picture areas based on gradient image analysis |
-
2019
- 2019-01-24 JP JP2019010053A patent/JP7338159B2/ja active Active
- 2019-08-22 US US16/548,799 patent/US11361529B2/en active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2017162149A (ja) | 2016-03-09 | 2017-09-14 | キヤノン株式会社 | 画像処理装置、プログラムおよび画像処理方法 |
Also Published As
Publication number | Publication date |
---|---|
US20200242389A1 (en) | 2020-07-30 |
US11361529B2 (en) | 2022-06-14 |
JP2020119291A (ja) | 2020-08-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111639646B (zh) | 一种基于深度学习的试卷手写英文字符识别方法及系统 | |
Bissacco et al. | Photoocr: Reading text in uncontrolled conditions | |
Choudhary et al. | A new character segmentation approach for off-line cursive handwritten words | |
US6335986B1 (en) | Pattern recognizing apparatus and method | |
EP2569930B1 (en) | Segmentation of a word bitmap into individual characters or glyphs during an ocr process | |
JP6900164B2 (ja) | 情報処理装置、情報処理方法及びプログラム | |
CN110942074A (zh) | 字符切分识别方法、装置、电子设备、存储介质 | |
CN110276351B (zh) | 多语言场景文本检测与识别方法 | |
WO2018090011A1 (en) | System and method of character recognition using fully convolutional neural networks | |
CN109948533B (zh) | 一种文本检测方法、装置、设备及可读存储介质 | |
RU2259592C2 (ru) | Способ распознавания графических объектов с использованием принципа целостности | |
CN116824608A (zh) | 基于目标检测技术的答题卡版面分析方法 | |
Wicht et al. | Camera-based sudoku recognition with deep belief network | |
JP7338159B2 (ja) | 情報処理装置及びプログラム | |
JP6116531B2 (ja) | 画像処理装置 | |
JP2009223612A (ja) | 画像認識装置及びプログラム | |
JP4810853B2 (ja) | 文字画像切出装置、文字画像切出方法およびプログラム | |
JP3798179B2 (ja) | パターン抽出装置及び文字切り出し装置 | |
JP5039659B2 (ja) | 文字認識方法及び文字認識装置 | |
KR102064974B1 (ko) | 블럽 기반의 문자 인식 방법 및 이를 위한 장치 | |
Chanda et al. | Font identification—In context of an Indic script | |
CN115082919B (zh) | 一种地址识别方法、电子设备及存储介质 | |
JP4328511B2 (ja) | パターン認識装置、パターン認識方法、プログラムおよび記憶媒体 | |
JP3209197B2 (ja) | 文字認識装置及び文字認識プログラムを記録した記録媒体 | |
JP5691281B2 (ja) | 文字認識装置、文字認識プログラム及び文字認識方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20211220 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20221227 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230131 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230328 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20230725 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20230807 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7338159 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |