JP5913763B1 - 基準線設定装置、基準線設定方法及び基準線設定プログラム - Google Patents
基準線設定装置、基準線設定方法及び基準線設定プログラム Download PDFInfo
- Publication number
- JP5913763B1 JP5913763B1 JP2016504816A JP2016504816A JP5913763B1 JP 5913763 B1 JP5913763 B1 JP 5913763B1 JP 2016504816 A JP2016504816 A JP 2016504816A JP 2016504816 A JP2016504816 A JP 2016504816A JP 5913763 B1 JP5913763 B1 JP 5913763B1
- Authority
- JP
- Japan
- Prior art keywords
- line
- position information
- character
- reference line
- setting
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 54
- 238000009826 distribution Methods 0.000 claims description 22
- 230000006870 function Effects 0.000 claims description 9
- 238000010586 diagram Methods 0.000 description 7
- 239000000284 extract Substances 0.000 description 4
- 230000015654 memory Effects 0.000 description 4
- 230000010354 integration Effects 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 2
- 108010063993 lens intrinsic protein MP 64 Proteins 0.000 description 2
- 238000012706 support-vector machine Methods 0.000 description 2
- 230000007423 decrease Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/60—Type of objects
- G06V20/62—Text, e.g. of license plates, overlay texts or captions on TV images
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/18—Extraction of features or characteristics of the image
- G06V30/18086—Extraction of features or characteristics of the image by performing operations within image blocks or by using histograms
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T1/00—General purpose image data processing
- G06T1/0007—Image acquisition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Character Input (AREA)
- Character Discrimination (AREA)
Abstract
Description
Claims (11)
- 文字領域を含む画像を取得する画像取得手段と、
文字の縦方向における少なくとも2本の基準線が通る位置に関する線位置情報を文字ごとに記憶している記憶手段を参照して、前記画像の前記文字領域から所定の認識手法により認識された文字のうちの複数の文字の線位置情報を取得し、前記基準線は文字の配列方向に引かれ各文字の所定部分を沿わせて配列させるための線である、線位置情報取得手段と、
前記線位置情報取得手段により取得された基準線ごとの複数の線位置情報に基づいて、前記画像に各基準線を設定する設定手段と、
を備える基準線設定装置。 - 前記線位置情報取得手段は、1本の第1の基準線が通る位置を示す線位置情報を取得し、
前記設定手段は、複数の文字の、前記第1の基準線の線位置情報に基づいて、最小二乗法により当該第1の基準線を設定する、
請求項1に記載の基準線設定装置。 - 前記線位置情報は、前記文字の縦方向における基準線が通る位置の分布の平均と分散とからなり、
前記設定手段は、前記画像の前記文字領域から認識された複数の文字の、前記基準線のうちの前記第1の基準線以外の一の基準線の線位置情報の分布を積算し、線位置情報の分布の積算により得られた確率が最も高い位置を通り、前記第1の基準線と同じ傾きを有する線を、当該一の基準線として設定する、
請求項2に記載の基準線設定装置。 - 前記線位置情報は、前記文字の縦方向における基準線が通る位置の分布の平均と分散とからなり、
前記設定手段は、前記画像の前記文字領域から認識された複数の文字の、前記基準線のうちの前記第1の基準線以外の二以上の基準線の線位置情報の分布を積算し、線位置情報の分布の積算により得られた確率が最も高い位置を通り、前記第1の基準線と一点で交わる前記二以上の基準線を設定する、
請求項2に記載の基準線設定装置。 - 前記文字はアルファベットであり、
前記基準線は、アセンダーライン、ミーンライン、ベースライン及びディセンダーラインを含み、
前記線位置情報取得手段は、文字ごとのアセンダーライン、ミーンライン、ベースライン及びディセンダーラインの線位置情報を取得し、
前記設定手段は、複数の文字の、アセンダーライン、ミーンライン、ベースライン及びディセンダーラインのそれぞれの線位置情報に基づいて、各基準線を設定する、
請求項1〜4のいずれか一項に記載の基準線設定装置。 - 前記基準線が設定された複数の文字が表された複数の画像に基づいて、文字ごとの線位置情報を算出し、算出した線位置情報を文字ごとに前記記憶手段に記憶させる学習手段を更に備える、
請求項1〜5のいずれか一項に記載の基準線設定装置。 - 前記学習手段は、複数の画像に表された複数の文字に基づいて、文字の縦方向における各基準線が通る位置の平均及び分散を前記線位置情報として算出する、
請求項6に記載の基準線設定装置。 - 前記文字はアルファベットであり、
前記線位置情報取得手段は、大文字と小文字の形状が相似ではない文字の線位置情報を取得する、
請求項1〜7のいずれか一項に記載の基準線設定装置。 - 前記線位置情報取得手段は、前記画像からの文字の認識結果の確からしさを示す信頼性スコアが所定値以上の文字の線位置情報を取得する、
請求項1〜8のいずれか一項に記載の基準線設定装置。 - 基準線設定装置における基準線設定方法であって、
文字領域を含む画像を取得する画像取得ステップと、
文字の縦方向における少なくとも2本の基準線が通る位置に関する線位置情報を文字ごとに記憶している記憶手段を参照して、前記画像の前記文字領域から所定の認識手法により認識された文字のうちの複数の文字の線位置情報を取得し、前記基準線は文字の配列方向に引かれ各文字の所定部分を沿わせて配列させるための線である、線位置情報取得ステップと、
前記線位置情報取得ステップにおいて取得された基準線ごとの複数の線位置情報に基づいて、前記画像に各基準線を設定する設定ステップと、
を有する基準線設定方法。 - 基準線設定装置としてコンピュータを機能させる基準線設定プログラムであって、
前記コンピュータを、
文字領域を含む画像を取得する画像取得手段、
文字の縦方向における少なくとも2本の基準線が通る位置に関する線位置情報を文字ごとに記憶している記憶手段を参照して、前記画像の前記文字領域から所定の認識手法により認識された文字のうちの複数の文字の線位置情報を取得し、前記基準線は文字の配列方向に引かれ各文字の所定部分を沿わせて配列させるための線である、線位置情報取得手段、及び
前記線位置情報取得手段により取得された基準線ごとの複数の線位置情報に基づいて、前記画像に各基準線を設定する設定手段、
として機能させる基準線設定プログラム。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2015/070600 WO2017013720A1 (ja) | 2015-07-17 | 2015-07-17 | 基準線設定装置、基準線設定方法及び基準線設定プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP5913763B1 true JP5913763B1 (ja) | 2016-04-27 |
JPWO2017013720A1 JPWO2017013720A1 (ja) | 2017-07-20 |
Family
ID=55808320
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016504816A Active JP5913763B1 (ja) | 2015-07-17 | 2015-07-17 | 基準線設定装置、基準線設定方法及び基準線設定プログラム |
Country Status (3)
Country | Link |
---|---|
US (1) | US10311318B2 (ja) |
JP (1) | JP5913763B1 (ja) |
WO (1) | WO2017013720A1 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10311318B2 (en) * | 2015-07-17 | 2019-06-04 | Rakuten, Inc. | Reference line setting device, reference line setting method and reference line setting program |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH03126188A (ja) * | 1989-10-11 | 1991-05-29 | Oki Electric Ind Co Ltd | 文字認識装置 |
JPH04127288A (ja) * | 1990-05-21 | 1992-04-28 | Fuji Facom Corp | ベースラインによる文字判別方法 |
JPH05282493A (ja) * | 1992-03-31 | 1993-10-29 | Matsushita Electric Ind Co Ltd | 英文字認識装置 |
Family Cites Families (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2805523B2 (ja) * | 1990-05-01 | 1998-09-30 | 光洋電子工業株式会社 | 距離センサの不安定動作検出装置 |
JP4170441B2 (ja) * | 1997-11-28 | 2008-10-22 | 富士通株式会社 | 文書画像傾き検出装置および文書画像傾き検出プログラムの記憶媒体 |
JP2001101435A (ja) * | 1999-09-27 | 2001-04-13 | Toshiba Corp | 文書画像処理装置文書画像処理方法 |
JP4508553B2 (ja) * | 2003-06-02 | 2010-07-21 | カシオ計算機株式会社 | 撮影画像投影装置、及び撮影画像の補正方法 |
JP4667381B2 (ja) * | 2004-07-20 | 2011-04-13 | パナソニック株式会社 | 映像処理装置およびその方法 |
JP4607633B2 (ja) * | 2005-03-17 | 2011-01-05 | 株式会社リコー | 文字方向識別装置、画像形成装置、プログラム、記憶媒体および文字方向識別方法 |
JP5582674B2 (ja) * | 2007-07-20 | 2014-09-03 | アルパイン株式会社 | 文字データの生成装置および生成方法、文字データの表示制御装置および表示方法、ナビゲーション装置 |
US8423916B2 (en) * | 2008-11-20 | 2013-04-16 | Canon Kabushiki Kaisha | Information processing apparatus, processing method thereof, and computer-readable storage medium |
US8588529B2 (en) | 2011-08-15 | 2013-11-19 | Vistaprint Schweiz Gmbh | Method and system for detecting text in raster images |
US10607381B2 (en) * | 2014-07-07 | 2020-03-31 | Canon Kabushiki Kaisha | Information processing apparatus |
US10311318B2 (en) * | 2015-07-17 | 2019-06-04 | Rakuten, Inc. | Reference line setting device, reference line setting method and reference line setting program |
-
2015
- 2015-07-17 US US15/554,031 patent/US10311318B2/en active Active
- 2015-07-17 WO PCT/JP2015/070600 patent/WO2017013720A1/ja active Application Filing
- 2015-07-17 JP JP2016504816A patent/JP5913763B1/ja active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH03126188A (ja) * | 1989-10-11 | 1991-05-29 | Oki Electric Ind Co Ltd | 文字認識装置 |
JPH04127288A (ja) * | 1990-05-21 | 1992-04-28 | Fuji Facom Corp | ベースラインによる文字判別方法 |
JPH05282493A (ja) * | 1992-03-31 | 1993-10-29 | Matsushita Electric Ind Co Ltd | 英文字認識装置 |
Also Published As
Publication number | Publication date |
---|---|
US20180046873A1 (en) | 2018-02-15 |
JPWO2017013720A1 (ja) | 2017-07-20 |
WO2017013720A1 (ja) | 2017-01-26 |
US10311318B2 (en) | 2019-06-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR100658119B1 (ko) | 문자 인식 장치 및 방법 | |
CN105981051A (zh) | 用于图像解析的分层互连多尺度卷积网络 | |
Torki et al. | Window-based descriptors for Arabic handwritten alphabet recognition: a comparative study on a novel dataset | |
Yadav et al. | A robust approach for offline English character recognition | |
Okamoto et al. | Performance evaluation of a robust method for mathematical expression recognition | |
JP6754120B2 (ja) | プログラム、情報記憶媒体及び文字分割装置 | |
Naz et al. | Challenges in baseline detection of Arabic script based languages | |
JP5913763B1 (ja) | 基準線設定装置、基準線設定方法及び基準線設定プログラム | |
JP5857634B2 (ja) | 単語間空白検出装置、単語間空白検出方法及び単語間空白検出用コンピュータプログラム | |
JP6310155B2 (ja) | 文字認識装置、文字認識方法及び文字認識プログラム | |
Khorsheed | Recognizing Cursive Typewritten Text Using Segmentation‐Free System | |
JP2020173669A (ja) | 画像認識装置、画像認識方法、画像認識プログラム及び画像認識システム | |
Naz et al. | Challenges in baseline detection of cursive script languages | |
US11210564B2 (en) | Information processing apparatus for character recognition and non-transitory computer readable medium | |
Suwanwiwat et al. | Off-line handwritten Thai name recognition for student identification in an automated assessment system | |
Sajedi et al. | Persian handwritten number recognition using adapted framing feature and support vector machines | |
Patil et al. | Real time handwritten Marathi numerals recognition using neural network | |
Pattanayak | Recognizing ODIA handwritten scripts | |
Mirza | Printed arabic characters recognition based on minimum distance classifier technique | |
JP2000331122A (ja) | 文字認識方法および装置 | |
Zaw et al. | Segmentation Method for Myanmar Character Recognition Using Block based Pixel Count and Aspect Ratio | |
KR102673900B1 (ko) | 표 데이터 추출 시스템 및 그 방법 | |
JP7065065B2 (ja) | 文字認識装置 | |
JP5298830B2 (ja) | 画像処理プログラム、画像処理装置及び画像処理システム | |
JP5277750B2 (ja) | 画像処理プログラム、画像処理装置及び画像処理システム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20160201 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20160201 |
|
A871 | Explanation of circumstances concerning accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A871 Effective date: 20160201 |
|
TRDD | Decision of grant or rejection written | ||
A975 | Report on accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A971005 Effective date: 20160324 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20160329 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20160401 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5913763 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: R3D02 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |