JP6310155B2 - 文字認識装置、文字認識方法及び文字認識プログラム - Google Patents
文字認識装置、文字認識方法及び文字認識プログラム Download PDFInfo
- Publication number
- JP6310155B2 JP6310155B2 JP2017529190A JP2017529190A JP6310155B2 JP 6310155 B2 JP6310155 B2 JP 6310155B2 JP 2017529190 A JP2017529190 A JP 2017529190A JP 2017529190 A JP2017529190 A JP 2017529190A JP 6310155 B2 JP6310155 B2 JP 6310155B2
- Authority
- JP
- Japan
- Prior art keywords
- recognition
- character
- recognizing
- characters
- line
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/146—Aligning or centring of the image pick-up or image-field
- G06V30/147—Determination of region of interest
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/217—Validation; Performance evaluation; Active pattern learning techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2411—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/18—Extraction of features or characteristics of the image
- G06V30/18086—Extraction of features or characteristics of the image by performing operations within image blocks or by using histograms
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/19—Recognition using electronic means
- G06V30/191—Design or setup of recognition systems or techniques; Extraction of features in feature space; Clustering techniques; Blind source separation
- G06V30/19173—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/32—Digital ink
- G06V30/333—Preprocessing; Feature extraction
- G06V30/347—Sampling; Contour coding; Stroke extraction
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/32—Digital ink
- G06V30/36—Matching; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Description
例えば、認識ウィンドウの上端または下端を、走査領域の上端または下端(基準線の位置)に完全に一致させて設定するのではなく、基準線の位置の近傍に設定することとしてもよい。
Claims (11)
- 文字領域を含む画像を取得する取得手段と、
前記画像の前記文字領域から、第1の認識手法により、文字を認識する第1認識手段と、
前記第1認識手段により認識された複数の文字のうちの少なくとも一部の文字に対して、前記複数の文字の配列方向に沿い各文字における所定位置を通る少なくとも2本の基準線を設定する設定手段と、
第2の認識手法により文字を認識する第2認識手段であって、前記第2の認識手法は、認識ウィンドウの大きさを変更しながら、画像における認識対象の領域内を走査させて、前記認識ウィンドウ内の画像から文字を認識する手法であり、前記文字領域のうちの、前記設定手段により設定された複数の前記基準線のうちの所定の2本の基準線により限定される走査領域に基づいて、前記認識ウィンドウの位置及び前記基準線に交わる方向の幅を設定する、第2認識手段と、
前記第2認識手段により認識された文字からなる語を認識結果として出力する出力手段と、
を備える文字認識装置。 - 前記第2認識手段は、前記走査領域の位置及び高さに基づいて、前記認識ウィンドウの縦方向における位置及び高さを設定する、請求項1に記載の文字認識装置。
- 前記設定手段は、文字ごとの各基準線の位置に関する情報を記憶している記憶手段を参照して、前記複数の文字に対して前記基準線を設定する、
請求項1または2に記載の文字認識装置。 - 前記第1認識手段は、認識結果の確からしさを示す第1信頼性スコアを、認識した文字ごとに算出し、
前記設定手段は、前記第1信頼性スコアが所定値以上である文字に対して、前記基準線を設定する、
請求項1〜3のいずれか一項に記載の文字認識装置。 - 前記第2認識手段は、前記第1信頼性スコアが所定値未満である文字が表された領域に対して、文字の認識を実施し、
前記出力手段は、前記第1認識手段及び前記第2認識手段により認識された文字からなる語を認識結果として出力すると、
請求項4に記載の文字認識装置。 - 前記第2認識手段は、認識結果の確からしさを示す第2信頼性スコアを、認識した文字ごとに算出し、
前記出力手段は、各文字の前記第2信頼性スコアに基づいて構成された文字列からなる語を認識結果として出力する、
請求項1〜5のいずれか一項に記載の文字認識装置。 - 前記出力手段は、第2認識手段により認識された複数の文字により構成される語としての尤もらしさを示す評価スコアを算出し、算出された評価スコアに基づいて認識結果としての語を出力する、
請求項1〜6のいずれか一項に記載の文字認識装置。 - 前記文字はアルファベットであり、
前記設定手段は、アセンダーライン、ミーンライン、ベースライン及びディセンダーラインを前記基準線として設定する、
請求項1〜7のいずれか一項に記載の文字認識装置。 - 前記第2認識手段は、前記アセンダーラインと前記ベースラインとの間、前記ミーンラインと前記ベースラインとの間、及び、前記ミーンラインと前記ディセンダーラインとの間を走査領域として特定する、
請求項8に記載の文字認識装置。 - 文字認識装置における文字認識方法であって、
文字領域を含む画像を取得する取得ステップと、
前記画像の前記文字領域から、第1の認識手法により、文字を認識する第1認識ステップと、
前記第1認識ステップにおいて認識された複数の文字のうちの少なくとも一部の文字に対して、前記複数の文字の配列方向に沿い各文字における所定位置を通る少なくとも2本の基準線を設定する設定ステップと、
第2の認識手法により文字を認識する第2認識ステップであって、前記第2の認識手法は、認識ウィンドウの大きさを変更しながら、画像における認識対象の領域内を走査させて、前記認識ウィンドウ内の画像から文字を認識する手法であり、前記文字領域のうちの、前記設定ステップにおいて設定された複数の前記基準線のうちの所定の2本の基準線により限定される走査領域に基づいて、前記認識ウィンドウの位置及び前記基準線に交わる方向の幅を設定する、第2認識ステップと、
前記第2認識ステップにおいて認識された文字からなる語を認識結果として出力する出力ステップと、
を有する文字認識方法。 - 文字認識装置としてコンピュータを機能させる文字認識プログラムであって、
前記コンピュータを、
文字領域を含む画像を取得する取得手段、
前記画像の前記文字領域から、第1の認識手法により、文字を認識する第1認識手段、
前記第1認識手段により認識された複数の文字のうちの少なくとも一部の文字に対して、前記複数の文字の配列方向に沿い各文字における所定位置を通る少なくとも2本の基準線を設定する設定手段、
第2の認識手法により文字を認識する第2認識手段であって、前記第2の認識手法は、認識ウィンドウの大きさを変更しながら、画像における認識対象の領域内を走査させて、前記認識ウィンドウ内の画像から文字を認識する手法であり、前記文字領域のうちの、前記設定手段により設定された複数の前記基準線のうちの所定の2本の基準線により限定される走査領域に基づいて、前記認識ウィンドウの位置及び前記基準線に交わる方向の幅を設定する、第2認識手段、及び、
前記第2認識手段により認識された文字からなる語を認識結果として出力する出力手段、
として機能させる文字認識プログラム。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2015/070597 WO2017013719A1 (ja) | 2015-07-17 | 2015-07-17 | 文字認識装置、文字認識方法及び文字認識プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2017013719A1 JPWO2017013719A1 (ja) | 2018-03-08 |
JP6310155B2 true JP6310155B2 (ja) | 2018-04-11 |
Family
ID=57834918
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017529190A Active JP6310155B2 (ja) | 2015-07-17 | 2015-07-17 | 文字認識装置、文字認識方法及び文字認識プログラム |
Country Status (3)
Country | Link |
---|---|
US (1) | US10657404B2 (ja) |
JP (1) | JP6310155B2 (ja) |
WO (1) | WO2017013719A1 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106934386B (zh) * | 2017-03-30 | 2019-06-25 | 湖南师范大学 | 一种基于自启发式策略的自然场景文字检测方法及系统 |
CN111259888A (zh) * | 2020-01-15 | 2020-06-09 | 平安国际智慧城市科技股份有限公司 | 基于图像的信息比对方法、装置及计算机可读存储介质 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2788506B2 (ja) * | 1989-10-11 | 1998-08-20 | 沖電気工業株式会社 | 文字認識装置 |
US6473517B1 (en) * | 1999-09-15 | 2002-10-29 | Siemens Corporate Research, Inc. | Character segmentation method for vehicle license plate recognition |
JP2004310251A (ja) * | 2003-04-03 | 2004-11-04 | Konica Minolta Medical & Graphic Inc | 文字認識方法、文字認識装置および文字認識プログラム |
TW200538969A (en) | 2004-02-11 | 2005-12-01 | America Online Inc | Handwriting and voice input with automatic correction |
KR101207127B1 (ko) * | 2010-03-19 | 2012-11-30 | 전남대학교산학협력단 | 문자 인식 전처리 방법 및 장치 |
US8768061B2 (en) * | 2012-05-02 | 2014-07-01 | Xerox Corporation | Post optical character recognition determination of font size |
-
2015
- 2015-07-17 US US15/744,131 patent/US10657404B2/en active Active
- 2015-07-17 JP JP2017529190A patent/JP6310155B2/ja active Active
- 2015-07-17 WO PCT/JP2015/070597 patent/WO2017013719A1/ja active Application Filing
Also Published As
Publication number | Publication date |
---|---|
WO2017013719A1 (ja) | 2017-01-26 |
JPWO2017013719A1 (ja) | 2018-03-08 |
US20180211127A1 (en) | 2018-07-26 |
US10657404B2 (en) | 2020-05-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101114135B1 (ko) | 카메라 입력된 문서들을 위한 저해상 ocr | |
CN102870399A (zh) | 在ocr过程中将词语位图分割为单个字符或字形 | |
Tavoli et al. | Statistical geometric components of straight lines (SGCSL) feature extraction method for offline Arabic/Persian handwritten words recognition | |
JP6754120B2 (ja) | プログラム、情報記憶媒体及び文字分割装置 | |
JP2730665B2 (ja) | 文字認識装置および方法 | |
US9330311B1 (en) | Optical character recognition | |
JP2000315247A (ja) | 文字認識装置 | |
Shanjana et al. | Offline recognition of malayalam handwritten text | |
JP6310155B2 (ja) | 文字認識装置、文字認識方法及び文字認識プログラム | |
Daniels et al. | Discriminating features for writer identification | |
Sharma et al. | Primitive feature-based optical character recognition of the Devanagari script | |
Thungamani | A survey of methods and strategies in handwritten kannada character segmentation | |
Ladwani et al. | Novel approach to segmentation of handwritten Devnagari word | |
Madushanka et al. | Sinhala handwritten character recognition by using enhanced thinning and curvature histogram based method | |
Bushofa et al. | Segmentation of Arabic characters using their contour information | |
Naz et al. | Arabic script based character segmentation: a review | |
JP5414631B2 (ja) | 文字列探索方法、文字列探索装置、記録媒体 | |
Hakro et al. | A Study of Sindhi Related and Arabic Script Adapted languages Recognition | |
Srinivas et al. | An overview of OCR research in Indian scripts | |
US9405997B1 (en) | Optical character recognition | |
KR20160053544A (ko) | 후보 문자의 추출 방법 | |
Chowdhury et al. | Bengali handwriting recognition and conversion to editable text | |
Naz et al. | Challenges in baseline detection of cursive script languages | |
Razak et al. | A real-time line segmentation algorithm for an offline overlapped handwritten Jawi character recognition chip | |
JP5913763B1 (ja) | 基準線設定装置、基準線設定方法及び基準線設定プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20171205 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20171205 |
|
A80 | Written request to apply exceptions to lack of novelty of invention |
Free format text: JAPANESE INTERMEDIATE CODE: A801 Effective date: 20171205 |
|
A871 | Explanation of circumstances concerning accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A871 Effective date: 20171205 |
|
A80 | Written request to apply exceptions to lack of novelty of invention |
Free format text: JAPANESE INTERMEDIATE CODE: A80 Effective date: 20171205 |
|
A975 | Report on accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A971005 Effective date: 20180228 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20180313 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20180315 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6310155 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: R3D02 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |