JP6170860B2 - 文字認識装置及び識別関数生成方法 - Google Patents
文字認識装置及び識別関数生成方法 Download PDFInfo
- Publication number
- JP6170860B2 JP6170860B2 JP2014062641A JP2014062641A JP6170860B2 JP 6170860 B2 JP6170860 B2 JP 6170860B2 JP 2014062641 A JP2014062641 A JP 2014062641A JP 2014062641 A JP2014062641 A JP 2014062641A JP 6170860 B2 JP6170860 B2 JP 6170860B2
- Authority
- JP
- Japan
- Prior art keywords
- function
- character
- sample
- vector
- value
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Description
gy(i、j)=[f(i+1、j+1)+2f(i+1、j)+f(i+1、j−1)−f(i−1、j+1)−2f(i−1、j)−f(i−1、j−1)]/8
φki・φkj=0 (i≠j)
φki・φkj=0 (i≠j)
mkj(t+1)=mkj(t)+ρ(t)(∂e(y)/∂y)
202 入力装置
203 表示装置
204 イメージ取得装置
205 通信装置
206 演算装置(CPU)
207 外部記憶装置
213 学習用文字画像データベース
214 文字認識用辞書
Claims (14)
- プロセッサ及び記憶装置を有する文字認識装置であって、
前記記憶装置は、複数の文字種の複数の学習用文字画像を保持し、
前記プロセッサは、
前記各学習用文字画像を所定の次元数のベクトルに変換する特徴抽出処理と、
前記文字種ごとに、前記所定の次元数のベクトル空間上の楕円型二次識別関数を定義する二次関数初期設定処理と、
前記楕円型二次識別関数を用いて前記学習用文字画像を識別したときの誤差の程度を測る損失関数を定義する損失関数定義処理と、
前記楕円型二次識別関数を用いて、前記複数の学習用文字画像から選択されたサンプルを識別したときの前記損失関数の値が小さくなるように、前記サンプルのベクトルの位置を移動させるための修正ベクトルを計算するサンプル位置修正幅計算処理と、
前記修正ベクトルに基づいて、前記楕円型二次識別関数のパラメータを、前記楕円型二次識別関数の等高線を楕円形に維持したまま、前記損失関数の値が小さくなるように修正する係数修正処理と、
前記修正されたパラメータを有する前記楕円型二次識別関数を、入力された文字画像の識別及び棄却に使用する識別関数として前記記憶装置に保存する保存処理と、を実行することを特徴とする文字認識装置。 - 請求項1に記載の文字認識装置であって、
前記プロセッサは、
前記サンプル位置修正幅計算処理において、前記サンプルが属する文字種の前記楕円型二次識別関数を用いて前記サンプルを識別したときの前記損失関数の値が小さくなるように前記修正ベクトルを計算し、さらに、前記サンプルが属する文字種以外の文字種の前記楕円型二次識別関数を用いて前記サンプルを識別したときの前記損失関数の値が小さくなるように前記修正ベクトルを計算し、
前記係数修正処理において、計算された前記修正ベクトルの各々について、前記楕円型二次識別関数の等高線の楕円形の中心が、前記修正ベクトルの逆方向に移動するように、前記楕円型二次識別関数のパラメータを修正することを特徴とする文字認識装置。 - 請求項1に記載の文字認識装置であって、
前記プロセッサは、
前記サンプル位置修正幅計算処理において、前記サンプルが属する文字種の前記楕円型二次識別関数を用いて前記サンプルを識別したときの前記損失関数の値が小さくなるように前記修正ベクトルを計算し、さらに、前記サンプルが属する文字種以外の文字種の前記楕円型二次識別関数を用いて前記サンプルを識別したときの前記損失関数の値が小さくなるように前記修正ベクトルを計算し、
前記係数修正処理において、計算された前記修正ベクトルの各々について、前記楕円型二次識別関数の等高線の楕円形の中心の位置を始点とし、移動前の前記サンプルの位置を終点とするベクトルから、前記楕円形の中心の位置を始点とし、移動後の前記サンプルの位置を終点とするベクトルへの変換を、ベクトルの回転及びスケール変換によって表現し、前記楕円形が前記ベクトルの回転方向の逆方向に回転するように、前記楕円型二次識別関数のパラメータを修正することを特徴とする文字認識装置。 - 請求項1に記載の文字認識装置であって、
前記プロセッサは、
前記サンプル位置修正幅計算処理において、前記サンプルが属する文字種の前記楕円型二次識別関数を用いて前記サンプルを識別したときの前記損失関数の値が小さくなるように前記修正ベクトルを計算し、さらに、前記サンプルが属する文字種以外の文字種の前記楕円型二次識別関数を用いて前記サンプルを識別したときの前記損失関数の値が小さくなるように前記修正ベクトルを計算し、
前記係数修正処理において、計算された前記修正ベクトルの各々について、前記楕円型二次識別関数の等高線の楕円形の中心の位置を始点とし、移動前の前記サンプルの位置を終点とするベクトルから、前記楕円形の中心の位置を始点とし、移動後の前記サンプルの位置を終点とするベクトルへの変換を、ベクトルの回転及びスケール変換によって表現し、前記スケール変換が拡大であれば前記楕円形を縮小し、前記スケール変換が縮小であれば前記楕円形を拡大するように、前記楕円型二次識別関数のパラメータを修正することを特徴とする文字認識装置。 - 請求項1に記載の文字認識装置であって、
前記プロセッサは、
前記サンプル位置修正幅計算処理において、前記サンプルが属する文字種の前記楕円型二次識別関数を用いて前記サンプルを識別したときの前記損失関数の値が小さくなるように前記修正ベクトルを計算し、さらに、前記サンプルが属する文字種以外の文字種の前記楕円型二次識別関数を用いて前記サンプルを識別したときの前記損失関数の値が小さくなるように前記修正ベクトルを計算し、
前記係数修正処理において、計算された前記修正ベクトルの各々について、前記楕円型二次識別関数の等高線の楕円形の軸への前記サンプルのベクトルの射影の分布の分散値に基づいて、前記楕円型二次識別関数の主軸の大きさを変更するように、前記楕円型二次識別関数のパラメータを修正することを特徴とする文字認識装置。 - 請求項1に記載の文字認識装置であって、
前記プロセッサは、前記二次関数初期設定処理において、前記各文字種の複数の文字画像のベクトルの分布がガウス分布であると仮定してガウス分布のパラメータを推定することによって修正二次識別関数を定義することを特徴とする文字認識装置。 - 請求項1に記載の文字認識装置であって、
前記プロセッサは、入力された文字画像のベクトルを引数として前記各文字種の識別関数の値を計算し、前記入力された文字画像の識別結果として、計算された識別関数の値が最も大きい文字種を出力し、最も大きい識別関数の値が所定の閾値より小さいか、又は、最も大きい識別関数の値と2番目に大きい識別関数の値との差が所定の閾値より小さい場合、前記入力された文字画像に関する棄却フラグを出力することを特徴とする文字認識装置。 - プロセッサ及び記憶装置を有する文字認識装置であって、
前記記憶装置は、複数の文字種の複数の学習用文字画像を所定の次元数のベクトルに変換し、前記文字種ごとに、前記所定の次元数のベクトル空間上の楕円型二次識別関数を定義し、前記楕円型二次識別関数を用いて前記学習用文字画像を識別したときの誤差の程度を測る損失関数を定義し、前記楕円型二次識別関数を用いて、前記複数の学習用文字画像から選択されたサンプルを識別したときの前記損失関数の値が小さくなるように、前記サンプルのベクトルの位置を移動させるための修正ベクトルを計算し、前記修正ベクトルに基づいて、前記楕円型二次識別関数のパラメータを、前記楕円型二次識別関数の等高線を楕円形に維持したまま、前記損失関数の値が小さくなるように修正することによって生成された楕円型二次識別関数を、入力された文字画像の識別及び棄却に使用する識別関数として保持し、
前記プロセッサは、入力された文字画像のベクトルを引数として前記各文字種の識別関数の値を計算し、前記入力された文字画像の識別結果として、計算された識別関数の値が最も大きい文字種を出力し、最も大きい識別関数の値が所定の閾値より小さいか、又は、最も大きい識別関数の値と2番目に大きい識別関数の値との差が所定の閾値より小さい場合、前記入力された文字画像に関する棄却フラグを出力することを特徴とする文字認識装置。 - プロセッサ及び記憶装置を有する文字認識装置が実行する識別関数生成方法であって、
前記記憶装置は、複数の文字種の複数の学習用文字画像を保持し、
前記識別関数生成方法は、
前記各学習用文字画像を所定の次元数のベクトルに変換する特徴抽出手順と、
前記文字種ごとに、前記所定の次元数のベクトル空間上の楕円型二次識別関数を定義する二次関数初期設定手順と、
前記楕円型二次識別関数を用いて前記学習用文字画像を識別したときの誤差の程度を測る損失関数を定義する損失関数定義手順と、
前記楕円型二次識別関数を用いて、前記複数の学習用文字画像から選択されたサンプルを識別したときの前記損失関数の値が小さくなるように、前記サンプルのベクトルの位置を移動させるための修正ベクトルを計算するサンプル位置修正幅計算手順と、
前記修正ベクトルに基づいて、前記楕円型二次識別関数のパラメータを、前記楕円型二次識別関数の等高線を楕円形に維持したまま、前記損失関数の値が小さくなるように修正する係数修正手順と、
前記修正されたパラメータを有する前記楕円型二次識別関数を、入力された文字画像の識別及び棄却に使用する識別関数として前記記憶装置に保存する保存手順と、を含むことを特徴とする識別関数生成方法。 - 請求項9に記載の識別関数生成方法であって、
前記サンプル位置修正幅計算手順は、前記サンプルが属する文字種の前記楕円型二次識別関数を用いて前記サンプルを識別したときの前記損失関数の値が小さくなるように前記修正ベクトルを計算する手順と、前記サンプルが属する文字種以外の文字種の前記楕円型二次識別関数を用いて前記サンプルを識別したときの前記損失関数の値が小さくなるように前記修正ベクトルを計算する手順と、を含み、
前記係数修正手順は、計算された前記修正ベクトルの各々について、前記楕円型二次識別関数の等高線の楕円形の中心が、前記修正ベクトルの逆方向に移動するように、前記楕円型二次識別関数のパラメータを修正する手順を含むことを特徴とする識別関数生成方法。 - 請求項9に記載の識別関数生成方法であって、
前記サンプル位置修正幅計算手順は、前記サンプルが属する文字種の前記楕円型二次識別関数を用いて前記サンプルを識別したときの前記損失関数の値が小さくなるように前記修正ベクトルを計算する手順と、前記サンプルが属する文字種以外の文字種の前記楕円型二次識別関数を用いて前記サンプルを識別したときの前記損失関数の値が小さくなるように前記修正ベクトルを計算する手順と、を含み、
前記係数修正手順は、計算された前記修正ベクトルの各々について、前記楕円型二次識別関数の等高線の楕円形の中心の位置を始点とし、移動前の前記サンプルの位置を終点とするベクトルから、前記楕円形の中心の位置を始点とし、移動後の前記サンプルの位置を終点とするベクトルへの変換を、ベクトルの回転及びスケール変換によって表現し、前記楕円形が前記ベクトルの回転方向の逆方向に回転するように、前記楕円型二次識別関数のパラメータを修正する手順を含むことを特徴とする識別関数生成方法。 - 請求項9に記載の識別関数生成方法であって、
前記サンプル位置修正幅計算手順は、前記サンプルが属する文字種の前記楕円型二次識別関数を用いて前記サンプルを識別したときの前記損失関数の値が小さくなるように前記修正ベクトルを計算する手順と、前記サンプルが属する文字種以外の文字種の前記楕円型二次識別関数を用いて前記サンプルを識別したときの前記損失関数の値が小さくなるように前記修正ベクトルを計算する手順と、を含み、
前記係数修正手順は、計算された前記修正ベクトルの各々について、前記楕円型二次識別関数の等高線の楕円形の中心の位置を始点とし、移動前の前記サンプルの位置を終点とするベクトルから、前記楕円形の中心の位置を始点とし、移動後の前記サンプルの位置を終点とするベクトルへの変換を、ベクトルの回転及びスケール変換によって表現し、前記スケール変換が拡大であれば前記楕円形を縮小し、前記スケール変換が縮小であれば前記楕円形を拡大するように、前記楕円型二次識別関数のパラメータを修正する手順を含むことを特徴とする識別関数生成方法。 - 請求項9に記載の識別関数生成方法であって、
前記サンプル位置修正幅計算手順は、前記サンプルが属する文字種の前記楕円型二次識別関数を用いて前記サンプルを識別したときの前記損失関数の値が小さくなるように前記修正ベクトルを計算する手順と、前記サンプルが属する文字種以外の文字種の前記楕円型二次識別関数を用いて前記サンプルを識別したときの前記損失関数の値が小さくなるように前記修正ベクトルを計算する手順と、を含み、
前記係数修正手順は、計算された前記修正ベクトルの各々について、前記楕円型二次識別関数の等高線の楕円形の軸への前記サンプルのベクトルの射影の分布の分散値に基づいて、前記楕円型二次識別関数の主軸の大きさを変更するように、前記楕円型二次識別関数のパラメータを修正する手順を含むことを特徴とする識別関数生成方法。 - 請求項9に記載の識別関数生成方法であって、
前記二次関数初期設定手順は、前記各文字種の複数の文字画像のベクトルの分布がガウス分布であると仮定してガウス分布のパラメータを推定することによって修正二次識別関数を定義する手順を含むことを特徴とする識別関数生成方法。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014062641A JP6170860B2 (ja) | 2014-03-25 | 2014-03-25 | 文字認識装置及び識別関数生成方法 |
CN201510110197.9A CN104951781B (zh) | 2014-03-25 | 2015-03-13 | 字符辨识装置以及识别函数生成方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014062641A JP6170860B2 (ja) | 2014-03-25 | 2014-03-25 | 文字認識装置及び識別関数生成方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2015185033A JP2015185033A (ja) | 2015-10-22 |
JP6170860B2 true JP6170860B2 (ja) | 2017-07-26 |
Family
ID=54166422
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014062641A Active JP6170860B2 (ja) | 2014-03-25 | 2014-03-25 | 文字認識装置及び識別関数生成方法 |
Country Status (2)
Country | Link |
---|---|
JP (1) | JP6170860B2 (ja) |
CN (1) | CN104951781B (ja) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7037875B2 (ja) * | 2016-06-20 | 2022-03-17 | 日本電信電話株式会社 | 画像正規化装置、方法、及びコンピュータ読み取り可能な記録媒体 |
CN106294584B (zh) * | 2016-07-28 | 2019-11-05 | 北京百度网讯科技有限公司 | 排序模型的训练方法及装置 |
CN106778765B (zh) * | 2016-11-22 | 2021-04-23 | 深圳市捷顺科技实业股份有限公司 | 一种车牌识别的方法及装置 |
JP6996413B2 (ja) * | 2018-04-27 | 2022-01-17 | トヨタ自動車株式会社 | 解析装置および解析プログラム |
JP6670512B1 (ja) * | 2018-11-06 | 2020-03-25 | Necプラットフォームズ株式会社 | パターン認識装置、パターン認識方法及びプログラム |
CN109902428B (zh) * | 2019-03-12 | 2023-05-02 | 武汉轻工大学 | 椭圆锥面方程的模型识别方法、装置、终端设备及可读存储介质 |
CN110009747B (zh) * | 2019-04-11 | 2023-03-31 | 武汉轻工大学 | 单叶双曲面方程识别方法、设备、存储介质及装置 |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2906758B2 (ja) * | 1991-09-05 | 1999-06-21 | 日本電気株式会社 | 文字読取装置 |
JPH11345337A (ja) * | 1998-05-29 | 1999-12-14 | Ricoh Co Ltd | パターン辞書作成装置およびパターン辞書作成方法,並びにパターン辞書作成方法をコンピュータに記録した機械読み取り可能な記録媒体 |
JP4393720B2 (ja) * | 2001-01-31 | 2010-01-06 | 富士通株式会社 | パターン認識装置および方法 |
JP2002251592A (ja) * | 2001-02-22 | 2002-09-06 | Toshiba Corp | パターン認識辞書学習方法 |
JP5098504B2 (ja) * | 2007-08-09 | 2012-12-12 | 富士通株式会社 | 文字認識プログラム、文字認識装置および文字認識方法 |
JP6078953B2 (ja) * | 2012-02-17 | 2017-02-15 | オムロン株式会社 | 文字認識方法、およびこの方法を用いた文字認識装置およびプログラム |
JP5769029B2 (ja) * | 2012-03-13 | 2015-08-26 | 株式会社日立情報通信エンジニアリング | 文字認識装置、認識辞書生成装置及び正規化方法 |
-
2014
- 2014-03-25 JP JP2014062641A patent/JP6170860B2/ja active Active
-
2015
- 2015-03-13 CN CN201510110197.9A patent/CN104951781B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
CN104951781B (zh) | 2018-06-08 |
JP2015185033A (ja) | 2015-10-22 |
CN104951781A (zh) | 2015-09-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6170860B2 (ja) | 文字認識装置及び識別関数生成方法 | |
US10853638B2 (en) | System and method for extracting structured information from image documents | |
Eskenazi et al. | A comprehensive survey of mostly textual document segmentation algorithms since 2008 | |
Djeddi et al. | Text-independent writer recognition using multi-script handwritten texts | |
US9619702B2 (en) | System and method for transcribing handwritten records using word grouping with assigned centroids | |
Bissacco et al. | Photoocr: Reading text in uncontrolled conditions | |
US8509537B2 (en) | Learning weights of fonts for typed samples in handwritten keyword spotting | |
EP0740263B1 (en) | Method of training character templates for use in a recognition system | |
US8224092B2 (en) | Word detection method and system | |
EP2166488B1 (en) | Handwritten word spotter using synthesized typed queries | |
Balaha et al. | Automatic recognition of handwritten Arabic characters: a comprehensive review | |
US7929769B2 (en) | Script recognition for ink notes | |
JP6055297B2 (ja) | 文字認識装置及び方法、文字認識プログラム | |
US10963717B1 (en) | Auto-correction of pattern defined strings | |
Fischer | Handwriting recognition in historical documents | |
CN111523537A (zh) | 一种文字识别方法、存储介质及系统 | |
JP6609267B2 (ja) | ガボール関数を用いたパターン認識システム及び方法 | |
Pechwitz et al. | Handwritten Arabic word recognition using the IFN/ENIT-database | |
Shanjana et al. | Offline recognition of malayalam handwritten text | |
Ghadhban et al. | Segments interpolation extractor for finding the best fit line in Arabic offline handwriting recognition words | |
Lou et al. | Generative shape models: Joint text recognition and segmentation with very little training data | |
US11756321B2 (en) | Information processing apparatus and non-transitory computer readable medium | |
CN111612045B (zh) | 一种获取目标检测数据集的通用方法 | |
US11361529B2 (en) | Information processing apparatus and non-transitory computer readable medium | |
JP5344338B2 (ja) | プログラム、情報記憶媒体及び文字列認識装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20160722 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20170613 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20170620 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20170703 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6170860 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |