JP5365065B2 - 辞書作成装置 - Google Patents
辞書作成装置 Download PDFInfo
- Publication number
- JP5365065B2 JP5365065B2 JP2008126405A JP2008126405A JP5365065B2 JP 5365065 B2 JP5365065 B2 JP 5365065B2 JP 2008126405 A JP2008126405 A JP 2008126405A JP 2008126405 A JP2008126405 A JP 2008126405A JP 5365065 B2 JP5365065 B2 JP 5365065B2
- Authority
- JP
- Japan
- Prior art keywords
- distribution shape
- category
- character
- dictionary
- recognition
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/28—Determining representative reference patterns, e.g. by averaging or distorting; Generating dictionaries
Description
マハラノビス距離は式(5)で表される。
前記特徴量算出手段によってカテゴリごとに算出された特徴量から各カテゴリの特徴量群の分布形状を算出する分布形状算出手段と、
前記分布形状算出手段によってカテゴリごとに算出された特徴量群の分布形状をもとに、各カテゴリ間の分布形状の距離を算出する距離算出手段と、
前記距離算出手段によって算出された各カテゴリ間の分布形状の距離に基づいて、クラスタリング対象とする分布形状を決定するクラスタリング対象決定手段と、
前記クラスタリング対象決定手段によって決定されたクラスタリング対象の分布形状を代表させる代表分布形状を決定する代表分布形状決定手段と、
前記クラスタリング対象決定手段によってクラスタリング対象として決定された各分布形状をクラスタリングするクラスタリング手段と、
前記代表分布形状決定手段によって決定された代表分布形状と、前記クラスタリング手段によるクラスタリング後の代表分布形状の要素として含まれるカテゴリとを対応付ける対応付け手段と、
前記対応付け手段によって対応付けられた代表分布形状とカテゴリとを所定の辞書記憶手段に辞書登録する辞書登録手段と、
を備えたことを特徴とする辞書作成装置。
前記認識手段による認識結果のうち、誤認識の割合が相互に所定の閾値より大きいカテゴリの組合せを抽出する組合せ抽出手段と、
前記クラスタリング対象決定手段は、
前記組合せ抽出手段によって抽出されたカテゴリの組合せを除外してクラスタリング対象とする分布形状を決定することを特徴とする付記1に記載の辞書作成装置。
前記識別情報ごとに、前記カテゴリの平均特徴量群の分布形状を1または複数代表する代表分布形状を対応付けて記憶する第2の辞書記憶手段と、
認識対象とする入力データから特徴量を抽出する特徴量抽出手段と、
距離算出対象とするカテゴリに対応する平均特徴量及び識別情報を第1の辞書記憶手段から抽出するとともに、該識別情報に対応する代表分布形状を前記第2の辞書記憶手段から抽出する抽出手段と、
前記抽出手段によって抽出されたカテゴリの代表分布形状を用いて、前記特徴量抽出手段によって入力データから抽出された特徴量と当該カテゴリの平均特徴量との距離をカテゴリごとに算出する距離算出手段と、
前記距離算出手段によって算出された距離が最小となるカテゴリを認識結果として採用する認識手段と、
を備えたことを特徴とする認識装置。
パターン認識の認識項目とするカテゴリごとに当該カテゴリの平均特徴量及び識別情報を対応付けて記憶する第1の辞書記憶手段から、距離算出対象とするカテゴリに対応する平均特徴量及び識別情報を抽出するとともに、前記識別情報ごとに前記カテゴリの平均特徴量群の分布形状を1または複数代表する代表分布形状を対応付けて記憶する第2の辞書記憶手段から当該識別情報に対応する代表分布形状を抽出する抽出工程と、
前記抽出工程によって抽出されたカテゴリの代表分布形状を用いて、前記特徴量抽出工程によって入力データから抽出された特徴量と当該カテゴリの平均特徴量との距離をカテゴリごとに算出する距離算出工程と、
前記距離算出工程によって算出された距離が最小となるカテゴリを認識結果として採用する認識工程と、
を実行することを特徴とする認識方法。
パターン認識の認識項目とするカテゴリごとに当該カテゴリの平均特徴量及び識別情報を対応付けて記憶する第1の辞書記憶手段から、距離算出対象とするカテゴリに対応する平均特徴量及び識別情報を抽出するとともに、前記識別情報ごとに前記カテゴリの平均特徴量群の分布形状を1または複数代表する代表分布形状を対応付けて記憶する第2の辞書記憶手段から当該識別情報に対応する代表分布形状を抽出する抽出手順と、
前記抽出手順によって抽出されたカテゴリの代表分布形状を用いて、前記特徴量抽出手順によって入力データから抽出された特徴量と当該カテゴリの平均特徴量との距離をカテゴリごとに算出する距離算出手順と、
前記距離算出手順によって算出された距離が最小となるカテゴリを認識結果として採用する認識手順と、
を実行させることを特徴とする認識プログラム。
11 平均ベクトル算出部
12 分布形状算出部
13 クラスタリング部
14 分布形状決定部
15 対応付け部
16 辞書登録部
30 文字認識装置
31 辞書記憶部
32 特徴抽出部
33 文字認識部
Claims (1)
- パターン認識辞書を作成するための学習用データから、認識項目とするカテゴリごとの特徴量を算出する特徴量算出手段と、
前記特徴量算出手段によってカテゴリごとに算出された特徴量から各カテゴリの特徴量群の分布形状を算出する分布形状算出手段と、
前記分布形状算出手段によってカテゴリごとに算出された特徴量群の分布形状をもとに、クラスタ間の評価基準としてKullback-Leibler距離を用いて、各カテゴリ間の分布形状の距離を算出する距離算出手段と、
前記距離算出手段によって算出された各カテゴリ間の分布形状の距離に基づいて、クラスタリング対象とする分布形状を決定するクラスタリング対象決定手段と、
前記クラスタリング対象決定手段によって決定されたクラスタリング対象の分布形状を代表させる代表分布形状を決定する代表分布形状決定手段と、
前記分布形状算出手段によってカテゴリごとに算出された特徴量群の分布形状と、テスト用サンプルデータとの間で認識を行う認識手段と、
前記認識手段による認識結果のうち、誤認識の割合が相互に所定の閾値より大きいカテゴリの組合せを抽出する組合せ抽出手段と、
前記クラスタリング対象決定手段によってクラスタリング対象として決定された各分布形状のうち前記組合せ抽出手段によって抽出されたカテゴリの組合せを除外してクラスタリングを行うクラスタリング手段と、
前記代表分布形状決定手段によって決定された代表分布形状と、前記クラスタリング手段によるクラスタリング後の代表分布形状の要素として含まれるカテゴリとを対応付ける対応付け手段と、
前記対応付け手段によって対応付けられた代表分布形状とカテゴリとを所定の辞書記憶手段に辞書登録する辞書登録手段と、
を備えたことを特徴とする辞書作成装置。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008126405A JP5365065B2 (ja) | 2008-05-13 | 2008-05-13 | 辞書作成装置 |
US12/385,970 US8379983B2 (en) | 2008-05-13 | 2009-04-24 | Dictionary creating apparatus, recognizing apparatus, and recognizing method |
CN2009101384192A CN101582118B (zh) | 2008-05-13 | 2009-05-11 | 字符字典创建装置、字符识别装置及字符识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008126405A JP5365065B2 (ja) | 2008-05-13 | 2008-05-13 | 辞書作成装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2009276937A JP2009276937A (ja) | 2009-11-26 |
JP5365065B2 true JP5365065B2 (ja) | 2013-12-11 |
Family
ID=41316238
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008126405A Expired - Fee Related JP5365065B2 (ja) | 2008-05-13 | 2008-05-13 | 辞書作成装置 |
Country Status (3)
Country | Link |
---|---|
US (1) | US8379983B2 (ja) |
JP (1) | JP5365065B2 (ja) |
CN (1) | CN101582118B (ja) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2450850B1 (en) * | 2009-07-01 | 2020-12-23 | Nec Corporation | System and method for extracting representative feature |
KR101782978B1 (ko) | 2010-11-12 | 2017-09-29 | 삼성전자주식회사 | 참조 데이터의 가용성에 기초하여 영상 데이터를 복호화하는 장치 및 방법 |
CN103559504B (zh) * | 2013-11-04 | 2016-08-31 | 北京京东尚科信息技术有限公司 | 图像目标类别识别方法及装置 |
CN111459395A (zh) * | 2020-03-30 | 2020-07-28 | 北京集创北方科技股份有限公司 | 手势识别方法、系统、存储介质、人机交互设备 |
CN111783126B (zh) * | 2020-07-21 | 2022-04-29 | 支付宝(杭州)信息技术有限公司 | 一种隐私数据识别方法、装置、设备和可读介质 |
Family Cites Families (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4308523A (en) * | 1980-02-04 | 1981-12-29 | Compuscan, Incorporated | Apparatus and method for character recognition |
US4658429A (en) * | 1983-12-29 | 1987-04-14 | Hitachi, Ltd. | System and method for preparing a recognition dictionary |
US5142593A (en) * | 1986-06-16 | 1992-08-25 | Kabushiki Kaisha Toshiba | Apparatus and method for classifying feature data at a high speed |
JPH04316183A (ja) * | 1991-04-16 | 1992-11-06 | Seiko Epson Corp | 文字認識装置 |
JPH0546812A (ja) | 1991-08-20 | 1993-02-26 | Ricoh Co Ltd | 文字の大分類認識方法 |
JPH08137997A (ja) * | 1994-11-09 | 1996-05-31 | Seiko Epson Corp | 文字認識方法および文字認識装置 |
US5715367A (en) * | 1995-01-23 | 1998-02-03 | Dragon Systems, Inc. | Apparatuses and methods for developing and using models for speech recognition |
US6345119B1 (en) * | 1996-02-19 | 2002-02-05 | Fujitsu Limited | Handwritten character recognition apparatus and method using a clustering algorithm |
JPH11203413A (ja) * | 1998-01-19 | 1999-07-30 | Fuji Xerox Co Ltd | 類似カテゴリ識別辞書作成装置および方法 |
JPH11345338A (ja) * | 1998-05-29 | 1999-12-14 | Ricoh Co Ltd | パターン辞書作成装置およびパターン辞書作成方法,並びにパターン辞書作成方法をコンピュータに記録した機械読み取り可能な記録媒体 |
JPH11345337A (ja) * | 1998-05-29 | 1999-12-14 | Ricoh Co Ltd | パターン辞書作成装置およびパターン辞書作成方法,並びにパターン辞書作成方法をコンピュータに記録した機械読み取り可能な記録媒体 |
CN1145872C (zh) * | 1999-01-13 | 2004-04-14 | 国际商业机器公司 | 手写汉字自动分割和识别方法以及使用该方法的系统 |
JP2002099723A (ja) * | 2000-09-21 | 2002-04-05 | Casio Comput Co Ltd | 割引利得の自動積立システム、自動積立方法、および記憶媒体 |
US20030097196A1 (en) * | 2001-11-13 | 2003-05-22 | Koninklijke Philips Electronics N.V. | Method and apparatus for generating a stereotypical profile for recommending items of interest using item-based clustering |
JP4316183B2 (ja) | 2002-03-29 | 2009-08-19 | 京セラキンセキ株式会社 | 単結晶の育成方法 |
US7620204B2 (en) * | 2006-02-09 | 2009-11-17 | Mitsubishi Electric Research Laboratories, Inc. | Method for tracking objects in videos using covariance matrices |
US8121347B2 (en) * | 2006-12-12 | 2012-02-21 | Rutgers, The State University Of New Jersey | System and method for detecting and tracking features in images |
-
2008
- 2008-05-13 JP JP2008126405A patent/JP5365065B2/ja not_active Expired - Fee Related
-
2009
- 2009-04-24 US US12/385,970 patent/US8379983B2/en not_active Expired - Fee Related
- 2009-05-11 CN CN2009101384192A patent/CN101582118B/zh not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2009276937A (ja) | 2009-11-26 |
CN101582118A (zh) | 2009-11-18 |
US8379983B2 (en) | 2013-02-19 |
CN101582118B (zh) | 2012-09-26 |
US20090285490A1 (en) | 2009-11-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP2808827B1 (en) | System and method for OCR output verification | |
US8977042B2 (en) | Rotation-free recognition of handwritten characters | |
JP4504702B2 (ja) | 文書処理装置、文書処理方法、および文書処理プログラム | |
JP5522408B2 (ja) | パターン認識装置 | |
US20060050962A1 (en) | System, process and software arrangement for recognizing handwritten characters | |
US20170076152A1 (en) | Determining a text string based on visual features of a shred | |
CN111428557A (zh) | 基于神经网络模型的手写签名的自动校验的方法和装置 | |
WO2021042505A1 (zh) | 基于文字识别技术的笔记生成方法、装置和计算机设备 | |
JP5365065B2 (ja) | 辞書作成装置 | |
US7136526B2 (en) | Character string recognition apparatus, character string recognizing method, and storage medium therefor | |
CN112861842A (zh) | 基于ocr的案件文本识别方法及电子设备 | |
TW399188B (en) | Method and apparatus for recognizing patterns | |
CN115937873A (zh) | 一种基于可辨识单字字符的在线笔迹验证系统及方法 | |
CN110414622B (zh) | 基于半监督学习的分类器训练方法及装置 | |
JPH11203415A (ja) | 類似パターンカテゴリ識別辞書作成装置および方法 | |
JP3917349B2 (ja) | 文字認識結果を利用して情報を検索する検索装置および方法 | |
US6320985B1 (en) | Apparatus and method for augmenting data in handwriting recognition system | |
CN114299509A (zh) | 一种获取信息的方法、装置、设备及介质 | |
US11361529B2 (en) | Information processing apparatus and non-transitory computer readable medium | |
JP5683287B2 (ja) | パターン認識装置及びパターン認識方法 | |
CN115346225A (zh) | 书写测评方法、装置及设备 | |
JP3180792B2 (ja) | 文字認識装置、文字学習装置およびコンピュータ可読記録媒体 | |
JP3280577B2 (ja) | 文字認識装置 | |
Zhou et al. | Character recognition under severe perspective distortion | |
CN117037165A (zh) | 一种汉字识别方法、装置、计算机设备和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20110118 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20120816 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120828 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20121029 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130312 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130513 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130813 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130826 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |