JP2010039609A - プログラム、情報記憶媒体及び文字列認識装置 - Google Patents
プログラム、情報記憶媒体及び文字列認識装置 Download PDFInfo
- Publication number
- JP2010039609A JP2010039609A JP2008199388A JP2008199388A JP2010039609A JP 2010039609 A JP2010039609 A JP 2010039609A JP 2008199388 A JP2008199388 A JP 2008199388A JP 2008199388 A JP2008199388 A JP 2008199388A JP 2010039609 A JP2010039609 A JP 2010039609A
- Authority
- JP
- Japan
- Prior art keywords
- point
- character string
- unit
- probability
- cut
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000012706 support-vector machine Methods 0.000 claims description 31
- 238000011156 evaluation Methods 0.000 claims description 17
- 230000006870 function Effects 0.000 claims description 16
- 230000002068 genetic effect Effects 0.000 claims description 8
- 230000003313 weakening effect Effects 0.000 abstract description 6
- 230000011218 segmentation Effects 0.000 abstract 9
- 238000000034 method Methods 0.000 description 35
- 210000000349 chromosome Anatomy 0.000 description 21
- 238000012545 processing Methods 0.000 description 18
- 239000013598 vector Substances 0.000 description 10
- 238000004891 communication Methods 0.000 description 7
- 238000000605 extraction Methods 0.000 description 6
- 108090000623 proteins and genes Proteins 0.000 description 4
- 238000010586 diagram Methods 0.000 description 3
- 230000010365 information processing Effects 0.000 description 3
- 230000000694 effects Effects 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000001186 cumulative effect Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000005192 partition Methods 0.000 description 1
- 238000002945 steepest descent method Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Landscapes
- Character Discrimination (AREA)
Abstract
【解決手段】ストローク間のオフストロークのうち、仮切出しポイントとして設定するオフストロークを決定し、前記仮切出しポイントによって切り出された仮切出しユニット毎に文字認識を行い、候補文字列を生成する。前記仮切出しユニットは、隣接する前記仮切出しポイントにより切り出される最小仮切出しユニットを少なくとも1つ含む。前記候補文字列の各候補文字に対応する前記仮切出しユニットに含まれる前記最小仮切出しユニット、および隣接する前記最小切り出しユニット間の連結について、複数項目の確からしさを評価し、前記複数項目の確からしさについて各項目に与える重みの値を設定する。
【選択図】図11
Description
文字列を少ない文字数に解釈する傾向や、文字列を多い文字数に解釈する傾向を弱めて、認識率を向上させることが可能なプログラム、情報記憶媒体及び文字列認識装置を提供することにある。
ストローク間のオフストロークのうち、仮切出しポイントとして設定するオフストロークを決定する仮切出しポイント決定部と、
前記仮切出しポイントによって切り出された仮切出しユニット毎に文字認識を行い、候補文字列を生成する候補文字列生成部と、
前記候補文字列について複数項目の確からしさを評価し、評価結果に基づき文字列を認識する認識部としてコンピュータを機能させ、
前記仮切出しユニットは、隣接する前記仮切出しポイントにより切り出される最小仮切出しユニットを少なくとも1つ含み、
前記認識部は、
前記候補文字列の各候補文字に対応する前記仮切出しユニットに含まれる前記最小仮切出しユニット、および隣接する前記最小切出しユニット間の連結について、前記複数項目の確からしさを評価し、前記複数項目の確からしさについて各項目に与える重みの値を設定することを特徴とする。
前記認識部は、
前記候補文字列の前記最小仮切出しユニット、および隣接する前記最小切出しユニット間の連結について、言語文脈の確からしさ、文字パタンサイズの確からしさ、文字パタン内分割の確からしさ、文字認識の確からしさ、単一文字パタン位置の確からしさ、ペア文字パタン位置の確からしさ及び前記仮切出しポイントの確からしさを含む複数項目の確からしさを評価するようにしてもよい。
前記認識部は、
前記仮切出しポイントを、隣接する文字パタン間の仮切出しポイントとして判断する場合には、前記仮切出しポイントが切出しポイントとして識別される確からしさを評価し、前記仮切出しポイントを、文字パタン内部の仮切出しポイントとして判断する場合には、前記仮切出しポイントが非切出しポイントとして識別される確からしさを評価するようにしてもよい。
前記仮切出しポイント決定部は、
前記オフストロークから抽出した多次元の特徴値をサポートベクターマシン(SVM)に適用することで、前記仮切出しポイントのSVM出力値を求め、
前記認識部は、
前記SVM出力値に基づき前記仮切出しポイントの確からしさを評価するようにしてもよい。
前記認識部は、
遺伝的アルゴリズムにより学習した複数の重みの値を前記複数項目の確からしさに与えるようにしてもよい。
図1に本実施形態の文字列認識装置の機能ブロック図の一例を示す。なお本実施形態の文字列認識装置は図1の構成要素(各部)の一部を省略した構成としてもよい。
次に本実施形態の手法について図面を用いて説明する。
本実施形態では、入力された各ストロークを、隣接するストローク間の距離や重なりなどの特徴によって、切出しポイント、非切出しポイントと不確定ポイントに分類する。切出しポイントは、2つの文字パタン間にあると判断されたポイントであり、非切出しポイントは、1つの文字パタンの内部にあると判断されたポイントである。また不確定ポイントは、切出しポイントであるか非切出しポイントであるかを決定できないポイントである。本実施形態では、切出しポイントと不確定ポイントとを仮切出しポイントとする。
ここでacsは平均文字サイズを示し、各ストロークの外接矩形における長い方の辺長をもとめ、全てのストロークについてその辺長をソートし、それらの辺長の中において長い方から3分の1のものに対して平均を取ることによって求めることができる。
また、オフストロークの交差長さ特徴fiは、以下のように求める。
なお、SpとSsが交差していない場合にはli=0とする。
f2=DBx/acs (6)
f3=Bbp_allとBbs_allの重なり面積/(acs)2 (7)
f4=Dbx/Bbp1の幅 (8)
f5=Dbx/Bbs1の幅 (9)
f6=Dbx/acs (10)
f7=Dby/Bbp1の高さ (11)
f8=Dby/Bbs1の高さ (12)
f9=Dby/acs (13)
f10=Ob/(Bbs1の幅×高さ) (14)
f11=Ob/(acs)2 (15)
f12=Dbsy/acs (16)
f13=Dbs/acs (17)
f14=Dfb/acs (18)
f15=オフストロークの長さ/acs (19)
f16=オフストロークの正弦値 (20)
f17=オフストロークの余弦値 (21)
f18=f2/文字列中の最大f2 (22)
ここで、Bbp1は、1つ前のストロークの外接矩形を示し、Bbs1は、1つ後のストロークの外接矩形を示す。またDByは、Bbp_allとBbs_allのY方向距離(DBy=Bbs_allの上位置Y座標−Bbp_allの下位置Y座標)を示す。またDbxは、Bbp1とBbs1のX方向距離(Dbx=Bbs1の左位置X座標−Bbp1の右位置X座標)を示す。またDbyは、Bbp1とBbs1のY方向距離(Dby=Bbs1の上位置Y座標−Bbp1の下位置Y座標)を示す。またObは、Bbp1とBbs1の重なり面積を示す。またDbsyは、Bbp1とBbs1の中心のY方向距離(Dbsy=Bbs1の中心のY座標−Bbp1の中心のY座標)を示す。またDbsは、Bbp1とBbs1の中心の距離を示す。またDfbは、Bbp_allとBbs1の上位置Y座標のずれ(Dfb=abs(Bbp_allの上位置Y座標−Bbs1の上位置Y座標))を示す。
ここで、wは、1つ前の仮切出しポイントから1つ後の仮切出しポイントまでのストローク列の外接矩形の幅である。
図5に、本実施形態の候補ラティスの一例を示す。
本実施形態では、仮切出しポイントから構築した候補ラティスの各文字列候補パス(候補文字列)について複数項目の確からしさを評価する。
本実施形態では、学習パタンを利用して遺伝的アルゴリズムにより、式(27)における複数の重みパラメータ(λ11〜λ71、λ12〜λ72、λ)を学習する。ここでは、複数の重みパラメータからなる重み系列を1つの染色体とみなす。1つの重みパラメータは染色体の1つの遺伝子である。以下、学習の処理手順について説明する。
性能評価に先立って、データベースを利用してP(Si|Ci)について文字認識のモデルを学習した。またデータベースを利用して文字パタンサイズ、文字パタン内分割、単一文字パタン位置(unary位置特徴)とペア文字パタン位置(binary位置特徴)における4つの二次識別関数(QDF)を学習した。また新聞データにより言語文脈の確からしさのためのtri−gram表を作った。そして、データベースによりβ1、β2、β3、β4を学習した。
図11は、本実施形態の文字列認識装置の処理の一例を示すフローチャートである。
Claims (7)
- 手書き入力された文字パタンのストロークから文字列を認識するためのプログラムであって、
ストローク間のオフストロークのうち、仮切出しポイントとして設定するオフストロークを決定する仮切出しポイント決定部と、
前記仮切出しポイントによって切り出された仮切出しユニット毎に文字認識を行い、候補文字列を生成する候補文字列生成部と、
前記候補文字列について複数項目の確からしさを評価し、評価結果に基づき文字列を認識する認識部としてコンピュータを機能させ、
前記仮切出しユニットは、隣接する前記仮切出しポイントにより切り出される最小仮切出しユニットを少なくとも1つ含み、
前記認識部は、
前記候補文字列の各候補文字に対応する前記仮切出しユニットに含まれる前記最小仮切出しユニット、および隣接する前記最小切出しユニット間の連結について、前記複数項目の確からしさを評価し、前記複数項目の確からしさについて各項目に与える重みの値を設定することを特徴とするプログラム。 - 請求項1において、
前記認識部は、
前記候補文字列の前記最小仮切出しユニット、および隣接する前記最小切出しユニット間の連結について、言語文脈の確からしさ、文字パタンサイズの確からしさ、文字パタン内分割の確からしさ、文字認識の確からしさ、単一文字パタン位置の確からしさ、ペア文字パタン位置の確からしさ及び前記仮切出しポイントの確からしさを含む複数項目の確からしさを評価することを特徴とするプログラム。 - 請求項2において、
前記認識部は、
前記仮切出しポイントを、隣接する文字パタン間の仮切出しポイントとして判断する場合には、前記仮切出しポイントが切出しポイントとして識別される確からしさを評価し、前記仮切出しポイントを、文字パタン内部の仮切出しポイントとして判断する場合には、前記仮切出しポイントが非切出しポイントとして識別される確からしさを評価することを特徴とするプログラム。 - 請求項2又は3において、
前記仮切出しポイント決定部は、
前記オフストロークから抽出した多次元の特徴値をサポートベクターマシン(SVM)に適用することで、前記仮切出しポイントのSVM出力値を求め、
前記認識部は、
前記SVM出力値に基づき前記仮切出しポイントの確からしさを評価することを特徴とするプログラム。 - 請求項1乃至4のいずれかにおいて、
前記認識部は、
遺伝的アルゴリズムにより学習した複数の重みの値を前記複数項目の確からしさに与えることを特徴とするプログラム。 - コンピュータ読み取り可能な情報記憶媒体であって、請求項1乃至5のいずれかのプログラムを記憶したことを特徴とする情報記憶媒体。
- 手書き入力された文字パタンのストロークから文字列を認識する文字列認識装置であって、
ストローク間のオフストロークのうち、仮切出しポイントとして設定するオフストロークを決定する仮切出しポイント決定部と、
前記仮切出しポイントによって切り出された仮切出しユニット毎に文字認識を行い、候補文字列を生成する候補文字列生成部と、
前記候補文字列について複数項目の確からしさを評価し、評価結果に基づき文字列を認識する認識部とを含み、
前記仮切出しユニットは、隣接する前記仮切出しポイントにより切り出される最小仮切出しユニットを少なくとも1つ含み、
前記認識部は、
前記候補文字列の各候補文字に対応する前記仮切出しユニットに含まれる前記最小仮切出しユニット、および隣接する前記最小切出しユニット間の連結について、前記複数項目の確からしさを評価し、前記複数項目の確からしさについて各項目に与える重みの値を設定することを特徴とする文字列認識装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008199388A JP5344338B2 (ja) | 2008-08-01 | 2008-08-01 | プログラム、情報記憶媒体及び文字列認識装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008199388A JP5344338B2 (ja) | 2008-08-01 | 2008-08-01 | プログラム、情報記憶媒体及び文字列認識装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2010039609A true JP2010039609A (ja) | 2010-02-18 |
JP5344338B2 JP5344338B2 (ja) | 2013-11-20 |
Family
ID=42012116
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008199388A Active JP5344338B2 (ja) | 2008-08-01 | 2008-08-01 | プログラム、情報記憶媒体及び文字列認識装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5344338B2 (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2013205922A (ja) * | 2012-03-27 | 2013-10-07 | Fuji Xerox Co Ltd | 文字認識用学習データ生成装置、文字認識装置、およびプログラム |
JP2014092817A (ja) * | 2012-10-31 | 2014-05-19 | Fuji Xerox Co Ltd | 文字認識装置及びプログラム |
CN116071764A (zh) * | 2023-03-28 | 2023-05-05 | 中国人民解放军海军工程大学 | 基于原型网络的手写汉字识别方法、装置、设备及介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH06124364A (ja) * | 1992-10-13 | 1994-05-06 | Sanyo Electric Co Ltd | 文字切り出し装置 |
JP2002063548A (ja) * | 2001-06-18 | 2002-02-28 | Hitachi Software Eng Co Ltd | 手書き文字認識方法 |
JP2004171316A (ja) * | 2002-11-21 | 2004-06-17 | Hitachi Ltd | Ocr装置及び文書検索システム及び文書検索プログラム |
JP2005141329A (ja) * | 2003-11-04 | 2005-06-02 | Toshiba Corp | 手書き文字認識装置、及び手書き文字認識方法 |
JP2009528615A (ja) * | 2006-03-01 | 2009-08-06 | ザイ デクマ アクチボラゲット | 付加的文字認識方法とその装置 |
-
2008
- 2008-08-01 JP JP2008199388A patent/JP5344338B2/ja active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH06124364A (ja) * | 1992-10-13 | 1994-05-06 | Sanyo Electric Co Ltd | 文字切り出し装置 |
JP2002063548A (ja) * | 2001-06-18 | 2002-02-28 | Hitachi Software Eng Co Ltd | 手書き文字認識方法 |
JP2004171316A (ja) * | 2002-11-21 | 2004-06-17 | Hitachi Ltd | Ocr装置及び文書検索システム及び文書検索プログラム |
JP2005141329A (ja) * | 2003-11-04 | 2005-06-02 | Toshiba Corp | 手書き文字認識装置、及び手書き文字認識方法 |
JP2009528615A (ja) * | 2006-03-01 | 2009-08-06 | ザイ デクマ アクチボラゲット | 付加的文字認識方法とその装置 |
Non-Patent Citations (1)
Title |
---|
JPN6012059769; Bilan ZHU et al.: 'Segmentation of On-Line Freely Written Japanese Text Using SVM for Improving Text Recognition' IEICE transactions on information and systems 第91巻,第1号, 20080101, 第105-113頁, (社)電子情報通信学会 * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2013205922A (ja) * | 2012-03-27 | 2013-10-07 | Fuji Xerox Co Ltd | 文字認識用学習データ生成装置、文字認識装置、およびプログラム |
JP2014092817A (ja) * | 2012-10-31 | 2014-05-19 | Fuji Xerox Co Ltd | 文字認識装置及びプログラム |
CN116071764A (zh) * | 2023-03-28 | 2023-05-05 | 中国人民解放军海军工程大学 | 基于原型网络的手写汉字识别方法、装置、设备及介质 |
Also Published As
Publication number | Publication date |
---|---|
JP5344338B2 (ja) | 2013-11-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5071914B2 (ja) | 認識グラフ | |
CN111695527B (zh) | 一种蒙古文在线手写体识别方法 | |
Bharath et al. | HMM-based lexicon-driven and lexicon-free word recognition for online handwritten Indic scripts | |
Awal et al. | A global learning approach for an online handwritten mathematical expression recognition system | |
Awal et al. | First experiments on a new online handwritten flowchart database | |
JP2019087237A (ja) | 敵対的ニューラル・ネットワーク・トレーニングを使用するフォント認識の改善 | |
Davila et al. | Using off-line features and synthetic data for on-line handwritten math symbol recognition | |
Kim et al. | Hierarchical random graph representation of handwritten characters and its application to Hangul recognition | |
Purohit et al. | A literature survey on handwritten character recognition | |
US7903877B2 (en) | Radical-based HMM modeling for handwritten East Asian characters | |
KR102293538B1 (ko) | 음악 심볼들을 인식하기 위한 방법 및 장치 | |
Stern et al. | Most discriminating segment–Longest common subsequence (MDSLCS) algorithm for dynamic hand gesture classification | |
JP6170860B2 (ja) | 文字認識装置及び識別関数生成方法 | |
Zarro et al. | Recognition-based online Kurdish character recognition using hidden Markov model and harmony search | |
Potrus et al. | An evolutionary harmony search algorithm with dominant point detection for recognition-based segmentation of online Arabic text recognition | |
Mandal et al. | GMM posterior features for improving online handwriting recognition | |
JP5344338B2 (ja) | プログラム、情報記憶媒体及び文字列認識装置 | |
Yesilbek et al. | Sketch recognition with few examples | |
Goswami et al. | Classification of printed Gujarati characters using SOM based k-Nearest Neighbor Classifier | |
TWI303783B (en) | Method and device for recognition of a handwritten pattern, and computer program product | |
Porwal et al. | Ensemble of biased learners for offline arabic handwriting recognition | |
Premaratne et al. | Lexicon and hidden Markov model-based optimisation of the recognised Sinhala script | |
Shetty et al. | Handwritten word recognition using conditional random fields | |
Nasien et al. | New feature vector from freeman chain code for handwritten roman character recognition | |
JP2009271874A (ja) | トピック可視化装置、トピック可視化方法、トピック可視化プログラムおよびそのプログラムを記録した記録媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20110801 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20121012 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20121114 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130108 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130619 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130702 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130724 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130802 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 Ref document number: 5344338 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |