JP2007058803A - オンライン手書き文字認識装置及びオンライン手書き文字認識方法 - Google Patents
オンライン手書き文字認識装置及びオンライン手書き文字認識方法 Download PDFInfo
- Publication number
- JP2007058803A JP2007058803A JP2005246549A JP2005246549A JP2007058803A JP 2007058803 A JP2007058803 A JP 2007058803A JP 2005246549 A JP2005246549 A JP 2005246549A JP 2005246549 A JP2005246549 A JP 2005246549A JP 2007058803 A JP2007058803 A JP 2007058803A
- Authority
- JP
- Japan
- Prior art keywords
- stroke
- cutout
- recognition
- character
- result
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Character Discrimination (AREA)
Abstract
【解決手段】 枠無しで入力されたストローク列から複数の切り出しルールにより認識対象を切り出す認識対象ストローク切り出し手段と、前記認識対象ストローク切り出し手段により切り出されたストロークを認識する手書き文字認識手段と、前記手書き文字認識手段により認識された結果から最も好ましいと思われる認識結果を構成した切り出しストロークを決定する最善切り出しストローク決定手段と、前記最善切り出しストローク決定手段により決定された切り出しストロークの切り出しルールを後続するストロークに適用して認識する後続ストローク手書き文字認識手段と、を備えることを特徴とする。
【選択図】 図2
Description
以下、図面を参照して本発明の好適な実施の形態を詳細に説明する。
図1は、本実施の形態に係る情報処理装置のハードウェア構成を示すブロック図である。
図1において、1は情報(データ)を入力するための入力部である。2はCPUであり、各種処理のための演算、論理判断等を行い、バス6に接続された各構成要素を制御する。
図2において、入力ストローク21の先頭文字領域を文字高さ×0.5、1.0、1.2の3パターンの文字幅で切り出している様子が示されている。また、その結果、より確からしいと判断された認識結果を構成した文字高さ×1.2の文字幅で、後続ストロークの文字領域22が切り出されている様子が示されている。
図3において、ステップS301の認識対象ストローク切り出し処理により、入力されたストローク列から複数の切り出しルールにより認識対象を切り出し、続くステップS302の手書き文字認識処理によりそれぞれの入力ストロークを認識する。
図4において、ステップS401の文字高さ決定処理により、入力されたストローク列のY座標の範囲から文字高さが決定される。続くステップS402の文字幅推測処理では前述の文字高さを元に、複数の文字幅が推測される。なお、本実施の形態の場合は、文字高さ×0.5、1.0、1.2の3パターンの文字幅が推測される。
図5において、縦横比0.5、1.0、1.2の3パターンの切り出しルールにより認識された結果が示されている。例えば、縦横比0.5の場合には1ストロークが切り出され、スコア50の認識結果「ノ」が得られている。また、縦横比1.2の場合には3ストロークが切り出され、スコア90の認識結果「小」が得られている。
図6において、ステップS601で最善切り出しストロークが初期化され、続くステップS602で全認識結果に対する以下の処理が終了したと判断された場合、処理を終了する。
図7において、ステップS701で残ストロークが無いと判断された場合、処理を終了する。ステップS701で残ストロークがあると判断された場合、ステップS702の指定ストローク切り出し処理により、前述の最善切り出しストローク決定処理で決定された切り出しルールでストロークを切り出し、続くステップS703の手書き文字認識処理により認識し、再びステップS701に戻り、処理を繰り返す。
他領域より先頭領域を詳細に解析することで、一律に解析するよりもパフォーマンスや使用メモリ量に対する認識性能が高まる効果がある。
特に文字幅を元に複数パターンで切り出す場合に、一律に解析するよりもパフォーマンスや使用メモリ量に対する認識性能が高まる効果がある。
本実施の形態では図8〜9を用いて、文字間ピッチを基準にした複数の切り出しルールにより先頭1文字を切り出して、後続文字も同じルールで切り出して認識を行う例について説明する。
図8において、入力ストローク81の先頭文字領域を文字高さ×0.1、0.2、0.3の3パターンの文字間ピッチで切り出している様子が示されている。また、その結果、より確からしいと判断された認識結果を構成した文字高さ×0.2の文字間ピッチで、後続ストロークの文字領域82が切り出されている様子が示されている。
図9において、ステップS901の文字高さ決定処理により、入力されたストローク列のY座標の範囲から文字高さが決定される。続くステップS902の文字間推測処理では前述の文字高さを元に、複数の文字間ピッチが推測される。なお、本実施の形態の場合は、文字高さ×0.1、0.2、0.3の3パターンの文字間ピッチが推測される。
特に文字間ピッチを元に複数パターンで切り出す場合に、一律に解析するよりもパフォーマンスや使用メモリ量に対する認識性能が高まる効果がある。
本実施の形態では図10〜11を用いて、文字高を基準にした複数の切り出しルールにより先頭1文字を切り出して、後続文字も同じルールで切り出して認識を行う例について説明する。
図10において、入力ストローク101の先頭文字領域を文字幅×0.5、1.0、1.2の3パターンの文字高で切り出している様子が示されている。また、その結果、より確からしいと判断された認識結果を構成した文字幅×1.0の文字高で、後続ストロークの文字領域102が切り出されている様子が示されている。
図11において、ステップS1101の文字幅決定処理により、入力されたストローク列のX座標の範囲から文字幅が決定される。続くステップS1102の文字高推測処理では前述の文字幅を元に、複数の文字高が推測される。なお、本実施の形態の場合は、文字幅×0.5、1.0、1.2の3パターンの文字高が推測される。
特に文字高を元に複数パターンで切り出す場合に、一律に解析するよりもパフォーマンスや使用メモリ量に対する認識性能が高まる効果がある。
本実施の形態では図12〜13を用いて、高さ方向の文字間ピッチを基準にした複数の切り出しルールにより先頭1文字を切り出して、後続文字も同じルールで切り出して認識を行う例について説明する。
図12において、入力ストローク121の先頭文字領域を文字幅×0.1、0.2、0.3の3パターンの高さ方向の文字間ピッチで切り出している様子が示されている。また、その結果、より確からしいと判断された認識結果を構成した文字幅×0.2の高さ方向の文字間ピッチで、後続ストロークの文字領域122が切り出されている様子が示されている。
図13において、ステップS1301の文字幅決定処理により、入力されたストローク列のX座標の範囲から文字幅が決定される。続くステップS1302の文字間推測処理では前述の文字幅を元に、複数の高さ方向の文字間ピッチが推測される。なお、本実施の形態の場合は、文字幅×0.1、0.2、0.3の3パターンの高さ方向の文字間ピッチが推測される。
特に高さ方向の文字間ピッチを元に複数パターンで切り出す場合に、一律に解析するよりもパフォーマンスや使用メモリ量に対する認識性能が高まる効果がある。
本実施の形態では図14〜19を用いて、文字幅を基準にした複数の切り出しルールにより先頭2文字を切り出して、後続文字も同じルールで切り出して認識を行う例について説明する。
図14において、入力ストローク141の先頭2文字の領域を文字高さ×0.5、1.0、1.2の3パターンの文字幅で切り出している様子が示されている。
図15において、ステップS1501の文字高さ決定処理により、入力されたストローク列のY座標の範囲から文字高さが決定される。続くステップS1502の文字幅推測処理では前述の文字高さを元に、複数の文字幅が推測される。なお、本実施の形態の場合は、文字高さ×0.5、1.0、1.2の3パターンの文字幅が推測される。
図16において、ステップS1601のストローク切り出し処理により指定文字幅に対応する先頭文字領域が抽出され、次のステップS1602の次ストロークスキップ処理によりストローク分スキップされる。その結果、次のステップS1603で次ストロークがあると判断された場合、ステップS1604のストローク切り出し処理により指定文字幅に対応する次文字領域を抽出し、処理を終了する。
図17において、縦横比0.5、1.0、1.2の3パターンの切り出しルールにより認識された結果が示されている。例えば、縦横比0.5の場合には先頭文字として4ストロークが切り出され、スコア50の認識結果「木」が得られ、第2文字として4ストロークが切り出され、スコア50の認識結果「木」が得られている。
図18において、ステップS1801の合計スコア算出処理により前述の認識結果の切り出しルールごとに合計スコアが求められる。続くステップS1802の最善組合せ切り出しストローク決定処理により、前記で求められた合計スコアを元に最善の組合せの切り出しストロークを決定し、処理を終了する。
図19において、ステップS1901で最善切り出しストロークが初期化され、続くステップS1902で全認識結果に対する以下の処理が終了したと判断された場合、処理を終了する。
先頭複数文字領域を対象とすることで、先頭1文字だけでは信頼性が低い場合にも認識性能が高まる効果がある。
本実施の形態では図20〜23を用いて、文字幅を基準にした複数の切り出しルールにより先頭1文字を切り出して、後続文字も同じルールで切り出して認識を行っていった結果、あるところでしきい値以下の認識結果となった場合に正しい認識結果が得られるように対応する例について説明する。
図20において、入力ストローク201の先頭文字領域を文字高さ×0.5、1.0、1.2の3パターンの文字幅で切り出している様子が示されている。
図21において、ステップS2101で残ストロークが無いと判断された場合、処理を終了する。
図22において、ステップS2201の認識スコア算出処理により、前述の認識結果から認識スコアが取得される。更に続くステップS2202の隣接スコア算出処理により、対象となる文字の前後関係から言語知識を用いたスコアが算出される。ここで、言語知識を用いたスコアとは、文字列の出現確率を用いても良いし、単語辞書を用いても良い。その結果、続くステップS2203でスコアが合計され、処理を終了する。
図23において、ステップS2301の認識対象ストローク切り出し処理により、入力されたストローク列から複数の切り出しルールにより認識対象を切り出し、続くステップS2302の手書き文字認識処理によりそれぞれの入力ストロークを認識する。
途中で大きさが変化し認識性能が低下する場合にも対応可能となる効果がある。
2 CPU
3 出力部
4 プログラムメモリ
5 データメモリ
6 バス
21 入力ストローク
22 認識結果
81 入力ストローク
82 認識結果
101 入力ストローク
102 認識結果
121 入力ストローク
122 認識結果
141 入力ストローク
142 認識結果
201 入力ストローク
202 途中で認識失敗した認識結果
203 途中から認識し直した認識結果
204 最終認識結果
Claims (6)
- 枠無しで入力されたストローク列から複数の切り出しルールにより認識対象を切り出す認識対象ストローク切り出し手段と、
前記認識対象ストローク切り出し手段により切り出されたストロークを認識する手書き文字認識手段と、
前記手書き文字認識手段により認識された結果から最も好ましいと思われる認識結果を構成した切り出しストロークを決定する最善切り出しストローク決定手段と、
前記最善切り出しストローク決定手段により決定された切り出しストロークの切り出しルールを後続するストロークに適用して認識する後続ストローク手書き文字認識手段とを有することを特徴とするオンライン手書き文字認識装置。 - 前記認識対象ストローク切り出し手段は、2文字以上の認識対象を切り出す複数認識対象ストローク切り出し手段を有し、
前記最善切り出しストローク決定手段は、2文字以上の認識結果から最も好ましいと思われる組合せを構成した切り出しストロークを決定する最善組合せ切り出しストローク決定手段を有することを特徴とする請求項1に記載のオンライン手書き文字認識装置。 - 前記後続ストローク手書き文字認識手段は、前記認識結果の確からしさを評価する認識結果評価手段を有し、前記認識結果評価手段で評価した結果、しきい値以下の確からしさとなった場合に以降の後続ストロークの認識を中断し、前記しきい値以下の確からしさとなって中断した場合に、前記中断の位置より再び前記認識対象ストローク切り出し手段より後の処理を繰り返すことを特徴とする請求項1に記載のオンライン手書き文字認識装置。
- 枠無しで入力されたストローク列から複数の切り出しルールにより認識対象を切り出す認識対象ストローク切り出し工程、
前記認識対象ストローク切り出し工程により切り出されたストロークを認識する手書き文字認識工程と、
前記手書き文字認識工程により認識された結果から最も好ましいと思われる認識結果を構成した切り出しストロークを決定する最善切り出しストローク決定工程と、
前記最善切り出しストローク決定工程により決定された切り出しストロークの切り出しルールを後続するストロークに適用して認識する後続ストローク手書き文字認識工程とを有することを特徴とするオンライン手書き文字認識方法。 - 前記請求項4に記載の方法の各工程をコンピュータにて実施させるプログラムを記録したことを特徴とするコンピュータ読み取り可能な記録媒体。
- 前記請求項4に記載の方法の各工程をコンピュータにて実施させることを特徴とするコンピュータプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005246549A JP2007058803A (ja) | 2005-08-26 | 2005-08-26 | オンライン手書き文字認識装置及びオンライン手書き文字認識方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005246549A JP2007058803A (ja) | 2005-08-26 | 2005-08-26 | オンライン手書き文字認識装置及びオンライン手書き文字認識方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2007058803A true JP2007058803A (ja) | 2007-03-08 |
JP2007058803A5 JP2007058803A5 (ja) | 2008-09-25 |
Family
ID=37922201
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005246549A Pending JP2007058803A (ja) | 2005-08-26 | 2005-08-26 | オンライン手書き文字認識装置及びオンライン手書き文字認識方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2007058803A (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20170004983A (ko) * | 2014-04-16 | 2017-01-11 | 아이.알.아이.에스. | 라인 분할 방법 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS60153574A (ja) * | 1984-01-23 | 1985-08-13 | Nippon Telegr & Teleph Corp <Ntt> | 文字読取方法 |
JPS63316288A (ja) * | 1987-06-19 | 1988-12-23 | Nec Corp | 文字認識装置 |
JPH01270185A (ja) * | 1988-04-22 | 1989-10-27 | Canon Inc | 文字認識方法及びその装置 |
JP2002163607A (ja) * | 2000-11-24 | 2002-06-07 | Just Syst Corp | 文字切り出し装置、文字切り出し方法およびその方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体 |
-
2005
- 2005-08-26 JP JP2005246549A patent/JP2007058803A/ja active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS60153574A (ja) * | 1984-01-23 | 1985-08-13 | Nippon Telegr & Teleph Corp <Ntt> | 文字読取方法 |
JPS63316288A (ja) * | 1987-06-19 | 1988-12-23 | Nec Corp | 文字認識装置 |
JPH01270185A (ja) * | 1988-04-22 | 1989-10-27 | Canon Inc | 文字認識方法及びその装置 |
JP2002163607A (ja) * | 2000-11-24 | 2002-06-07 | Just Syst Corp | 文字切り出し装置、文字切り出し方法およびその方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20170004983A (ko) * | 2014-04-16 | 2017-01-11 | 아이.알.아이.에스. | 라인 분할 방법 |
KR102345498B1 (ko) | 2014-04-16 | 2021-12-31 | 아이.알.아이.에스. | 라인 분할 방법 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8005294B2 (en) | Cursive character handwriting recognition system and method | |
JP4308785B2 (ja) | デジタルインク質疑検索装置及びその方法 | |
JP3919771B2 (ja) | 機械翻訳システム、その制御装置、及びコンピュータプログラム | |
US6891971B2 (en) | Recognition process | |
JP2005108184A6 (ja) | 機械翻訳システム、その制御装置、及びコンピュータプログラム | |
CN104166474A (zh) | 信息处理装置和字符识别方法 | |
JP5034398B2 (ja) | 文字認識プログラム、文字認識方法および文字認識装置 | |
US20150228259A1 (en) | Method and apparatus for recognising music symbols | |
CN113140018A (zh) | 训练对抗网络模型的方法、建立字库的方法、装置和设备 | |
KR20200010650A (ko) | 딥러닝 기반 제스처 자동 인식 방법 및 시스템 | |
JP4791295B2 (ja) | 罫線抽出プログラム、罫線抽出装置、罫線抽出方法 | |
US20150139547A1 (en) | Feature calculation device and method and computer program product | |
JP2010198308A (ja) | 文字認識プログラム、文字認識方法および文字認識装置 | |
KR20160146458A (ko) | 문자영상 내의 개인정보 보호장치 및 방법 | |
JP2007058803A (ja) | オンライン手書き文字認識装置及びオンライン手書き文字認識方法 | |
US20200320711A1 (en) | Image segmentation method and device | |
CN114511853B (zh) | 一种文字图像书写轨迹恢复效果判别方法 | |
JP5247260B2 (ja) | 情報処理装置及び情報処理方法 | |
CN115471849A (zh) | 一种手写汉字图像评估方法及系统 | |
JP6201838B2 (ja) | 情報処理装置及び情報処理プログラム | |
JP5344338B2 (ja) | プログラム、情報記憶媒体及び文字列認識装置 | |
CN111104886A (zh) | 手势识别方法、装置、设备和存储介质 | |
JP4871793B2 (ja) | 情報処理装置及びその方法 | |
JP2007072718A (ja) | 手書き数式の認識装置及び認識方法 | |
JP2010258627A (ja) | 画像処理装置、画像処理方法、プログラム及び記憶媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080811 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20080811 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110628 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110823 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20120207 |