JP5807881B2 - プログラム、情報記憶媒体及び文字列認識装置 - Google Patents
プログラム、情報記憶媒体及び文字列認識装置 Download PDFInfo
- Publication number
- JP5807881B2 JP5807881B2 JP2013100118A JP2013100118A JP5807881B2 JP 5807881 B2 JP5807881 B2 JP 5807881B2 JP 2013100118 A JP2013100118 A JP 2013100118A JP 2013100118 A JP2013100118 A JP 2013100118A JP 5807881 B2 JP5807881 B2 JP 5807881B2
- Authority
- JP
- Japan
- Prior art keywords
- stroke
- character
- candidate
- division
- points
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Description
のプログラムであって、
手書き入力された文字パタンのストローク列を、所定画数ごとに、又は所定時間の筆記中断があるごとに取得するストローク列取得部と、
ストローク列を取得するごとに、ストローク列における分割再開位置を設定する分割再開位置設定部と、
ストローク列を取得するごとに、前記分割再開位置以降のストローク列におけるストローク間のオフストロークを、2つの文字パタンに分割するオフストロークを示す分割点と、1つの文字パタン内部のオフストロークを示す非分割点と、前記分割点であるか前記非分割点であるかを決定できないオフストロークを示す不確定点とに分類し、前記分割点及び前記不確定点を分割候補点として決定する仮分割部と、
ストローク列を取得するごとに、隣接する2つの前記分割候補点で切り出される候補文字パタン及び隣接する2つの前記分割点で切り出される候補文字パタンに対して文字認識を行って候補文字の列を生成し、候補文字ラティスを更新する候補文字ラティス更新部と、
ストローク列を取得するごとに、前記候補文字ラティスから最適パスを探索して文字列を認識する文字列認識部としてコンピュータを機能させ、
前記分割再開位置設定部は、
最新の最適パスにおける候補文字間にあるオフストロークのうち、最後のN個の候補文字の直前にあるオフストロークを、前記分割再開位置として設定し、
前記仮分割部は、
最新の最適パスにおける候補文字間にある前記不確定点のうち、最後のM(M≦N)個の候補文字より前にある前記不確定点を前記分割点に変更することを特徴とするプログラムに関する。
ストローク列を取得するごとに、候補文字ラティスの更新処理及び最適パスの探索処理の対象となるストローク列をスコープとして設定するスコープ設定部として更にコンピュータを機能させ、
前記スコープ設定部は、
前記仮分割部で分類を変更したオフストローク又は前記ストローク列取得部で取得した最新のストローク列の直前にあるオフストロークを基準として前記スコープの先頭位置を決定し、前記先頭位置以降のストローク列を前記スコープとして設定してもよい。
ストローク列を取得するごとに、候補文字ラティスの更新処理及び最適パスの探索処理の対象となるストローク列をスコープとして設定するスコープ設定部を更に含み、
前記スコープ設定部は、
前記仮分割部で分類を変更したオフストローク又は前記ストローク列取得部で取得した最新のストローク列の直前にあるオフストロークを基準として前記スコープの先頭位置を決定し、前記先頭位置以降のストローク列を前記スコープとして設定してもよい。
前記候補文字ラティス更新部は、
前記スコープ設定部で設定した前記スコープにおける2つの前記分割点で切り出される候補文字パタンが、前回の前記スコープ内に存在する場合には、当該候補文字パタンに対して文字認識を行わずに、当該候補文字パタンの文字認識結果を再利用してもよい。
図1に本実施形態の文字列認識装置の機能ブロック図の一例を示す。なお本実施形態の文字列認識装置は図1の構成要素(各部)の一部を省略した構成としてもよい。
により実現できる。処理部100は、情報記憶媒体180に格納されるプログラム(データ)に基づいて本実施形態の種々の処理を行う。即ち情報記憶媒体180には、処理部100の各部としてコンピュータを機能させるためのプログラム(各部の処理をコンピュータに実行させるためのプログラム)が記憶される。
ち、最後のM(M≦N)個の候補文字より前にある前記不確定点を前記分割点に変更する。
次に本実施形態の手法について図面を用いて説明する。
高めて、待ち時間を削減する。
図2は、本実施形態の文字列認識装置の処理の一例を示すフローチャートである。
れた最新のストローク列の直前のオフストロークより前は安定していると判断して、最新のストローク列の直前のオフストロークを基準としてスコープを設定する(ステップS24)。具体的には、最新のストローク列の直前のオフストロークが候補文字ブロックの中に位置する場合は、当該オフストロークを含む候補文字ブロックの最初のストローク以降のストローク列をスコープとして決定し、最新のストローク列の直前のオフストロークが連続する候補文字ブロックの間に位置する場合は、当該オフストロークの直前の候補文字ブロックの最初のストローク以降のストローク列をスコープとして設定する。
Viterbi)探索やビーム探索が有効である。
次に、本実施形態の文字列認識装置の具体的な処理例について、図4〜図6を用いて説明する。図4(A)、図4(B)、図5(A)、図5(B)は、ストローク列を取得してからスコープを決定するまでの処理例を示す図である。
Pと、「都」と「小」の間の不確定点UP)を、分割点SPに変更している。
本実施形態の文字認識手法(準逐次認識方式)の性能を評価するために、100人から収集した日本語手書き文字列データベースのうち、横書きの文字列10,174行を学習パタンとして使用し、横書きの文字列3,511行をテストパタンとして使用して認識率、CPU時間、仮分割の精度を評価した。
る。このことから、準逐次認識方式では、CPU時間も小さいことが分かる。一方、逐次認識方式では、待ち時間は小さいものの、準逐次認識方式よりもCPU時間を要し、認識率も劣っていることが分かる。
Claims (5)
- 手書き入力された文字パタンのストロークから文字列を認識するためのプログラムであって、
手書き入力された文字パタンのストローク列を、所定画数ごとに、又は所定時間の筆記中断があるごとに取得するストローク列取得部と、
ストローク列を取得するごとに、ストローク列における分割再開位置を設定する分割再開位置設定部と、
ストローク列を取得するごとに、前記分割再開位置以降のストローク列におけるストローク間のオフストロークを、2つの文字パタンに分割するオフストロークを示す分割点と、1つの文字パタン内部のオフストロークを示す非分割点と、前記分割点であるか前記非分割点であるかを決定できないオフストロークを示す不確定点とに分類し、前記分割点及び前記不確定点を分割候補点として決定する仮分割部と、
ストローク列を取得するごとに、隣接する2つの前記分割候補点で切り出される候補文字パタン及び隣接する2つの前記分割点で切り出される候補文字パタンに対して文字認識を行って候補文字の列を生成し、候補文字ラティスを更新する候補文字ラティス更新部と、
ストローク列を取得するごとに、前記候補文字ラティスから最適パスを探索して文字列を認識する文字列認識部としてコンピュータを機能させ、
前記分割再開位置設定部は、
最新の最適パスにおける候補文字間にあるオフストロークのうち、最後のN個の候補文字の直前にあるオフストロークを、前記分割再開位置として設定し、
前記仮分割部は、
最新の最適パスにおける候補文字間にある前記不確定点のうち、最後のM(M≦N)個の候補文字より前にある前記不確定点を前記分割点に変更することを特徴とするプログラム。 - 請求項1において、
ストローク列を取得するごとに、候補文字ラティスの更新処理及び最適パスの探索処理の対象となるストローク列をスコープとして設定するスコープ設定部として更にコンピュータを機能させ、
前記スコープ設定部は、
前記仮分割部で分類を変更したオフストローク又は前記ストローク列取得部で取得した最新のストローク列の直前にあるオフストロークを基準として前記スコープの先頭位置を決定し、前記先頭位置以降のストローク列を前記スコープとして設定することを特徴とするプログラム。 - 請求項2において、
前記候補文字ラティス更新部は、
前記スコープ設定部で設定した前記スコープにおける2つの前記分割点で切り出される候補文字パタンが、前回の前記スコープ内に存在する場合には、当該候補文字パタンに対して文字認識を行わずに、当該候補文字パタンの文字認識結果を再利用することを特徴とするプログラム。 - コンピュータ読み取り可能な情報記憶媒体であって、請求項1乃至3のいずれかのプログラムを記憶したことを特徴とする情報記憶媒体。
- 手書き入力された文字パタンのストロークから文字列を認識する文字列認識装置であって、
手書き入力された文字パタンのストローク列を、所定画数ごとに、又は所定時間の筆記
中断があるごとに取得するストローク列取得部と、
ストローク列を取得するごとに、ストローク列における分割再開位置を設定する分割再開位置設定部と、
ストローク列を取得するごとに、前記分割再開位置以降のストローク列におけるストローク間のオフストロークを、2つの文字パタンに分割するオフストロークを示す分割点と、1つの文字パタン内部のオフストロークを示す非分割点と、前記分割点であるか前記非分割点であるかを決定できないオフストロークを示す不確定点とに分類し、前記分割点及び前記不確定点を分割候補点として決定する仮分割部と、
ストローク列を取得するごとに、隣接する2つの前記分割候補点で切り出される候補文字パタン及び隣接する2つの前記分割点で切り出される候補文字パタンに対して文字認識を行って候補文字の列を生成し、候補文字ラティスを更新する候補文字ラティス更新部と、
ストローク列を取得するごとに、前記候補文字ラティスから最適パスを探索して文字列を認識する文字列認識部とを含み、
前記分割再開位置設定部は、
最新の最適パスにおける候補文字間にあるオフストロークのうち、最後のN個の候補文字の直前にあるオフストロークを、前記分割再開位置として設定し、
前記仮分割部は、
最新の最適パスにおける候補文字間にある前記不確定点のうち、最後のM(M≦N)個の候補文字より前にある前記不確定点を前記分割点に変更することを特徴とする文字列認識装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013100118A JP5807881B2 (ja) | 2013-05-10 | 2013-05-10 | プログラム、情報記憶媒体及び文字列認識装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013100118A JP5807881B2 (ja) | 2013-05-10 | 2013-05-10 | プログラム、情報記憶媒体及び文字列認識装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2014219900A JP2014219900A (ja) | 2014-11-20 |
JP5807881B2 true JP5807881B2 (ja) | 2015-11-10 |
Family
ID=51938270
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013100118A Active JP5807881B2 (ja) | 2013-05-10 | 2013-05-10 | プログラム、情報記憶媒体及び文字列認識装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5807881B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10082951B2 (en) * | 2016-01-07 | 2018-09-25 | Myscript | System and method for digital ink interactivity |
-
2013
- 2013-05-10 JP JP2013100118A patent/JP5807881B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2014219900A (ja) | 2014-11-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10095684B2 (en) | Trained data input system | |
JP5405586B2 (ja) | 手書き文字認識方法および手書き文字認識装置 | |
CN104166474A (zh) | 信息处理装置和字符识别方法 | |
KR100587540B1 (ko) | 디지털 잉크 질의 검색 장치 및 방법 | |
US11550751B2 (en) | Sequence expander for data entry/information retrieval | |
US8713464B2 (en) | System and method for text input with a multi-touch screen | |
US20150154176A1 (en) | Handwriting input support apparatus and method | |
WO2015117855A1 (en) | Method and apparatus for recognising music symbols | |
US10872203B2 (en) | Data input system using trained keypress encoder | |
CN114365075A (zh) | 用于选择图形对象的方法和对应装置 | |
JP4817297B2 (ja) | 文字検索装置 | |
US9659006B2 (en) | Disambiguation in concept identification | |
JP5807881B2 (ja) | プログラム、情報記憶媒体及び文字列認識装置 | |
EP3772015B1 (en) | Text line extraction | |
JP2016110304A (ja) | 共通操作情報生成プログラム、共通操作情報生成方法、及び共通操作情報生成装置 | |
JPWO2017104805A1 (ja) | プログラム、情報記憶媒体及び文字列認識装置 | |
Nguyen et al. | A semi-incremental recognition method for on-line handwritten English text | |
CN111310442B (zh) | 形近字纠错语料挖掘方法、纠错方法、设备及存储介质 | |
JP2022165925A (ja) | データラベリング方法、装置、電子機器、及び読み取り可能な記憶媒体 | |
JP2019148859A (ja) | フローダイアグラムを用いたモデル開発環境におけるデザインパターンの発見を支援する装置および方法 | |
CN103761294A (zh) | 基于手写轨迹和语音识别的查询方法及装置 | |
Nguyen et al. | A semi-incremental recognition method for on-line handwritten Japanese text | |
CN111104886A (zh) | 手势识别方法、装置、设备和存储介质 | |
US20240013407A1 (en) | Information processing apparatus, information processing method, and non-transitory computer-readable storage medium | |
CN107870678A (zh) | 一种手写输入方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20141120 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20150818 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20150826 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20150901 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5807881 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |