JP3507720B2 - オンライン手書き文字認識装置及びコンピュータ読み取り可能な記録媒体 - Google Patents
オンライン手書き文字認識装置及びコンピュータ読み取り可能な記録媒体Info
- Publication number
- JP3507720B2 JP3507720B2 JP01255299A JP1255299A JP3507720B2 JP 3507720 B2 JP3507720 B2 JP 3507720B2 JP 01255299 A JP01255299 A JP 01255299A JP 1255299 A JP1255299 A JP 1255299A JP 3507720 B2 JP3507720 B2 JP 3507720B2
- Authority
- JP
- Japan
- Prior art keywords
- word
- character
- character recognition
- candidate
- generation unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Landscapes
- Character Discrimination (AREA)
- User Interface Of Digital Computer (AREA)
Description
ュータ、携帯情報端末等の情報機器に用いられ、手書き
入力された文字を認識する文字認識装置に関し、特にオ
ンラインで手書き文字が入力されて認識されるオンライ
ン手書き文字認識装置に関する。
報端末等に対して文字を入力する際にキーボード入力が
主流である。ところが、このキーボードを用いた文字入
力には一定の技量が必要であり、文字入力の対象となる
機器が携帯情報端末のように小型化が進んでいるために
キーボードを設ける領域を確保できない等の問題が生じ
ている。そこで、タブレット等を用いたオンライン手書
き文字入力が注目されている。
いて英単語等の入力を行う場合に、キーボード入力とは
異なって、手書き文字の認識結果には、「確からしさ」
が含まれ、通常、この「確からしさ」の順に単語候補が
生成される。そこで、このようなオンライン手書き文字
認識装置の単語生成について、3つの従来技術を以下に
説明する。
て文字ラティスを作成し、この文字ラティスを組み合わ
せて単語候補を生成する。このとき、単語辞書にない単
語候補も生成されるため、生成された単語候補と単語辞
書との照合(以下、スペルチェックと呼ぶ)を順次行
い、辞書にない単語候補を棄却して、単語辞書に登録さ
れている単語候補を選択して生成する(従来技術1)。
力された文字を文字単位で認識して文字ラティスを作成
し、この文字ラティスを組み合わせて単語候補を生成す
る際に単語辞書を参照して単語辞書に登録されている単
語候補を生成する(従来技術2)。
て文字ラティスを作成し、この文字ラティスを統計処理
された言語辞書(例えば、3文字間の遷移確率を示すト
ライグラムなど)の情報を用いて順次組合せて単語候補
を生成する(従来技術3)。
字認識時における手書き入力された文字の入力パターン
と文字標準パターンとの距離の単語候補毎の合計値(以
下、このような「確からしさ」を示す数値をスコアと呼
ぶ)の順にメモリに記憶され、メモリに記憶された複数
の単語候補の中から、所定数の単語候補が認識結果とし
て表示される。
ラティスを組合せて生成した単語候補についてスペルチ
ェックを行っているので、固有名詞、専門用語、省略語
等のように単語辞書に登録されていないがユーザは使用
したい単語(ユーザ単語)は単語候補から除外されてし
まうという問題がある。
を参照しながら順次組合せて単語候補を生成しているの
で、従来技術1と同様に、ユーザ単語は単語候補から除
外されてしまうという問題がある。
ながら文字ラティスを順次組合せて単語候補を生成する
ので、ユーザ単語の入力も言語辞書にあれば可能である
が、その場合でも文字ラティス自身が誤認識されてしま
うと、結果的に入力不可になってしまい、かなり丁寧に
筆記しないとユーザ単語を入力しにくいという問題があ
る。
き入力文字を効率良く単語候補として生成できるオンラ
イン手書き文字認識装置を提供することにある。
ン手書き文字認識装置は、手書き入力文字の入力位置関
係と文字認識結果に基づいて単語候補を生成するオンラ
イン手書き文字認識装置であって、単語辞書と認識され
た文字間の位置関係の遷移を示す第1の遷移制御情報と
を用いて上記入力位置関係と文字認識結果から単語候補
を生成する第1の単語生成部と、第1の遷移制御情報を
用いて上記入力位置関係と文字認識結果から単語候補を
生成する第2の単語生成部と、第1の単語生成部及び第
2の単語生成部から生成された単語候補を統合して出力
する結果統合部と、を有することを特徴とする。
装置は、請求項1記載のオンライン手書き文字認識装置
において、第1の単語生成部または第2の単語生成部
は、文字間または文字種間で特定の遷移を許容する第2
の遷移制御情報を用いることを特徴とする。
装置は、請求項1記載のオンライン手書き文字認識装置
において、第2の単語生成部で生成された単語候補にペ
ナルティーを課す手段を有することを特徴とする。
装置は、請求項1記載のオンライン手書き文字認識装置
において、上記結果統合部から出力された単語候補を上
記単語辞書に登録されているか否かを識別する表示形態
で表示する表示手段を有することを特徴とする。
装置は、請求項4記載のオンライン手書き文字認識装置
において、上記単語辞書に登録されていない単語候補を
認識単語として確定すると、当該単語を上記単語辞書に
追加登録する登録手段を有することを特徴とする。
な記録媒体は、手書き入力文字の文字認識結果に基づい
て単語候補を生成するオンライン手書き文字認識装置と
して機能させるコンピュータ読み取り可能な記録媒体で
あって、上記文字認識結果から単語辞書と認識された文
字間の位置関係の遷移を示す第1の遷移制御情報とを用
いて単語候補を生成する第1の単語生成部、上記文字認
識結果から第1の遷移制御情報を用いて単語候補を生成
する第2の単語生成部、第1の単語生成部及び第2の単
語生成部から生成された単語候補を統合して出力する結
果統合部、として機能させる。
ライン手書き文字認識装置のブロック構成を示す。この
オンライン手書き文字認識装置は、タブレット1、文字
切り出し部2、特徴抽出部3、文字認識部4、単語生成
部5、単語辞書部6、文字位置判定部7、本装置全体の
動作を制御する制御部8、及び表示部9で構成される。
体型に形成されており、筆記者がペン等を用いて時系列
で手書き入力した筆跡を電気信号で表現される座標デー
タ列に変換する。文字切り出し部2は、タブレット1か
らの座標データ列に基づいて単語や文字区間の検出を行
う。特徴抽出部3は、文字切り出し部2によって検出さ
れた文字区間について手書き入力された筆跡の特徴パラ
メータを抽出する。
た特徴パラメータの入力パターンと予め記憶された文字
標準パターンとマッチングして文字認識して、類似度の
大きな順(マッチング距離の小さい順)に文字区間ごと
の文字認識候補を生成し、文字認識候補の組み合わせか
らなる文字候補列(文字ラティス)を生成する。
ラティスの中で単語辞書部6に合致する単語候補をスコ
アの高い順に生成する単語生成部5a、単語辞書部6で
の登録/未登録に関係なく、文字認識部4からの文字ラ
ティスの中から類似度の大きな順、つまりスコアの高い
順に単語候補を生成する単語生成部5b、単語生成部5
aと単語生成部5bからの単語候補をスコア順に統合す
る結果統合部5cからなる。結果統合部5cからの単語
候補は表示部9に表示される。
に正しい単語が予め登録されている一般辞書部6a、一
般辞書部6aに当初登録されていないが後から追加され
るユーザ単語が登録されるユーザ辞書部6bからなる。
単語生成部5aは、単語辞書部6全体を参照して単語候
補を生成する。
有しており、この遷移制御テーブルに基づいて生成され
た文字ラティスの妥当性を判定し、その結果を単語生成
部5aと単語生成部5bに送り、各単語候補のスコアに
後述するペナルティーを課す。この遷移制御テーブルは
2種類の遷移制御情報からなり、第1の遷移制御情報
は、各文字の高さ方向の位置関係の遷移を示す情報であ
り、切り出された実際の文字間の位置関係とこの第1の
遷移制御情報とが比較されて、合致しない単語候補にペ
ナルティーを課す。
種間で特定の遷移を許容する情報をテーブルで有し、切
り出された実際の文字間の遷移と第2の遷移制御情報と
が比較されて、切り出された実際の文字間の遷移が上記
テーブルで許容されていない遷移である場合、その単語
候補にペナルティーを課す。このテーブルは、バイグラ
ム(2文字間の遷移確率)やトライグラムとしてもよ
い。
と文字位置判定部7の情報を用いて単語候補を生成し、
単語生成部5bは、文字位置判定部7からの情報のみを
用いて単語候補を生成する。
ce”(単語辞書部6には登録されている単語)が手書
き入力された場合を具体例にして本装置の動作を説明す
る。ユーザがタブレット1上に図3(a)のように”p
lace”と筆記すると、ステップS1で、文字切り出
し部2によって、タブレット1からの座標データ列が取
り込まれる。ステップS2で、ストローク間の空白や、
最後に入力されたストロークのペンオフからの時間等に
よって、単語の終了判定が行われる。単語の終了でない
と判断された場合、ステップS3で、ストローク間の空
白やストロークのオーバーラップの度合い等によって、
文字の境界となりうる可能性があるか否かの判定が行わ
れる。文字境界となりうる可能性があると判断された場
合、その境界で文字の切り出しが行われ、ステップS4
で、特徴抽出部3によって、切り出された文字区間の座
標データ列から文字認識に必要な特徴パラメータが抽出
される。ステップS5で、文字認識部4によって、ステ
ップS4で抽出された特徴パラメータから入力パターン
が作成され、文字標準パターンとのマッチングが行われ
て、図3(a)に示すような認識結果が得られる。図3
(a)において、入力英単語”place”に対する各
文字の認識結果が類似度の大きな順に示されているが、
これらの認識結果は文字ラティスとして出力し記憶され
る。
された場合、ステップS6で、まず単語生成部5aによ
って、文字認識部4によって生成された図3(a)に示
す文字ラティスの中から類似度の大きい順に組合せ、単
語辞書部6に登録されている単語に合致する単語候補が
生成され、具体的には図3(b)に示す”peac
e”、”place”の単語候補が生成される。この
時、第1の遷移制御情報は、文字の高さを上中下の3段
階に分けた場合に、’p’,’l’,’a’の文字間の
位置は中→上→中のように遷移し、’p’,’e’,’
a’の文字間の位置は中→中→中のように遷移する。従
って、切り出された実際の文字間の位置が、中→上→中
のように遷移している場合には、文字位置判定部7で文
字間の位置関係を調べると’p’,’e’,’a’の間
で条件を満足してないため、単語候補”peace”の
スコアにペナルティーが課され(スコアがペナルティー
により減少し)、この場合、単語候補の順位が、”pl
ace”より下がる。また、文字位置判定部7は、第2
の遷移制御情報を用いて文字種が変わる場合にもペナル
ティーを課する機能を有するが、この例ではすべての単
語候補がアルファベットの小文字間の遷移であり、ペナ
ルティーは加算されない。
よって、図3(a)の文字ラティスの中から類似度の大
きい順に組合せ、図3(c)に示す”peacc”,”
placc”,”peace”などの単語候補が生成さ
れる。しかし、”peacc”や”peace”などの
単語候補は、文字位置判定部7で文字間の位置関係を調
べると’p’,’e’,’a’の間で上記と同様に条件
を満足しないため、それらの単語候補にペナルティーが
課され、単語候補の順位が下がる。また、単語生成部5
bによって生成されたすべての単語候補のスコアに、単
語辞書部6に登録された単語を優先するために、ペナル
ティーが課される。そして、結果統合部5cによって、
単語生成部5aの単語候補と単語生成部5bの単語候補
の結果が統合され、スコアが高い順に所定数の単語候補
が出力される。この時、単語生成部5aと単語生成部5
bとで生成された単語候補が同じであれば、よりスコア
の高い方にまとめられる。
って、表示部9に単語生成部6によって生成された複数
の単語候補のうち、スコア順に単語候補が認識結果とし
て表示され、この場合、単語候補”place”が1位
候補として表示される。
報を用いなかったが、アルファベットの大文字小文字が
同型の認識結果を含む場合、あるいはアルファベット以
外に数字、記号などの文字種が異なる認識結果も含む場
合には、第2の遷移制御情報を用いれば、より効率的に
単語候補を生成できる。例えば、大文字アルファベット
の’C’と小文字アルファベットの’c’とが認識結果
に入る場合には、単語中に大文字がある単語候補のスコ
アにペナルティーが課され、記号の括弧’(’とアルフ
ァベットの’c’とが、認識結果に入る場合には、括
弧’(’のある単語候補のスコアにペナルティーが課さ
れる。
nue”の省略語”Ave”(単語辞書部6には登録さ
れていない単語)が手書き入力された場合を具体例にし
て本装置の単語生成動作を説明する。ステップS6まで
の動作は上述した通りであるので、説明は省略する。
された場合、ステップS6で、まず単語生成部5aによ
って、文字認識部4によって生成された図4(a)に示
す文字ラティスの中から類似度の大きい順に組合せ、単
語辞書部6に登録されている単語に合致する単語候補、
具体的には図4(b)に示す”Are”、”Hue”が
生成される。
よって、図4(a)の文字ラティスの中から類似度の大
きい順に組合せ、図4(c)に示す”Ave”,”Au
e”,”Are”などの単語候補が生成される。単語生
成部5bによって生成された単語候補すべてのスコア
に、単語辞書部6に登録された単語を優先するために、
ペナルティーが課される。そして、上記結果統合部5c
によって、単語生成部5aの単語候補と単語生成部5b
の単語候補の結果が統合され、スコアが高い順に所定数
の単語候補が表示される。
す。表示部9の表示領域11に、もっともスコア順位が
高い単語候補を表示するとともに、表示領域11近くの
候補表示領域12にスコア順位の高い順に所定数(本実
施の形態の場合には最大3候補)の単語候補を表示す
る。ユーザは候補表示領域12内の”Ave”をペン等
で選択することにより、省略語”Ave”を表示領域1
1に表示されている”Are”に替えて入力する。
示された単語候補をペン等の指示手段で選択することに
より、制御部8は、単語辞書部6に未登録の単語候補”
Ave”が認識結果として確定されたので、単語辞書部
6のユーザ辞書部6bに単語”Ave”を追加登録す
る。したがって、単語候補”Ave”が単語辞書部6に
登録されているので、以降、省略語”Ave”が多少ラ
フに筆記されて入力されても、単語生成部5aで単語候
補として生成され単語生成部の違いによるペナルティー
が課されないので、1位の単語候補に入力可能になる。
このように、単語辞書に登録されていない単語であって
も、最初は1位に認識することが難しい場合があるが、
一度候補選択を行って認識結果を確定することにより、
その単語候補が単語辞書に自動的に追加されるので、次
回からの入力が容易になる。
表示例を示す。この表示例では、表示部9における表示
の際に、単語辞書部6に登録された単語候補であるか否
かをユーザが容易に区別できるように、単語候補の前に
マークを付けて候補表示領域12に表示する。このよう
に単語辞書部6に登録された単語候補か否かを識別する
表示形態であれば、この例に限らず、反転表示、点滅表
示、異なる色での表示等でもよい。このように表示する
ことにより、ユーザは入力した単語が単語辞書部6に登
録されていないことを知ることができる。
れた筆跡を文字認識部4で文字単位で認識し、その結果
に基づいて単語生成を行うようにしている。しかしなが
ら、この発明はこれに限定されるものではなく、手書き
入力された筆跡をストロークまたはサブパターン単位で
認識し、その結果に基づいて文字を認識して単語生成を
行うようにしてもよい。
より実行されるが、このプログラムの全部または一部
を、直接あるいは通信回線を介してフロッピーディスク
やハードディスク等のコンピュータ読み取り可能な記録
媒体に予め記録媒体に格納しておき、必要に応じてイン
ストールして用いてもよい。
れば、手書き文字も単語候補として効率良く生成でき、
単語辞書に登録されている単語は多少ラフに筆記しても
出力でき、単語辞書に登録されていないユーザ単語もあ
る程度丁寧に筆記して出力することができる。
きさや文字種が異なっている場合に、より効率的に単語
候補を生成できる。
未登録の単語候補に一定のペナルティーを加えることに
より、単語辞書と合致する単語候補を優先的に出力で
き、単語辞書に登録されている単語は多少ラフに筆記し
ても出力できる。
単語候補の中から単語辞書に未登録の単語候補を容易に
知ることができる。
登録されていない単語候補が認識単語として登録されて
いるため、以降の手書き入力で当該登録単語が入力され
た場合には、単語候補として確実に出力できるようにな
る。
装置のブロック構成を示す図である。
装置の動作を示すフローチャートである。
認識結果で生成される文字ラティス例を示す図であり、
(b)は、単語生成部5aで生成される単語候補例を示
す図であり、(c)は、単語生成部5bで生成される単
語候補例を示す図である。
結果で生成される文字ラティス例を示す図であり、
(b)は、単語生成部5aで生成される単語候補例を示
す図であり、(c)は、単語生成部5bで生成される単
語候補例を示す図である。
表示例を示す図であり、(b)は、単語辞書部6に未登
録である単語候補にマークを付加した表示例を示す図で
ある。
Claims (6)
- 【請求項1】 手書き入力文字の入力位置関係と文字認
識結果に基づいて単語候補を生成するオンライン手書き
文字認識装置であって、 単語辞書と認識された文字間の位置関係の遷移を示す第
1の遷移制御情報とを用いて上記入力位置関係と文字認
識結果から単語候補を生成する第1の単語生成部と、 第1の遷移制御情報を用いて上記入力位置関係と文字認
識結果から単語候補を生成する第2の単語生成部と、 第1の単語生成部及び第2の単語生成部から生成された
単語候補を統合して出力する結果統合部と、を有するこ
とを特徴とするオンライン手書き文字認識装置。 - 【請求項2】 第1の単語生成部または第2の単語生成
部は、文字間または文字種間で特定の遷移を許容する第
2の遷移制御情報を用いることを特徴とする請求項1記
載のオンライン手書き文字認識装置。 - 【請求項3】 第2の単語生成部で生成された単語候補
にペナルティーを課す手段を有することを特徴とする請
求項1記載のオンライン手書き文字認識装置。 - 【請求項4】 上記結果統合部から出力された単語候補
を上記単語辞書に登録されているか否かを識別する表示
形態で表示する表示手段を有することを特徴とする請求
項1記載のオンライン手書き文字認識装置。 - 【請求項5】 上記単語辞書に登録されていない単語候
補を認識単語として確定すると、当該単語を上記単語辞
書に追加登録する登録手段を有することを特徴とする請
求項4記載のオンライン手書き文字認識装置。 - 【請求項6】 手書き入力文字の文字認識結果に基づい
て単語候補を生成するオンライン手書き文字認識装置と
して機能させるコンピュータ読み取り可能な記録媒体で
あって、 上記文字認識結果から単語辞書と認識された文字間の位
置関係の遷移を示す第1の遷移制御情報とを用いて単語
候補を生成する第1の単語生成部、 上記文字認識結果から第1の遷移制御情報を用いて単語
候補を生成する第2の単語生成部、 第1の単語生成部及び第2の単語生成部から生成された
単語候補を統合して出力する結果統合部、として機能さ
せるコンピュータ読み取り可能な記録媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP01255299A JP3507720B2 (ja) | 1999-01-21 | 1999-01-21 | オンライン手書き文字認識装置及びコンピュータ読み取り可能な記録媒体 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP01255299A JP3507720B2 (ja) | 1999-01-21 | 1999-01-21 | オンライン手書き文字認識装置及びコンピュータ読み取り可能な記録媒体 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2000215273A JP2000215273A (ja) | 2000-08-04 |
JP3507720B2 true JP3507720B2 (ja) | 2004-03-15 |
Family
ID=11808511
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP01255299A Expired - Fee Related JP3507720B2 (ja) | 1999-01-21 | 1999-01-21 | オンライン手書き文字認識装置及びコンピュータ読み取り可能な記録媒体 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3507720B2 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6409165B2 (ja) * | 2014-12-08 | 2018-10-24 | 富士通コネクテッドテクノロジーズ株式会社 | 電子機器、及び、手書き文字入力プログラム |
JP6562698B2 (ja) * | 2015-04-28 | 2019-08-21 | 株式会社東芝 | ラティス確定装置、パターン認識装置、ラティス確定方法およびプログラム |
-
1999
- 1999-01-21 JP JP01255299A patent/JP3507720B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2000215273A (ja) | 2000-08-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7428516B2 (en) | Handwriting recognition using neural networks | |
US5454046A (en) | Universal symbolic handwriting recognition system | |
KR100412317B1 (ko) | 문자인식/수정방법및장치 | |
JP4998219B2 (ja) | 帳票認識プログラム、帳票認識装置および帳票認識方法 | |
US10963717B1 (en) | Auto-correction of pattern defined strings | |
US8411958B2 (en) | Apparatus and method for handwriting recognition | |
WO2007094078A1 (ja) | 文字列検索方法およびその装置 | |
JP3507720B2 (ja) | オンライン手書き文字認識装置及びコンピュータ読み取り可能な記録媒体 | |
JP3669626B2 (ja) | 検索装置、記録媒体およびプログラム | |
JP3467437B2 (ja) | 文字認識装置及びその方法とプログラム記録媒体 | |
JPH05225399A (ja) | 文書処理装置 | |
JP3274014B2 (ja) | 文字認識装置および文字認識方法 | |
JPS592191A (ja) | 手書き日本語文の認識処理方式 | |
JPS6228889A (ja) | 情報認識装置 | |
JP4263928B2 (ja) | 文字認識装置、文字認識方法、文字認識プログラム、及び記録媒体 | |
JP3075808B2 (ja) | 文書処理装置 | |
KR102673900B1 (ko) | 표 데이터 추출 시스템 및 그 방법 | |
JPS6111891A (ja) | 手書き文字図形認識装置 | |
JP2804660B2 (ja) | 文書処理装置 | |
JP3151866B2 (ja) | 英文字認識方法 | |
JP3780023B2 (ja) | 文字認識装置及びその方法 | |
JP2989387B2 (ja) | 入力文字処理装置における句点認識装置及び句点認識方法 | |
JP2994992B2 (ja) | 手書き文字オンライン認識装置とその字体登録・学習方法 | |
JPH06111079A (ja) | 単語読み取り装置 | |
JP2549831B2 (ja) | 文字認識装置の入力パターン・文字列登録方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20031209 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20031219 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20071226 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20081226 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20091226 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20091226 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20101226 Year of fee payment: 7 |
|
LAPS | Cancellation because of no payment of annual fees |