JP2002259912A - オンライン文字列認識装置及びオンライン文字列認識方法 - Google Patents
オンライン文字列認識装置及びオンライン文字列認識方法Info
- Publication number
- JP2002259912A JP2002259912A JP2001050900A JP2001050900A JP2002259912A JP 2002259912 A JP2002259912 A JP 2002259912A JP 2001050900 A JP2001050900 A JP 2001050900A JP 2001050900 A JP2001050900 A JP 2001050900A JP 2002259912 A JP2002259912 A JP 2002259912A
- Authority
- JP
- Japan
- Prior art keywords
- character
- word
- candidate
- dictionary
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Character Discrimination (AREA)
Abstract
(57)【要約】
【課題】 筆記した文字列の認識精度を向上する。
【解決手段】 単語検出手段7は、個別文字認識手段4
が求めた候補文字から単語辞書6を用いて単語候補を検
出し、文字形状評価手段9が文字形状辞書8の文字の形
状情報と、文字矩形パタン格納バッファ2に格納された
文字矩形パタンを参照して、単語候補を構成する文字に
対する文字形状の評価を行い、連接確率情報評価手段1
1が言語情報辞書10の単語の連接確率情報を参照し
て、候補文字ラティスバッファ5に格納された候補文字
及び単語候補による文字列候補の単語の連接確率情報を
求め、最適候補選択手段12が最適な文字列を選択す
る。
が求めた候補文字から単語辞書6を用いて単語候補を検
出し、文字形状評価手段9が文字形状辞書8の文字の形
状情報と、文字矩形パタン格納バッファ2に格納された
文字矩形パタンを参照して、単語候補を構成する文字に
対する文字形状の評価を行い、連接確率情報評価手段1
1が言語情報辞書10の単語の連接確率情報を参照し
て、候補文字ラティスバッファ5に格納された候補文字
及び単語候補による文字列候補の単語の連接確率情報を
求め、最適候補選択手段12が最適な文字列を選択す
る。
Description
【0001】
【発明の属する技術分野】この発明は文字枠無しで書か
れたオンライン手書き文字列を認識する際に、文字認識
候補漏れがある場合でも、正しく手書き文字列を認識す
るオンライン文字列認識装置及びオンライン文字列認識
方法に関するものである。
れたオンライン手書き文字列を認識する際に、文字認識
候補漏れがある場合でも、正しく手書き文字列を認識す
るオンライン文字列認識装置及びオンライン文字列認識
方法に関するものである。
【0002】
【従来の技術】近年、コンピュータや携帯情報端末等に
情報を入力する際に、キーボードを使わずに直接手書き
入力できる文字枠無しのオンライン文字列認識装置が開
発されている。このオンライン文字列認識装置は文字枠
がないため、筆記された文字列を文字認識する場合に、
文字認識誤りの他に、文字切出し誤りを生じやすい。こ
のため高精度な認識を実現するためには、個別の文字認
識処理の他に、言語知識を用いて文字列として妥当な結
果を求めることが必要である。
情報を入力する際に、キーボードを使わずに直接手書き
入力できる文字枠無しのオンライン文字列認識装置が開
発されている。このオンライン文字列認識装置は文字枠
がないため、筆記された文字列を文字認識する場合に、
文字認識誤りの他に、文字切出し誤りを生じやすい。こ
のため高精度な認識を実現するためには、個別の文字認
識処理の他に、言語知識を用いて文字列として妥当な結
果を求めることが必要である。
【0003】一般に、言語知識を用いて文字認識結果の
精度を向上させる場合には、文字認識処理で得られる複
数の候補文字の中から言語知識に合致する情報を抽出し
て評価する方法がとられている。この場合には、文字認
識結果の候補文字中に、正しい正解文字が含まれていな
いと性能が低下するという問題がある。文字認識結果の
候補文字に正解文字が含まれていなくても、言語知識に
より文字列認識精度を向上させるものとして、例えば、
特開平11−328316号公報(従来例1)や、特開
平08−315078号公報(従来例2)がある。
精度を向上させる場合には、文字認識処理で得られる複
数の候補文字の中から言語知識に合致する情報を抽出し
て評価する方法がとられている。この場合には、文字認
識結果の候補文字中に、正しい正解文字が含まれていな
いと性能が低下するという問題がある。文字認識結果の
候補文字に正解文字が含まれていなくても、言語知識に
より文字列認識精度を向上させるものとして、例えば、
特開平11−328316号公報(従来例1)や、特開
平08−315078号公報(従来例2)がある。
【0004】図19は上記従来例1の公報に開示された
オンライン文字列認識装置の構成を示すブロック図であ
る。図において、110は入力した文字列パタンから文
字切出しを行い文字切出し候補を出力する文字切出し候
補生成手段、120は上記文字切出し候補を入力し、文
字認識辞書160により文字認識し候補文字列を出力す
る個別文字認識手段、130は候補文字列を入力し、文
字n−gram確率辞書170を参照して、候補文字列
に対する文字n−gram確率を求める文字n−gra
m確率計算手段である。
オンライン文字列認識装置の構成を示すブロック図であ
る。図において、110は入力した文字列パタンから文
字切出しを行い文字切出し候補を出力する文字切出し候
補生成手段、120は上記文字切出し候補を入力し、文
字認識辞書160により文字認識し候補文字列を出力す
る個別文字認識手段、130は候補文字列を入力し、文
字n−gram確率辞書170を参照して、候補文字列
に対する文字n−gram確率を求める文字n−gra
m確率計算手段である。
【0005】また、図19において、140は候補文字
列を入力し、それが単語であった場合にその生起確率を
求める単語生起確率計算手段、141は候補文字列を入
力し、それと完全に一致する単語を生起確率付き単語辞
書180から検索する完全一致単語検索手段、142は
候補文字列を入力し、それと類似した単語を生起確率付
き単語辞書180から検索するあいまい単語検索手段、
150は単語生起確率計算手段140と個別文字認識手
段120によって得られた候補文字の確信度と、文字n
−gram確率計算手段130、単語生起確率計算手段
140によって得られた候補文字列の確率とを統合して
最適な結果を得る最適候補選択手段である。
列を入力し、それが単語であった場合にその生起確率を
求める単語生起確率計算手段、141は候補文字列を入
力し、それと完全に一致する単語を生起確率付き単語辞
書180から検索する完全一致単語検索手段、142は
候補文字列を入力し、それと類似した単語を生起確率付
き単語辞書180から検索するあいまい単語検索手段、
150は単語生起確率計算手段140と個別文字認識手
段120によって得られた候補文字の確信度と、文字n
−gram確率計算手段130、単語生起確率計算手段
140によって得られた候補文字列の確率とを統合して
最適な結果を得る最適候補選択手段である。
【0006】さらに、図19において、160は個別文
字認識を行うための情報を保持している文字認識辞書、
170は学習用文書から統計的に求められた文字n−g
ram確率を保持している文字n−gram確率辞書、
180は単語の表記と学習用文書中におけるその生起確
率を保持している生起確率付き単語辞書、190は個別
文字認識手段120によって得られた確信度付き候補文
字と文字n−gram確率計算手段130又は単語生起
確率計算手段140によって得られた候補文字列の確率
とを切出し位置に基づいたラティス構造として蓄積して
いる候補文字ラティスバッファである。
字認識を行うための情報を保持している文字認識辞書、
170は学習用文書から統計的に求められた文字n−g
ram確率を保持している文字n−gram確率辞書、
180は単語の表記と学習用文書中におけるその生起確
率を保持している生起確率付き単語辞書、190は個別
文字認識手段120によって得られた確信度付き候補文
字と文字n−gram確率計算手段130又は単語生起
確率計算手段140によって得られた候補文字列の確率
とを切出し位置に基づいたラティス構造として蓄積して
いる候補文字ラティスバッファである。
【0007】次に従来例1の動作について説明する。文
字切出し候補生成手段110は、入力された文字列パタ
ンをその形状的な特徴によって1文字ごとに分割し、切
出し候補として出力する。個別文字認識手段120は、
切出し候補に対応する文字パタンを文字認識辞書160
によって文字認識し、1つの切出し候補に対して複数の
候補文字と各候補文字の確信度を出力する。この確信度
は、各候補文字の確からしさを表わす確率である。この
ようにして得られた確信度付き候補文字は、候補文字ラ
ティスバッファ190に蓄積される。
字切出し候補生成手段110は、入力された文字列パタ
ンをその形状的な特徴によって1文字ごとに分割し、切
出し候補として出力する。個別文字認識手段120は、
切出し候補に対応する文字パタンを文字認識辞書160
によって文字認識し、1つの切出し候補に対して複数の
候補文字と各候補文字の確信度を出力する。この確信度
は、各候補文字の確からしさを表わす確率である。この
ようにして得られた確信度付き候補文字は、候補文字ラ
ティスバッファ190に蓄積される。
【0008】文字n−gram確率計算手段130は、
候補文字ラティスバッファ190からn文字の候補文字
列を全て生成し、それらの文字n−gram確率を文字
n−gram確率辞書170を参照して計算する。計算
された文字n−gram確率は、候補文字ラティスバッ
ファ190に蓄積される。
候補文字ラティスバッファ190からn文字の候補文字
列を全て生成し、それらの文字n−gram確率を文字
n−gram確率辞書170を参照して計算する。計算
された文字n−gram確率は、候補文字ラティスバッ
ファ190に蓄積される。
【0009】単語生起確率計算手段140は、完全一致
単語検索手段141、又はあいまい単語検索手段142
によって検索された単語の生起確率を候補文字ラティス
バッファ190に蓄積する。完全一致単語検索手段14
1は、候補文字ラティスバッファ190から生成される
候補文字列が生起確率付き単語辞書180に存在するか
検索する。
単語検索手段141、又はあいまい単語検索手段142
によって検索された単語の生起確率を候補文字ラティス
バッファ190に蓄積する。完全一致単語検索手段14
1は、候補文字ラティスバッファ190から生成される
候補文字列が生起確率付き単語辞書180に存在するか
検索する。
【0010】あいまい単語検索手段142は、完全一致
単語検索手段141と同様に、候補文字ラティスバッフ
ァ190から生成される候補文字列が生起確率付き単語
辞書180に存在するかどうかを検索するが、この検索
には、一部の文字が一致しなくても検索できたとみなす
あいまい検索を行なう。あいまい検索によって検索され
た単語内の不一致文字は、候補文字ラティスバッファ1
90には候補文字として存在していないので、その文字
に対する文字パタンと文字コードを個別文字認識手段1
20により確信度が求められ、それらは候補文字ラティ
スバッファ190に蓄積される。
単語検索手段141と同様に、候補文字ラティスバッフ
ァ190から生成される候補文字列が生起確率付き単語
辞書180に存在するかどうかを検索するが、この検索
には、一部の文字が一致しなくても検索できたとみなす
あいまい検索を行なう。あいまい検索によって検索され
た単語内の不一致文字は、候補文字ラティスバッファ1
90には候補文字として存在していないので、その文字
に対する文字パタンと文字コードを個別文字認識手段1
20により確信度が求められ、それらは候補文字ラティ
スバッファ190に蓄積される。
【0011】最適候補選択手段150は、候補文字ラテ
ィスバッファ190に蓄積された候補文字の中から、個
別文字認識手段120によって与えられた個々の文字の
確信度と、文字n−gram確率計算手段130又は単
語生起確率計算手段140によって与えられた前後の文
字を考慮した確率とを統合して、全体として最適な文字
列を認識結果として出力する。
ィスバッファ190に蓄積された候補文字の中から、個
別文字認識手段120によって与えられた個々の文字の
確信度と、文字n−gram確率計算手段130又は単
語生起確率計算手段140によって与えられた前後の文
字を考慮した確率とを統合して、全体として最適な文字
列を認識結果として出力する。
【0012】図20は上記従来例2の公報に開示された
オンライン文字列認識装置の構成を示すブロック図であ
る。図において、200は文字認識誤りを含む日本語テ
キストの入力文を入力し文字認識結果のスコアの高い順
に文字候補を並べたリストを生成する文字候補生成手
段、210は文字候補を入力し、文を構成する単語列と
単語に付与された品詞列の同時確率を与える品詞付けモ
デル260に基づいて単語列と品詞列の組を求める形態
素解析手段である。
オンライン文字列認識装置の構成を示すブロック図であ
る。図において、200は文字認識誤りを含む日本語テ
キストの入力文を入力し文字認識結果のスコアの高い順
に文字候補を並べたリストを生成する文字候補生成手
段、210は文字候補を入力し、文を構成する単語列と
単語に付与された品詞列の同時確率を与える品詞付けモ
デル260に基づいて単語列と品詞列の組を求める形態
素解析手段である。
【0013】また、図20において、220は単語の表
記と品詞の同時確率を与える単語モデル230に基づい
て単語仮説を生成する単語仮説生成手段、240は、正
解文字が候補文字に含まれていない場合に、訂正候補を
生成するために類似語モデル250に基づいて類似した
単語を検索する類似語検索手段、250は、文字列にお
いて、単語の前後に存在する文字と、単語内文字の三つ
組確率を用いて、この文字列と単語との類似度を与える
類似語モデルである。
記と品詞の同時確率を与える単語モデル230に基づい
て単語仮説を生成する単語仮説生成手段、240は、正
解文字が候補文字に含まれていない場合に、訂正候補を
生成するために類似語モデル250に基づいて類似した
単語を検索する類似語検索手段、250は、文字列にお
いて、単語の前後に存在する文字と、単語内文字の三つ
組確率を用いて、この文字列と単語との類似度を与える
類似語モデルである。
【0014】次に従来例2の動作について説明する。文
字候補生成手段200は入力文に対して文字候補を生成
する。形態素解析手段210は生成された文字候補を入
力し、単語モデル230から単語仮説生成手段220で
得られた単語仮説情報と、類似語モデル250から類似
語検索手段240で得られた類似語と、品詞付けモデル
260からの品詞付けモデル情報とに基づいて形態素列
を出力する。
字候補生成手段200は入力文に対して文字候補を生成
する。形態素解析手段210は生成された文字候補を入
力し、単語モデル230から単語仮説生成手段220で
得られた単語仮説情報と、類似語モデル250から類似
語検索手段240で得られた類似語と、品詞付けモデル
260からの品詞付けモデル情報とに基づいて形態素列
を出力する。
【0015】ここで、類似語検索手段240は、入力文
のある文字位置から始まる単語候補を検索する際に、正
解文字が候補文字のリストに存在しない場合に対処する
ために、単語テーブルと単語内文字三つ組確率テーブル
の値を用いて、類似した単語を検索し単語仮説に付け加
える。この際、長さ3以上の単語の場合は、同じ長さを
持つ単語のうち、一致した文字数に応じて類似度を定
め、類似度の上位のものを類似語とする。また、長さが
2の単語の場合は、まず文字認識の第1位候補の文字列
に対して単語リストの中から1文字のみ一致する単語を
全て選ぶ。次に、単語内文字三つ組確率テーブルの確率
を用いて、この単語と前後の文字列を組み合わせた長さ
6の文字列の出現確率を計算し、この確率が大きい順番
に予め決められた個数の単語を類似語として選ぶ。
のある文字位置から始まる単語候補を検索する際に、正
解文字が候補文字のリストに存在しない場合に対処する
ために、単語テーブルと単語内文字三つ組確率テーブル
の値を用いて、類似した単語を検索し単語仮説に付け加
える。この際、長さ3以上の単語の場合は、同じ長さを
持つ単語のうち、一致した文字数に応じて類似度を定
め、類似度の上位のものを類似語とする。また、長さが
2の単語の場合は、まず文字認識の第1位候補の文字列
に対して単語リストの中から1文字のみ一致する単語を
全て選ぶ。次に、単語内文字三つ組確率テーブルの確率
を用いて、この単語と前後の文字列を組み合わせた長さ
6の文字列の出現確率を計算し、この確率が大きい順番
に予め決められた個数の単語を類似語として選ぶ。
【0016】長さ1の単語に対して類似語を検索する場
合には、まず、単語リスト中のすべての長さ1の単語を
取り出す。次に、単語内文字三つ組確率を用いて、この
単語と前後の文字列を組み合わせた長さ5の文字列の出
現確率を計算し、この確率が大きい順番に予め決められ
た個数の単語を類似語として選ぶ。
合には、まず、単語リスト中のすべての長さ1の単語を
取り出す。次に、単語内文字三つ組確率を用いて、この
単語と前後の文字列を組み合わせた長さ5の文字列の出
現確率を計算し、この確率が大きい順番に予め決められ
た個数の単語を類似語として選ぶ。
【0017】このように、従来例1では、個別文字認識
手段120による候補文字に正解文字が含まれていない
場合は、あいまい単語検索手段142によって、単語辞
書の中で、単語の一部が不一致であるものも単語候補と
して考慮することにより正しく文字列を読み取るもので
ある。また、従来例2では、正解文字が候補文字に含ま
れない場合に、単語リストから部分的に文字が一致する
単語を選び、特に文字数の少ないものに対しては、前後
の文字との接続確率を考慮して類似単語を選び、単語候
補に追加することにより文字列認識精度の向上を図った
ものである。
手段120による候補文字に正解文字が含まれていない
場合は、あいまい単語検索手段142によって、単語辞
書の中で、単語の一部が不一致であるものも単語候補と
して考慮することにより正しく文字列を読み取るもので
ある。また、従来例2では、正解文字が候補文字に含ま
れない場合に、単語リストから部分的に文字が一致する
単語を選び、特に文字数の少ないものに対しては、前後
の文字との接続確率を考慮して類似単語を選び、単語候
補に追加することにより文字列認識精度の向上を図った
ものである。
【0018】
【発明が解決しようとする課題】従来のオンライン文字
列認識装置は以上のように構成され、単語辞書や単語リ
ストに存在する単語の中から、文字の部分一致を許した
単語を候補に追加するので、実際に筆記された文字形状
とは無関係に言語情報(単語情報)により候補単語を増
やしてしまい、その後の処理によっては、ユーザが筆記
した文字形状とかけ離れた単語文字列が上位に選択され
る可能性があるという課題があった。
列認識装置は以上のように構成され、単語辞書や単語リ
ストに存在する単語の中から、文字の部分一致を許した
単語を候補に追加するので、実際に筆記された文字形状
とは無関係に言語情報(単語情報)により候補単語を増
やしてしまい、その後の処理によっては、ユーザが筆記
した文字形状とかけ離れた単語文字列が上位に選択され
る可能性があるという課題があった。
【0019】この発明は上記のような課題を解決するた
めになされたものであり、文字認識結果の候補文字に正
解文字が含まれない場合に、単語情報から求めた単語候
補の内、候補文字に含まれない文字に関して文字形状を
考慮した評価を行い、筆記文字パターンに近い文字で構
成される単語のみを単語候補として追加することによ
り、ユーザが筆記した文字列と大きくかけ離れた文字列
認識結果となることを防ぎ、認識精度の高いオンライン
文字列認識装置及びオンライン文字列認識方法を得るこ
とを目的とする。
めになされたものであり、文字認識結果の候補文字に正
解文字が含まれない場合に、単語情報から求めた単語候
補の内、候補文字に含まれない文字に関して文字形状を
考慮した評価を行い、筆記文字パターンに近い文字で構
成される単語のみを単語候補として追加することによ
り、ユーザが筆記した文字列と大きくかけ離れた文字列
認識結果となることを防ぎ、認識精度の高いオンライン
文字列認識装置及びオンライン文字列認識方法を得るこ
とを目的とする。
【0020】
【課題を解決するための手段】この発明に係るオンライ
ン文字列認識装置は、入力した文字列パタンから文字を
構成する可能性がある文字矩形候補を生成する文字切出
し手段と、上記文字切出し手段により生成された文字矩
形候補に対応する文字矩形パタンを格納する文字矩形パ
タン格納バッファと、文字の特徴データを格納した文字
認識辞書と、上記文字切出し手段により生成された文字
矩形候補を、上記文字認識辞書を用いて認識し、認識結
果の候補文字とその類似度を求める個別文字認識手段
と、上記個別文字認識手段により求められた認識結果の
候補文字とその類似度を格納する候補文字ラティスバッ
ファと、単語情報を格納した単語辞書と、上記候補文字
ラティスバッファに格納されている候補文字から、上記
単語辞書の内容を参照して単語候補を検出し、後述の文
字形状評価手段により絞り込まれた単語候補を上記候補
文字ラティスバッファに格納すると共に、絞り込まれた
単語候補の候補文字の類似度を上記個別文字認識手段に
求めさせて上記候補文字ラティスバッファに格納させる
単語検出手段と、文字の形状情報を格納した文字形状辞
書と、上記文字形状辞書に格納された文字の形状情報
と、上記文字矩形パタン格納バッファに格納された文字
矩形パタンを参照して、上記単語検出手段により検出さ
れた単語候補を構成する文字に対する文字形状の評価を
行い上記単語候補を絞り込む文字形状評価手段と、単語
の連接確率情報を格納した言語情報辞書と、上記言語情
報辞書に格納された単語の連接確率情報を参照して、上
記候補文字ラティスバッファに格納された候補文字及び
単語候補による文字列候補の単語の連接確率情報を求め
て、上記候補文字ラティスバッファに格納する連接確率
情報評価手段と、上記候補文字ラティスバッファに格納
されている、候補文字の類似度と文字列候補の単語の連
接確率情報から最適な文字列を選択する最適候補選択手
段とを備えたものである。
ン文字列認識装置は、入力した文字列パタンから文字を
構成する可能性がある文字矩形候補を生成する文字切出
し手段と、上記文字切出し手段により生成された文字矩
形候補に対応する文字矩形パタンを格納する文字矩形パ
タン格納バッファと、文字の特徴データを格納した文字
認識辞書と、上記文字切出し手段により生成された文字
矩形候補を、上記文字認識辞書を用いて認識し、認識結
果の候補文字とその類似度を求める個別文字認識手段
と、上記個別文字認識手段により求められた認識結果の
候補文字とその類似度を格納する候補文字ラティスバッ
ファと、単語情報を格納した単語辞書と、上記候補文字
ラティスバッファに格納されている候補文字から、上記
単語辞書の内容を参照して単語候補を検出し、後述の文
字形状評価手段により絞り込まれた単語候補を上記候補
文字ラティスバッファに格納すると共に、絞り込まれた
単語候補の候補文字の類似度を上記個別文字認識手段に
求めさせて上記候補文字ラティスバッファに格納させる
単語検出手段と、文字の形状情報を格納した文字形状辞
書と、上記文字形状辞書に格納された文字の形状情報
と、上記文字矩形パタン格納バッファに格納された文字
矩形パタンを参照して、上記単語検出手段により検出さ
れた単語候補を構成する文字に対する文字形状の評価を
行い上記単語候補を絞り込む文字形状評価手段と、単語
の連接確率情報を格納した言語情報辞書と、上記言語情
報辞書に格納された単語の連接確率情報を参照して、上
記候補文字ラティスバッファに格納された候補文字及び
単語候補による文字列候補の単語の連接確率情報を求め
て、上記候補文字ラティスバッファに格納する連接確率
情報評価手段と、上記候補文字ラティスバッファに格納
されている、候補文字の類似度と文字列候補の単語の連
接確率情報から最適な文字列を選択する最適候補選択手
段とを備えたものである。
【0021】この発明に係るオンライン文字列認識装置
は、単語検出手段が、候補文字ラティスバッファに格納
されている候補文字から、単語辞書の内容を参照して単
語候補を検出する際に、候補文字から構成される単語と
一部不一致の単語候補を含めて検出するものである。
は、単語検出手段が、候補文字ラティスバッファに格納
されている候補文字から、単語辞書の内容を参照して単
語候補を検出する際に、候補文字から構成される単語と
一部不一致の単語候補を含めて検出するものである。
【0022】この発明に係るオンライン文字列認識装置
は、最適候補選択手段が、候補文字ラティスバッファに
格納されている候補文字の類似度と文字列候補の単語の
連接確率情報を加算し、加算結果の最大値により最適な
文字列を選択するものである。
は、最適候補選択手段が、候補文字ラティスバッファに
格納されている候補文字の類似度と文字列候補の単語の
連接確率情報を加算し、加算結果の最大値により最適な
文字列を選択するものである。
【0023】この発明に係るオンライン文字列認識装置
は、文字形状辞書が、文字の形状情報として、その文字
の特徴的なストローク情報を格納し、文字形状評価手段
が、上記文字形状辞書に格納された文字のストローク情
報と、文字矩形パタン格納バッファに格納された文字矩
形パタンを参照して、単語検出手段により検出された単
語候補を構成する文字に対する文字形状の評価を行い上
記単語候補を絞り込むものである。
は、文字形状辞書が、文字の形状情報として、その文字
の特徴的なストローク情報を格納し、文字形状評価手段
が、上記文字形状辞書に格納された文字のストローク情
報と、文字矩形パタン格納バッファに格納された文字矩
形パタンを参照して、単語検出手段により検出された単
語候補を構成する文字に対する文字形状の評価を行い上
記単語候補を絞り込むものである。
【0024】この発明に係るオンライン文字列認識装置
は、文字形状評価手段が、文字形状辞書に格納された文
字のストローク情報における各ストロークと、文字矩形
パタン格納バッファに格納された文字矩形パタンを照合
し、照合できたストローク数の割合に基づき、単語検出
手段により検出された単語候補を構成する文字に対する
文字形状の評価を行い上記単語候補を絞り込むものであ
る。
は、文字形状評価手段が、文字形状辞書に格納された文
字のストローク情報における各ストロークと、文字矩形
パタン格納バッファに格納された文字矩形パタンを照合
し、照合できたストローク数の割合に基づき、単語検出
手段により検出された単語候補を構成する文字に対する
文字形状の評価を行い上記単語候補を絞り込むものであ
る。
【0025】この発明に係るオンライン文字列認識装置
は、文字形状辞書が文字の形状情報とその重要度を格納
し、文字形状評価手段が、上記文字形状辞書に格納され
た文字の形状情報と、文字矩形パタン格納バッファに格
納された文字矩形パタンを参照して、単語検出手段によ
り検出された単語候補を構成する文字に対する文字形状
の評価を、上記文字形状辞書に格納された文字の形状情
報の重要度順に行い、所定の単語候補数になった時点で
文字形状の評価を終了するものである。
は、文字形状辞書が文字の形状情報とその重要度を格納
し、文字形状評価手段が、上記文字形状辞書に格納され
た文字の形状情報と、文字矩形パタン格納バッファに格
納された文字矩形パタンを参照して、単語検出手段によ
り検出された単語候補を構成する文字に対する文字形状
の評価を、上記文字形状辞書に格納された文字の形状情
報の重要度順に行い、所定の単語候補数になった時点で
文字形状の評価を終了するものである。
【0026】この発明に係るオンライン文字列認識装置
は、文字形状辞書が、文字の形状情報としての文字の特
徴的なストローク情報とその重要度を格納し、文字形状
評価手段が、上記文字形状辞書に格納された文字のスト
ローク情報と、文字矩形パタン格納バッファに格納され
た文字矩形パタンを参照して、単語検出手段により検出
された単語候補を構成する文字に対する文字形状の評価
を、上記文字形状辞書に格納された文字のストローク情
報の重要度順に行い、所定の単語候補数になった時点で
文字形状の評価を終了するものである。
は、文字形状辞書が、文字の形状情報としての文字の特
徴的なストローク情報とその重要度を格納し、文字形状
評価手段が、上記文字形状辞書に格納された文字のスト
ローク情報と、文字矩形パタン格納バッファに格納され
た文字矩形パタンを参照して、単語検出手段により検出
された単語候補を構成する文字に対する文字形状の評価
を、上記文字形状辞書に格納された文字のストローク情
報の重要度順に行い、所定の単語候補数になった時点で
文字形状の評価を終了するものである。
【0027】この発明に係るオンライン文字列認識方法
は、入力した文字列パタンから文字を構成する可能性が
ある文字矩形候補とそれに対応する文字矩形パタンを生
成する第1のステップと、上記第1のステップで生成さ
れた文字矩形候補を、文字の特徴データを格納した文字
認識辞書を用いて認識し、認識結果の候補文字とその類
似度を求める第2のステップと、上記第2のステップで
求められた候補文字から、単語情報を格納した単語辞書
の内容を参照して単語候補を検出する第3のステップ
と、文字形状辞書に格納された文字の形状情報と、上記
第1のステップで生成された文字矩形パタンを参照し
て、上記第3のステップで検出された単語候補を構成す
る文字に対する文字形状の評価を行い上記単語候補を絞
り込む第4のステップと、上記第4のステップで絞り込
まれた単語候補の候補文字の類似度を上記文字認識辞書
を用いて求める第5のステップと、言語情報辞書に格納
された単語の連接確率情報を参照して、上記第1のステ
ップで生成された候補文字及び上記第4のステップで絞
り込まれた単語候補による文字列候補の単語の連接確率
情報を求める第6のステップと、上記第2のステップ及
び上記第5のステップで求められた候補文字の類似度
と、上記第6のステップで求められた文字列候補の単語
の連接確率情報から最適な文字列を選択する第7のステ
ップとを備えたものである。
は、入力した文字列パタンから文字を構成する可能性が
ある文字矩形候補とそれに対応する文字矩形パタンを生
成する第1のステップと、上記第1のステップで生成さ
れた文字矩形候補を、文字の特徴データを格納した文字
認識辞書を用いて認識し、認識結果の候補文字とその類
似度を求める第2のステップと、上記第2のステップで
求められた候補文字から、単語情報を格納した単語辞書
の内容を参照して単語候補を検出する第3のステップ
と、文字形状辞書に格納された文字の形状情報と、上記
第1のステップで生成された文字矩形パタンを参照し
て、上記第3のステップで検出された単語候補を構成す
る文字に対する文字形状の評価を行い上記単語候補を絞
り込む第4のステップと、上記第4のステップで絞り込
まれた単語候補の候補文字の類似度を上記文字認識辞書
を用いて求める第5のステップと、言語情報辞書に格納
された単語の連接確率情報を参照して、上記第1のステ
ップで生成された候補文字及び上記第4のステップで絞
り込まれた単語候補による文字列候補の単語の連接確率
情報を求める第6のステップと、上記第2のステップ及
び上記第5のステップで求められた候補文字の類似度
と、上記第6のステップで求められた文字列候補の単語
の連接確率情報から最適な文字列を選択する第7のステ
ップとを備えたものである。
【0028】この発明に係るオンライン文字列認識方法
は、第3のステップにおいて、第2のステップで求めら
れた候補文字から、単語辞書の内容を参照して単語候補
を検出する際に、候補文字から構成される単語と一部不
一致の単語候補を含めて検出するものである。
は、第3のステップにおいて、第2のステップで求めら
れた候補文字から、単語辞書の内容を参照して単語候補
を検出する際に、候補文字から構成される単語と一部不
一致の単語候補を含めて検出するものである。
【0029】この発明に係るオンライン文字列認識方法
は、第7のステップにおいて、第2のステップ及び第5
のステップで求められた候補文字の類似度と、第6のス
テップで求められた文字列候補の単語の連接確率情報を
加算し、加算結果の最大値により最適な文字列を選択す
るものである。
は、第7のステップにおいて、第2のステップ及び第5
のステップで求められた候補文字の類似度と、第6のス
テップで求められた文字列候補の単語の連接確率情報を
加算し、加算結果の最大値により最適な文字列を選択す
るものである。
【0030】この発明に係るオンライン文字列認識方法
は、第4のステップにおいて、文字形状辞書に格納され
た文字の特徴的なストローク情報と、第1のステップで
生成された文字矩形パタンを参照して、第3のステップ
で検出された単語候補を構成する文字に対する文字形状
の評価を行い上記単語候補を絞り込むものである。
は、第4のステップにおいて、文字形状辞書に格納され
た文字の特徴的なストローク情報と、第1のステップで
生成された文字矩形パタンを参照して、第3のステップ
で検出された単語候補を構成する文字に対する文字形状
の評価を行い上記単語候補を絞り込むものである。
【0031】この発明に係るオンライン文字列認識方法
は、第4のステップにおいて、文字形状辞書に格納され
た文字のストローク情報における各ストロークと、第1
のステップで生成された文字矩形パタンを照合し、照合
できたストローク数の割合に基づき、第3のステップで
検出された単語候補を構成する文字に対する文字形状の
評価を行い上記単語候補を絞り込むものである。
は、第4のステップにおいて、文字形状辞書に格納され
た文字のストローク情報における各ストロークと、第1
のステップで生成された文字矩形パタンを照合し、照合
できたストローク数の割合に基づき、第3のステップで
検出された単語候補を構成する文字に対する文字形状の
評価を行い上記単語候補を絞り込むものである。
【0032】この発明に係るオンライン文字列認識方法
は、第4のステップにおいて、文字形状辞書に格納され
た文字の形状情報と、第1のステップで生成された文字
矩形パタンを参照して、第3のステップで検出された単
語候補を構成する文字に対する文字形状の評価を、上記
文字形状辞書に格納された文字の形状情報の重要度順に
行い、所定の単語候補数になった時点で文字形状の評価
を終了するものである。
は、第4のステップにおいて、文字形状辞書に格納され
た文字の形状情報と、第1のステップで生成された文字
矩形パタンを参照して、第3のステップで検出された単
語候補を構成する文字に対する文字形状の評価を、上記
文字形状辞書に格納された文字の形状情報の重要度順に
行い、所定の単語候補数になった時点で文字形状の評価
を終了するものである。
【0033】この発明に係るオンライン文字列認識方法
は、第4のステップにおいて、文字形状辞書に格納され
た文字の特徴的なストローク情報と、第1のステップで
生成された文字矩形パタンを参照して、第3のステップ
で検出された単語候補を構成する文字に対する文字形状
の評価を、上記文字形状辞書に格納された文字のストロ
ーク情報の重要度順に行い、所定の単語候補数になった
時点で文字形状の評価を終了するものである。
は、第4のステップにおいて、文字形状辞書に格納され
た文字の特徴的なストローク情報と、第1のステップで
生成された文字矩形パタンを参照して、第3のステップ
で検出された単語候補を構成する文字に対する文字形状
の評価を、上記文字形状辞書に格納された文字のストロ
ーク情報の重要度順に行い、所定の単語候補数になった
時点で文字形状の評価を終了するものである。
【0034】
【発明の実施の形態】以下、この発明の実施の一形態を
説明する。 実施の形態1.図1はこの発明の実施の形態1によるオ
ンライン文字列認識装置の構成を示すブロック図であ
る。図において、1は入力した文字列パタンから文字を
構成する可能性がある領域である文字矩形候補を生成す
る文字切出し手段、2は文字切出し手段1により生成さ
れた文字矩形候補に対応する文字矩形パタンを格納する
文字矩形パタン格納バッファ、3は文字の特徴データを
格納した文字認識辞書、4は文字切出し手段1により生
成された文字矩形候補を、文字認識辞書3を用いて認識
し、認識結果の候補文字とその類似度を求める個別文字
認識手段である。
説明する。 実施の形態1.図1はこの発明の実施の形態1によるオ
ンライン文字列認識装置の構成を示すブロック図であ
る。図において、1は入力した文字列パタンから文字を
構成する可能性がある領域である文字矩形候補を生成す
る文字切出し手段、2は文字切出し手段1により生成さ
れた文字矩形候補に対応する文字矩形パタンを格納する
文字矩形パタン格納バッファ、3は文字の特徴データを
格納した文字認識辞書、4は文字切出し手段1により生
成された文字矩形候補を、文字認識辞書3を用いて認識
し、認識結果の候補文字とその類似度を求める個別文字
認識手段である。
【0035】また、図1において、5は個別文字認識手
段4により求められた認識結果の候補文字とその類似度
を格納する候補文字ラティスバッファ、6は単語情報を
格納した単語辞書、7は候補文字ラティスバッファ5に
格納されている候補文字から、単語辞書6の内容を参照
して単語候補を検出し、後述の文字形状評価手段9によ
り絞り込まれた単語候補を候補文字ラティスバッファ5
に格納すると共に、絞り込まれた単語候補の候補文字の
類似度を個別文字認識手段4に求めさせて候補文字ラテ
ィスバッファ5に格納させる単語検出手段である。
段4により求められた認識結果の候補文字とその類似度
を格納する候補文字ラティスバッファ、6は単語情報を
格納した単語辞書、7は候補文字ラティスバッファ5に
格納されている候補文字から、単語辞書6の内容を参照
して単語候補を検出し、後述の文字形状評価手段9によ
り絞り込まれた単語候補を候補文字ラティスバッファ5
に格納すると共に、絞り込まれた単語候補の候補文字の
類似度を個別文字認識手段4に求めさせて候補文字ラテ
ィスバッファ5に格納させる単語検出手段である。
【0036】さらに、図1において、8は文字のストロ
ーク情報等の文字の形状情報を格納した文字形状辞書、
9は文字形状辞書8に格納された文字の形状情報と、文
字矩形パタン格納バッファ2に格納された文字矩形パタ
ンを参照して、単語検出手段7により検出された単語候
補を構成する文字に対する、筆記ストローク(筆記文字
の1画に相当する座標点列データ)等の文字形状の評価
を行い単語候補を絞り込む文字形状評価手段である。
ーク情報等の文字の形状情報を格納した文字形状辞書、
9は文字形状辞書8に格納された文字の形状情報と、文
字矩形パタン格納バッファ2に格納された文字矩形パタ
ンを参照して、単語検出手段7により検出された単語候
補を構成する文字に対する、筆記ストローク(筆記文字
の1画に相当する座標点列データ)等の文字形状の評価
を行い単語候補を絞り込む文字形状評価手段である。
【0037】さらに、図1において、10は単語の連接
確率情報を格納した言語情報辞書、11は言語情報辞書
10に格納された単語の連接確率情報を参照して、候補
文字ラティスバッファ5に格納された候補文字及び単語
候補による文字列候補の単語の連接確率情報を求めて、
候補文字ラティスバッファ5に格納する連接確率情報評
価手段、12は候補文字ラティスバッファ5に格納され
ている、候補文字の類似度と文字列候補の単語の連接確
率情報から最適な文字列を選択する最適候補選択手段で
ある。
確率情報を格納した言語情報辞書、11は言語情報辞書
10に格納された単語の連接確率情報を参照して、候補
文字ラティスバッファ5に格納された候補文字及び単語
候補による文字列候補の単語の連接確率情報を求めて、
候補文字ラティスバッファ5に格納する連接確率情報評
価手段、12は候補文字ラティスバッファ5に格納され
ている、候補文字の類似度と文字列候補の単語の連接確
率情報から最適な文字列を選択する最適候補選択手段で
ある。
【0038】図2はこの発明の実施の形態1によるオン
ライン文字列認識装置の処理を示すフローチャートで、
図3は文字形状評価手段9の処理を示すフローチャート
である。図4は文字切出し手段1に入力される文字列パ
タンの例を示す図で、図5は個別文字認識結果を格納し
た候補文字ラティスバッファ5の内容の例を示す図であ
り、図6は文字矩形パタン格納バッファ2の内容の例を
示す図である。図7は単語辞書6の例を示す図で、図8
は単語検出手段7による単語検出索結果の例を示す図で
ある。
ライン文字列認識装置の処理を示すフローチャートで、
図3は文字形状評価手段9の処理を示すフローチャート
である。図4は文字切出し手段1に入力される文字列パ
タンの例を示す図で、図5は個別文字認識結果を格納し
た候補文字ラティスバッファ5の内容の例を示す図であ
り、図6は文字矩形パタン格納バッファ2の内容の例を
示す図である。図7は単語辞書6の例を示す図で、図8
は単語検出手段7による単語検出索結果の例を示す図で
ある。
【0039】図9は文字形状辞書8の一例を示す図で、
図10、図11、図12は文字形状情報と文字矩形パタ
ンとの対応を示す図である。図13は更新後の候補文字
ラティスバッファ5の内容を示す図で、図14は言語情
報辞書10の例を示す図であり、図15は単語の連接確
率情報による評価結果を示す図である。
図10、図11、図12は文字形状情報と文字矩形パタ
ンとの対応を示す図である。図13は更新後の候補文字
ラティスバッファ5の内容を示す図で、図14は言語情
報辞書10の例を示す図であり、図15は単語の連接確
率情報による評価結果を示す図である。
【0040】次に動作について説明する。図2はこの発
明の実施の形態1によるオンライン文字列認識装置の処
理を示すフローチャートである。ステップS1におい
て、文字切出し手段1は、図4に示すような文字列パタ
ンを入力し、文字として成り立つ可能性のある文字矩形
候補を生成する。ここでは、例えば、入力した文字列の
筆跡データを縦方向に投影した際に、重なりがない部分
を文字の基本的な区切り(基本矩形)とし、さらに、基
本矩形を複数結合した矩形(結合矩形)を作成して文字
矩形候補とする。図5の下線で示した領域が文字矩形候
補の範囲を示している。また、文字切出し手段1は、図
6に示すように、各文字矩形候補に対応する文字パタン
のデータ(具体的には座標点列データ)を文字矩形パタ
ン格納バッファ2に格納する。
明の実施の形態1によるオンライン文字列認識装置の処
理を示すフローチャートである。ステップS1におい
て、文字切出し手段1は、図4に示すような文字列パタ
ンを入力し、文字として成り立つ可能性のある文字矩形
候補を生成する。ここでは、例えば、入力した文字列の
筆跡データを縦方向に投影した際に、重なりがない部分
を文字の基本的な区切り(基本矩形)とし、さらに、基
本矩形を複数結合した矩形(結合矩形)を作成して文字
矩形候補とする。図5の下線で示した領域が文字矩形候
補の範囲を示している。また、文字切出し手段1は、図
6に示すように、各文字矩形候補に対応する文字パタン
のデータ(具体的には座標点列データ)を文字矩形パタ
ン格納バッファ2に格納する。
【0041】図2のステップS2において、個別文字認
識手段4は、文字切出し手段1により生成された文字矩
形候補に対して、文字認識辞書3により個別文字認識処
理を行う。この個別文字認識処理は、例えば各文字毎に
予め大量の文字データから取得した平均的な文字パタン
の座標データ等の特徴値を文字認識辞書3に格納してお
き、文字矩形候補のデータから取得した特徴値との一致
度をもとに類似度を算出し、類似度の高い上位の文字を
文字認識結果の候補文字として出力する。そして、個別
文字認識手段4はこの結果を候補文字ラティスバッファ
5に格納する。
識手段4は、文字切出し手段1により生成された文字矩
形候補に対して、文字認識辞書3により個別文字認識処
理を行う。この個別文字認識処理は、例えば各文字毎に
予め大量の文字データから取得した平均的な文字パタン
の座標データ等の特徴値を文字認識辞書3に格納してお
き、文字矩形候補のデータから取得した特徴値との一致
度をもとに類似度を算出し、類似度の高い上位の文字を
文字認識結果の候補文字として出力する。そして、個別
文字認識手段4はこの結果を候補文字ラティスバッファ
5に格納する。
【0042】図5は個別文字認識結果を格納した候補文
字ラティスバッファ5の内容の例を示す図であり、下線
部の文字矩形候補に対して文字認識結果の複数の候補文
字と類似度が格納されている。例えば、最初の文字矩形
に対しては1位の認識結果が“文”で、類似度が0.9
等となっている。
字ラティスバッファ5の内容の例を示す図であり、下線
部の文字矩形候補に対して文字認識結果の複数の候補文
字と類似度が格納されている。例えば、最初の文字矩形
に対しては1位の認識結果が“文”で、類似度が0.9
等となっている。
【0043】図2のステップS3において、単語検出手
段7は候補文字ラティスバッファ5の候補文字の組合せ
から単語辞書6に存在する単語と一致するものを検出す
る。なお、単語辞書6には予め大量の日本語一般文章を
形態素解析して得られる複数の形態素を単語として格納
しておいても良いし、あるいは、文字列認識を行う対象
となる分野に特有の専門用語等を単語として格納してお
いても良い。図7は単語辞書6の内容の例を示す図であ
り、単語として“文庫”、“文法”等が格納されてい
る。
段7は候補文字ラティスバッファ5の候補文字の組合せ
から単語辞書6に存在する単語と一致するものを検出す
る。なお、単語辞書6には予め大量の日本語一般文章を
形態素解析して得られる複数の形態素を単語として格納
しておいても良いし、あるいは、文字列認識を行う対象
となる分野に特有の専門用語等を単語として格納してお
いても良い。図7は単語辞書6の内容の例を示す図であ
り、単語として“文庫”、“文法”等が格納されてい
る。
【0044】ここで、単語検出手段7は単語の一部不一
致を許して候補文字ラティスバッファ5のデータから単
語検出を行う。具体的には図5の1,2番目の文字矩形
に対する認識結果から“小包”の単語を検出するが、こ
の他に1番目の文字矩形の認識結果“文”に対して、一
文字だけ一致する単語も検出する。この例では、図7の
単語辞書6に存在する“文庫”、“文法”、“文字”を
検出する。なお、図5の後半の文字矩形からは“誤り”
の単語が検出されたとする。これにより、図8に示すよ
うな単語が検出される。単語検出手段7はこの結果を候
補文字ラティスバッファ5に格納する。
致を許して候補文字ラティスバッファ5のデータから単
語検出を行う。具体的には図5の1,2番目の文字矩形
に対する認識結果から“小包”の単語を検出するが、こ
の他に1番目の文字矩形の認識結果“文”に対して、一
文字だけ一致する単語も検出する。この例では、図7の
単語辞書6に存在する“文庫”、“文法”、“文字”を
検出する。なお、図5の後半の文字矩形からは“誤り”
の単語が検出されたとする。これにより、図8に示すよ
うな単語が検出される。単語検出手段7はこの結果を候
補文字ラティスバッファ5に格納する。
【0045】図2のステップS4において、文字形状評
価手段9は単語検出手段7で得られた単語候補に対し
て、文字形状辞書8の情報と、文字矩形パタン格納バッ
ファ2に格納された文字矩形のパタン情報から、図3に
示す処理を行い、文字形状が適切か否かの評価を行い単
語候補の絞り込みを行う。
価手段9は単語検出手段7で得られた単語候補に対し
て、文字形状辞書8の情報と、文字矩形パタン格納バッ
ファ2に格納された文字矩形のパタン情報から、図3に
示す処理を行い、文字形状が適切か否かの評価を行い単
語候補の絞り込みを行う。
【0046】図3のステップS41において、文字形状
評価手段9は単語検出手段7で得られた単語候補のう
ち、文字認識結果に含まれない文字に対する文字形状情
報を、文字形状辞書8から読み込む。具体的には、単語
候補のうち、“文庫”、“文法”、“文字”の3つの単
語における、“庫”、“法”、“字”が文字認識結果の
候補文字に含まれていないので、この3文字に対する文
字形状情報を文字形状辞書8から読み出す。
評価手段9は単語検出手段7で得られた単語候補のう
ち、文字認識結果に含まれない文字に対する文字形状情
報を、文字形状辞書8から読み込む。具体的には、単語
候補のうち、“文庫”、“文法”、“文字”の3つの単
語における、“庫”、“法”、“字”が文字認識結果の
候補文字に含まれていないので、この3文字に対する文
字形状情報を文字形状辞書8から読み出す。
【0047】図9は文字形状辞書8の例を示す図であ
る。この実施の形態では、文字形状情報として、各文字
について、その文字の特徴的なストローク情報(ストロ
ークの座標点列)を複数格納しておくものとする。な
お、このストローク情報は、予め大量の文字パタンから
安定して(頻度が高く)抽出できるストローク情報を上
位複数個選ぶ等して用意しておく。この実施の形態で
は、図9に示す“庫”、“法”、“字”に対するストロ
ーク情報ST1〜ST9を読み出す。なお、図ではわか
りやすくするためにストロークの形状を図示している
が、実際にはストロークの座標点列を格納した情報とな
っている。
る。この実施の形態では、文字形状情報として、各文字
について、その文字の特徴的なストローク情報(ストロ
ークの座標点列)を複数格納しておくものとする。な
お、このストローク情報は、予め大量の文字パタンから
安定して(頻度が高く)抽出できるストローク情報を上
位複数個選ぶ等して用意しておく。この実施の形態で
は、図9に示す“庫”、“法”、“字”に対するストロ
ーク情報ST1〜ST9を読み出す。なお、図ではわか
りやすくするためにストロークの形状を図示している
が、実際にはストロークの座標点列を格納した情報とな
っている。
【0048】図3のステップS42において、文字形状
評価手段9は、図3のステップS41で読み出した文字
形状情報と、文字矩形パタン格納バッファ2に格納され
た文字矩形のパタン情報とから文字形状の評価を行う。
具体的には、図6に示す文字矩形パタン21に対して、
図9のST1〜ST9のストロークが照合されるか否か
を評価する。まず、“庫”の文字形状情報であるST
1,ST2,ST3と文字矩形パタンとの照合を行う。
評価手段9は、図3のステップS41で読み出した文字
形状情報と、文字矩形パタン格納バッファ2に格納され
た文字矩形のパタン情報とから文字形状の評価を行う。
具体的には、図6に示す文字矩形パタン21に対して、
図9のST1〜ST9のストロークが照合されるか否か
を評価する。まず、“庫”の文字形状情報であるST
1,ST2,ST3と文字矩形パタンとの照合を行う。
【0049】筆記文字パタンから部分的なストローク情
報を照合させる方法は、例えば、特開2000−231
603号公報に示すように、始終点フリーのDPマッチ
ング法を用いて文字の筆記パタンからストローク形状に
相当する部分を探し出す方法等で実現できる。この実施
の形態では、図10に示すように、ストロークST1の
みが文字矩形パタンのPT1の部分に対応する。同様に
“法”の文字形状情報ST4,ST5,ST6に対する
照合の結果、ストロークST6のみが図11のPT2の
部分に対応する。同様に“字”の文字形状情報ST7,
ST8,ST9に対する照合の結果、それぞれストロー
クST7が図12のPT4へ、ストロークST8が図1
2のPT2へ、ストロークST9が図12のPT3へそ
れぞれ対応する。
報を照合させる方法は、例えば、特開2000−231
603号公報に示すように、始終点フリーのDPマッチ
ング法を用いて文字の筆記パタンからストローク形状に
相当する部分を探し出す方法等で実現できる。この実施
の形態では、図10に示すように、ストロークST1の
みが文字矩形パタンのPT1の部分に対応する。同様に
“法”の文字形状情報ST4,ST5,ST6に対する
照合の結果、ストロークST6のみが図11のPT2の
部分に対応する。同様に“字”の文字形状情報ST7,
ST8,ST9に対する照合の結果、それぞれストロー
クST7が図12のPT4へ、ストロークST8が図1
2のPT2へ、ストロークST9が図12のPT3へそ
れぞれ対応する。
【0050】ここで、文字形状評価手段9は、文字形状
情報のうち照合できたストローク数の割合に基づいて文
字の評価値を求める。すなわち、“庫”に対する評価値
は1/3、“法”に対する評価値は1/3、“字”に対
する評価値は3/3とする。
情報のうち照合できたストローク数の割合に基づいて文
字の評価値を求める。すなわち、“庫”に対する評価値
は1/3、“法”に対する評価値は1/3、“字”に対
する評価値は3/3とする。
【0051】図3のステップS43において、文字形状
評価手段9は、文字形状情報による評価結果のうち、一
定の評価値以下となる単語を単語候補から削除する。こ
こでは、評価値1/2未満、すなわち、文字形状情報の
うち半数未満しか照合されなかった単語を削除する。こ
の結果、文字形状評価手段9は、“文庫”、“文法”を
単語候補から削除し、“文字”のみを単語候補として選
択する。
評価手段9は、文字形状情報による評価結果のうち、一
定の評価値以下となる単語を単語候補から削除する。こ
こでは、評価値1/2未満、すなわち、文字形状情報の
うち半数未満しか照合されなかった単語を削除する。こ
の結果、文字形状評価手段9は、“文庫”、“文法”を
単語候補から削除し、“文字”のみを単語候補として選
択する。
【0052】ここで、単語検出手段7は単語候補として
選択された単語の中で、文字認識結果の候補文字に含ま
れない文字、すなわち“字”の文字認識類似度を、個別
文字認識手段4に認識させて候補文字ラティスバッファ
5に格納させる。具体的には、単語検出手段7が個別文
字認識手段4に指示し、図6の文字矩形パタン21と文
字コード“字”から、認識結果が“字”となる場合の類
似度を求めさせて、これを候補文字ラティスバッファ5
に格納させる。ここでは、図6の文字矩形パタン21に
対する文字認識結果の“字”に対する類似度は0.4で
あったとすると、候補文字ラティスバッファ5の内容は
図13に示すように更新される。
選択された単語の中で、文字認識結果の候補文字に含ま
れない文字、すなわち“字”の文字認識類似度を、個別
文字認識手段4に認識させて候補文字ラティスバッファ
5に格納させる。具体的には、単語検出手段7が個別文
字認識手段4に指示し、図6の文字矩形パタン21と文
字コード“字”から、認識結果が“字”となる場合の類
似度を求めさせて、これを候補文字ラティスバッファ5
に格納させる。ここでは、図6の文字矩形パタン21に
対する文字認識結果の“字”に対する類似度は0.4で
あったとすると、候補文字ラティスバッファ5の内容は
図13に示すように更新される。
【0053】図2のステップS5において、連接確率情
報評価手段11は、単語の連接確率情報を格納した言語
情報辞書10を用いて、文字列候補に対する単語の連接
確率情報の評価を行う。図14は言語情報辞書10の例
を示したものであり、例えば、“小包”、“誤り”の連
接確率情報は0.1、“文字”、“誤り”の連接確率情
報は0.8等の情報が格納されている。
報評価手段11は、単語の連接確率情報を格納した言語
情報辞書10を用いて、文字列候補に対する単語の連接
確率情報の評価を行う。図14は言語情報辞書10の例
を示したものであり、例えば、“小包”、“誤り”の連
接確率情報は0.1、“文字”、“誤り”の連接確率情
報は0.8等の情報が格納されている。
【0054】連接確率情報評価手段11は、文字列候補
に対するそれぞれの単語の連接確率情報を候補文字ラテ
ィスバッファ5に格納する。図15は文字列候補に対す
る単語の連接確率情報を格納した後の候補文字ラティス
バッファ5の内容を示す図である。ただし、文字認識結
果は省略している。
に対するそれぞれの単語の連接確率情報を候補文字ラテ
ィスバッファ5に格納する。図15は文字列候補に対す
る単語の連接確率情報を格納した後の候補文字ラティス
バッファ5の内容を示す図である。ただし、文字認識結
果は省略している。
【0055】図2のステップS6において、最適候補選
択手段12は候補文字ラティスバッファ5のデータを用
いて最適な文字列を選択する。具体的には、各文字列候
補の文字認識結果の類似度、及び連接確率情報の値を用
いて文字列としての評価値を求め、最も評価値の高いも
のを最適な文字列として選択する。
択手段12は候補文字ラティスバッファ5のデータを用
いて最適な文字列を選択する。具体的には、各文字列候
補の文字認識結果の類似度、及び連接確率情報の値を用
いて文字列としての評価値を求め、最も評価値の高いも
のを最適な文字列として選択する。
【0056】ここでは、文字列候補の評価値は、文字認
識結果の各類似度と連接確率情報の評価値を加算したも
のを用いる。すなわち、“小包”、“誤り”に対して
は、“小包”の各文字認識類似度が(0.6,0.
7)、“誤り”の各文字認識類似度が(0.9,0.
9)、“小包”、“誤り”の連接確率情報は(0.1)
であることから、“小包誤り”の文字列の評価値は、 0.6+0.7+0.9+0.9+0.1=3.2 となる。同様に“文字誤り”の文字列に対する評価値
は、 0.9+0.4+0.9+0.9+0.8=3.9 となる。
識結果の各類似度と連接確率情報の評価値を加算したも
のを用いる。すなわち、“小包”、“誤り”に対して
は、“小包”の各文字認識類似度が(0.6,0.
7)、“誤り”の各文字認識類似度が(0.9,0.
9)、“小包”、“誤り”の連接確率情報は(0.1)
であることから、“小包誤り”の文字列の評価値は、 0.6+0.7+0.9+0.9+0.1=3.2 となる。同様に“文字誤り”の文字列に対する評価値
は、 0.9+0.4+0.9+0.9+0.8=3.9 となる。
【0057】最適候補選択手段12は以上の評価値をも
とに、最適な文字列は“文字誤り”(評価値3.9)で
あると判定する。
とに、最適な文字列は“文字誤り”(評価値3.9)で
あると判定する。
【0058】なお、この実施の形態では、文字認識の類
似度と連接確率情報の評価値を加算しているが、両者の
重み付け加算値を評価値としても良い。また、文字認識
の類似度を加算する場合は、全文字矩形の数で割って正
規化した値としても良い。具体的には“小包”は文字矩
形2個から成り立っているので、“小包”の文字認識類
似度は、 (0.6+0.7)/2=0.65 等となる。
似度と連接確率情報の評価値を加算しているが、両者の
重み付け加算値を評価値としても良い。また、文字認識
の類似度を加算する場合は、全文字矩形の数で割って正
規化した値としても良い。具体的には“小包”は文字矩
形2個から成り立っているので、“小包”の文字認識類
似度は、 (0.6+0.7)/2=0.65 等となる。
【0059】以上のように、この実施の形態1によれ
ば、文字列認識において、文字認識結果の候補文字に正
解文字が含まれない場合に、一部不一致を許して単語を
検出することで、正しい単語候補を求めるが、このと
き、文字形状評価手段9が、認識候補文字にない文字に
関しては文字形状情報を用いて文字の評価を行い、不適
切な単語候補を削除することにより、筆記文字とかけ離
れた文字列認識結果となるのを防ぐことができ、最終的
な文字列認識精度を向上することができるという効果が
得られる。
ば、文字列認識において、文字認識結果の候補文字に正
解文字が含まれない場合に、一部不一致を許して単語を
検出することで、正しい単語候補を求めるが、このと
き、文字形状評価手段9が、認識候補文字にない文字に
関しては文字形状情報を用いて文字の評価を行い、不適
切な単語候補を削除することにより、筆記文字とかけ離
れた文字列認識結果となるのを防ぐことができ、最終的
な文字列認識精度を向上することができるという効果が
得られる。
【0060】また、この実施の形態では、文字形状評価
手段9が、文字形状情報としてその文字の特徴的なスト
ローク情報を用いることにより、少量の文字形状情報に
より効果的に筆記文字の評価を行うことができ、さら
に、その文字に特徴的なストローク情報のみを、部分的
に筆記パタンと照合するため、乱雑に書かれた文字であ
っても、特徴的なストロークに相当する部分が筆記され
ていれば文字形状の評価を行うことができるため、最終
的な文字列認識精度を向上することができるという効果
が得られる。
手段9が、文字形状情報としてその文字の特徴的なスト
ローク情報を用いることにより、少量の文字形状情報に
より効果的に筆記文字の評価を行うことができ、さら
に、その文字に特徴的なストローク情報のみを、部分的
に筆記パタンと照合するため、乱雑に書かれた文字であ
っても、特徴的なストロークに相当する部分が筆記され
ていれば文字形状の評価を行うことができるため、最終
的な文字列認識精度を向上することができるという効果
が得られる。
【0061】さらに、この実施の形態では、文字形状評
価手段9が、文字形状評価結果に応じて、単語候補を適
切なものに絞り込むため、その後の文字列認識処理にお
ける計算量を削減することができるという効果が得られ
る。
価手段9が、文字形状評価結果に応じて、単語候補を適
切なものに絞り込むため、その後の文字列認識処理にお
ける計算量を削減することができるという効果が得られ
る。
【0062】実施の形態2.図16はこの発明の実施の
形態2によるオンライン文字列認識装置の構成を示すブ
ロック図である。図において、実施の形態1の図1と同
じ構成要素には同番号を付与し、詳しい説明は省略す
る。図16において、13は文字形状情報としての文字
の特徴的なストローク情報とその重要度を格納する重要
度付き文字形状辞書である。
形態2によるオンライン文字列認識装置の構成を示すブ
ロック図である。図において、実施の形態1の図1と同
じ構成要素には同番号を付与し、詳しい説明は省略す
る。図16において、13は文字形状情報としての文字
の特徴的なストローク情報とその重要度を格納する重要
度付き文字形状辞書である。
【0063】また、図16において、14は重要度付き
文字形状辞書13に格納された文字のストローク情報
と、文字矩形パタン格納バッファ2に格納された文字矩
形パタンを参照して、単語検出手段7により検出された
単語候補を構成する文字に対する文字形状の評価を、重
要度付き文字形状辞書13に格納された文字のストロー
ク情報の重要度順に行い、所定の単語候補数になった時
点で文字形状の評価を終了する文字形状評価手段であ
る。
文字形状辞書13に格納された文字のストローク情報
と、文字矩形パタン格納バッファ2に格納された文字矩
形パタンを参照して、単語検出手段7により検出された
単語候補を構成する文字に対する文字形状の評価を、重
要度付き文字形状辞書13に格納された文字のストロー
ク情報の重要度順に行い、所定の単語候補数になった時
点で文字形状の評価を終了する文字形状評価手段であ
る。
【0064】次に動作について説明する。図17はこの
発明の実施の形態2によるオンライン文字列認識装置の
処理を示すフローチャートである。なお、図17のステ
ップS1〜ステップS3、ステップS5,S6は実施の
形態1の図2と同様な処理を行うため、以下では詳細な
説明を省略する。ステップS1において、実施の形態1
と同様に、図4に示す文字列が入力され、文字切出し手
段1は入力パタンから文字矩形候補を生成する。
発明の実施の形態2によるオンライン文字列認識装置の
処理を示すフローチャートである。なお、図17のステ
ップS1〜ステップS3、ステップS5,S6は実施の
形態1の図2と同様な処理を行うため、以下では詳細な
説明を省略する。ステップS1において、実施の形態1
と同様に、図4に示す文字列が入力され、文字切出し手
段1は入力パタンから文字矩形候補を生成する。
【0065】ステップS2において、個別文字認識手段
4は文字矩形候補に対して文字認識処理を行い、結果を
候補文字ラティスバッファ5に格納する。ステップS3
において、単語検出手段7は候補文字ラティスバッファ
5の内容から単語を検出する。ここでは、実施の形態1
と同様に図8に示す単語候補が検出されたとする。
4は文字矩形候補に対して文字認識処理を行い、結果を
候補文字ラティスバッファ5に格納する。ステップS3
において、単語検出手段7は候補文字ラティスバッファ
5の内容から単語を検出する。ここでは、実施の形態1
と同様に図8に示す単語候補が検出されたとする。
【0066】ステップS7において、文字形状評価手段
14は重要度付き文字形状辞書13の内容を参照して単
語検出手段7で得られた単語候補の絞り込みを行う。以
下、具体的な処理内容を説明する。図18は重要度付き
文字形状辞書13の例を示す図である。図18におい
て、A,B,Cは重要度(A>B>C)を表しており、
各文字の文字形状情報(この実施の形態ではストローク
情報)が、重要度の高いものから順に格納されている。
なお、重要度は予め人手により設定しても良いし、ま
た、大量の文字パタンからストローク情報を抽出した際
に、最も安定して(頻度が高く)抽出できたものから順
に重要度を設定しても良い。
14は重要度付き文字形状辞書13の内容を参照して単
語検出手段7で得られた単語候補の絞り込みを行う。以
下、具体的な処理内容を説明する。図18は重要度付き
文字形状辞書13の例を示す図である。図18におい
て、A,B,Cは重要度(A>B>C)を表しており、
各文字の文字形状情報(この実施の形態ではストローク
情報)が、重要度の高いものから順に格納されている。
なお、重要度は予め人手により設定しても良いし、ま
た、大量の文字パタンからストローク情報を抽出した際
に、最も安定して(頻度が高く)抽出できたものから順
に重要度を設定しても良い。
【0067】文字形状評価手段14は実施の形態1と同
様にして、重要度付き文字形状辞書13から文字の形状
情報を読み込む。この際、重要度の高い順に形状情報を
読み込む。すなわち、この実施の形態の場合には、文字
形状評価手段14は、まず、ストローク情報ST1、S
T4、ST7を読み込む。
様にして、重要度付き文字形状辞書13から文字の形状
情報を読み込む。この際、重要度の高い順に形状情報を
読み込む。すなわち、この実施の形態の場合には、文字
形状評価手段14は、まず、ストローク情報ST1、S
T4、ST7を読み込む。
【0068】次に、文字形状評価手段14は、実施の形
態1と同様にして、文字矩形パタン格納バッファ2に格
納された図6の文字矩形パタン21からストローク情報
に相当する部分の照合を行う。この実施の形態の場合
も、実施の形態1と同様に、ストロークST1には図1
0のPT1が対応し、ストロークST7には図12のP
T4が対応するが、ストロークST4に対応する部分
は、図11に示すように、検出されない。ここで、文字
形状評価手段14は重要度Aのストローク情報が照合で
きなかった“法”を含む単語“文法”を単語候補から削
除する。
態1と同様にして、文字矩形パタン格納バッファ2に格
納された図6の文字矩形パタン21からストローク情報
に相当する部分の照合を行う。この実施の形態の場合
も、実施の形態1と同様に、ストロークST1には図1
0のPT1が対応し、ストロークST7には図12のP
T4が対応するが、ストロークST4に対応する部分
は、図11に示すように、検出されない。ここで、文字
形状評価手段14は重要度Aのストローク情報が照合で
きなかった“法”を含む単語“文法”を単語候補から削
除する。
【0069】図17のステップS8において、文字形状
評価手段14は、絞り込んだ単語候補数を予め定めた所
定の単語候補数と比較する。この実施の形態では、絞り
込む所定の単語候補数を1とすると、現在選択されてい
る単語候補数2(“文庫”と“文字”)は、所定の単語
候補数1より大きいためステップS8でNoとなり、ス
テップS7へ戻る。
評価手段14は、絞り込んだ単語候補数を予め定めた所
定の単語候補数と比較する。この実施の形態では、絞り
込む所定の単語候補数を1とすると、現在選択されてい
る単語候補数2(“文庫”と“文字”)は、所定の単語
候補数1より大きいためステップS8でNoとなり、ス
テップS7へ戻る。
【0070】文字形状評価手段14は、重要度付き文字
形状辞書13から次に重要度Bのストローク情報を読み
出し、先ほどと同様に文字矩形パタンとの照合を行う。
すなわち、図6の文字矩形パタン21からストローク情
報ST2とストローク情報ST8に相当する部分の照合
を行う。
形状辞書13から次に重要度Bのストローク情報を読み
出し、先ほどと同様に文字矩形パタンとの照合を行う。
すなわち、図6の文字矩形パタン21からストローク情
報ST2とストローク情報ST8に相当する部分の照合
を行う。
【0071】この実施の形態の場合、図10に示すよう
に、ストロークST2に対応する部分はない。これに対
して、ストロークST8は図12のPT2に対応する。
従って文字形状評価手段14は単語候補から“文庫”を
削除する。
に、ストロークST2に対応する部分はない。これに対
して、ストロークST8は図12のPT2に対応する。
従って文字形状評価手段14は単語候補から“文庫”を
削除する。
【0072】図17のステップS8において、文字形状
評価手段14は絞り込んだ単語候補数1と予め定めた所
定の単語候補数1を比較する。ここで、絞り込んだ単語
候補数が予め定めた所定の単語候補数以下であるため、
ステップS8でYesとなりステップS5へ進む。な
お、このとき単語検出手段7は文字形状評価手段14で
絞り込まれた“文字”の単語に対する文字コード“字”
の類似度を、実施の形態1と同様にして、個別文字認識
手段4に求めさせて候補文字ラティスバッファ5に格納
させる。
評価手段14は絞り込んだ単語候補数1と予め定めた所
定の単語候補数1を比較する。ここで、絞り込んだ単語
候補数が予め定めた所定の単語候補数以下であるため、
ステップS8でYesとなりステップS5へ進む。な
お、このとき単語検出手段7は文字形状評価手段14で
絞り込まれた“文字”の単語に対する文字コード“字”
の類似度を、実施の形態1と同様にして、個別文字認識
手段4に求めさせて候補文字ラティスバッファ5に格納
させる。
【0073】図17のステップS5において、連接確率
情報評価手段11は単語の連接確率情報を格納した言語
情報辞書10を用いて文字列候補の単語の連接確率情報
の評価を行い、その結果を候補文字ラティスバッファ5
に格納する。この結果、実施の形態1と同様にして、図
13の情報が候補文字ラティスバッファ5に格納され
る。
情報評価手段11は単語の連接確率情報を格納した言語
情報辞書10を用いて文字列候補の単語の連接確率情報
の評価を行い、その結果を候補文字ラティスバッファ5
に格納する。この結果、実施の形態1と同様にして、図
13の情報が候補文字ラティスバッファ5に格納され
る。
【0074】図17のステップS6において、最適候補
選択手段12は、実施の形態1と同様にして、候補文字
ラティスバッファ5のデータを用いて最適な文字列“文
字誤り”を選択する。
選択手段12は、実施の形態1と同様にして、候補文字
ラティスバッファ5のデータを用いて最適な文字列“文
字誤り”を選択する。
【0075】以上のように、この実施の形態2によれ
ば、重要度の高い文字形状情報を使って文字評価を行う
ので、乱雑に筆記された文字に対しても適切な文字形状
評価を行うことができ、最終的な文字列認識精度を向上
することができるという効果が得られる。
ば、重要度の高い文字形状情報を使って文字評価を行う
ので、乱雑に筆記された文字に対しても適切な文字形状
評価を行うことができ、最終的な文字列認識精度を向上
することができるという効果が得られる。
【0076】また、この実施の形態2によれば、文字形
状評価手段14が、重要度順に文字形状情報による評価
を行い、単語候補数が予め定めた所定の絞り込み数にな
った時点で処理を終了するため、全ての文字形状情報を
使わずに不適切な単語を削除することが可能となり、処
理時間の短縮が可能となるという効果が得られる。
状評価手段14が、重要度順に文字形状情報による評価
を行い、単語候補数が予め定めた所定の絞り込み数にな
った時点で処理を終了するため、全ての文字形状情報を
使わずに不適切な単語を削除することが可能となり、処
理時間の短縮が可能となるという効果が得られる。
【0077】
【発明の効果】以上のように、この発明によれば、認識
候補文字に関して文字形状情報を用いて文字の評価を行
い、不適切な単語候補を削除することにより、筆記文字
とかけ離れた文字列認識結果となるのを防ぐことがで
き、最終的な文字列認識精度を向上することができると
いう効果が得られる。
候補文字に関して文字形状情報を用いて文字の評価を行
い、不適切な単語候補を削除することにより、筆記文字
とかけ離れた文字列認識結果となるのを防ぐことがで
き、最終的な文字列認識精度を向上することができると
いう効果が得られる。
【図1】 この発明の実施の形態1によるオンライン文
字列認識装置の構成を示すブロック図である。
字列認識装置の構成を示すブロック図である。
【図2】 この発明の実施の形態1によるオンライン文
字列認識装置の処理を示すフローチャートである。
字列認識装置の処理を示すフローチャートである。
【図3】 この発明の実施の形態1による文字形状評価
手段の処理を示すフローチャートである。
手段の処理を示すフローチャートである。
【図4】 この発明の実施の形態1による文字切出し手
段に入力される文字列パタンの例を示す図である。
段に入力される文字列パタンの例を示す図である。
【図5】 この発明の実施の形態1による個別文字認識
結果を格納した候補文字ラティスバッファの内容の例を
示す図である。
結果を格納した候補文字ラティスバッファの内容の例を
示す図である。
【図6】 この発明の実施の形態1による文字矩形パタ
ン格納バッファの内容の例を示す図である。
ン格納バッファの内容の例を示す図である。
【図7】 この発明の実施の形態1による単語辞書の例
を示す図である。
を示す図である。
【図8】 この発明の実施の形態1による単語検出手段
による単語検出索結果の例を示す図である。
による単語検出索結果の例を示す図である。
【図9】 この発明の実施の形態1による文字形状辞書
の例を示す図である。
の例を示す図である。
【図10】 この発明の実施の形態1による文字形状情
報と文字矩形パタンとの対応を示す図である。
報と文字矩形パタンとの対応を示す図である。
【図11】 この発明の実施の形態1による文字形状情
報と文字矩形パタンとの対応を示す図である。
報と文字矩形パタンとの対応を示す図である。
【図12】 この発明の実施の形態1による文字形状情
報と文字矩形パタンとの対応を示す図である。
報と文字矩形パタンとの対応を示す図である。
【図13】 この発明の実施の形態1による更新後の候
補文字ラティスバッファの内容を示す図である。
補文字ラティスバッファの内容を示す図である。
【図14】 この発明の実施の形態1による言語情報辞
書の例を示す図である。
書の例を示す図である。
【図15】 この発明の実施の形態1による単語の連接
確率情報による評価結果を示す図である。
確率情報による評価結果を示す図である。
【図16】 この発明の実施の形態2によるオンライン
文字列認識装置の構成を示すブロック図である。
文字列認識装置の構成を示すブロック図である。
【図17】 この発明の実施の形態2によるオンライン
文字列認識装置の処理を示すフローチャートである。
文字列認識装置の処理を示すフローチャートである。
【図18】 この発明の実施の形態2による重要度付き
文字形状辞書の例を示す図である。
文字形状辞書の例を示す図である。
【図19】 従来のオンライン文字列認識装置の構成を
示すブロック図である。
示すブロック図である。
【図20】 従来のオンライン文字列認識装置の構成を
示すブロック図である。
示すブロック図である。
1 文字切出し手段、2 文字矩形パタン格納バッフ
ァ、3 文字認識辞書、4 個別文字認識手段、5 候
補文字ラティスバッファ、6 単語辞書、7 単語検出
手段、8 文字形状辞書、9 文字形状評価手段、10
言語情報辞書、11 連接確率情報評価手段、12
最適候補選択手段、13 重要度付き文字形状辞書、1
4 文字形状評価手段。
ァ、3 文字認識辞書、4 個別文字認識手段、5 候
補文字ラティスバッファ、6 単語辞書、7 単語検出
手段、8 文字形状辞書、9 文字形状評価手段、10
言語情報辞書、11 連接確率情報評価手段、12
最適候補選択手段、13 重要度付き文字形状辞書、1
4 文字形状評価手段。
Claims (14)
- 【請求項1】 入力した文字列パタンから文字を構成す
る可能性がある文字矩形候補を生成する文字切出し手段
と、 上記文字切出し手段により生成された文字矩形候補に対
応する文字矩形パタンを格納する文字矩形パタン格納バ
ッファと、 文字の特徴データを格納した文字認識辞書と、 上記文字切出し手段により生成された文字矩形候補を、
上記文字認識辞書を用いて認識し、認識結果の候補文字
とその類似度を求める個別文字認識手段と、 上記個別文字認識手段により求められた認識結果の候補
文字とその類似度を格納する候補文字ラティスバッファ
と、 単語情報を格納した単語辞書と、 上記候補文字ラティスバッファに格納されている候補文
字から、上記単語辞書の内容を参照して単語候補を検出
し、後述の文字形状評価手段により絞り込まれた単語候
補を上記候補文字ラティスバッファに格納すると共に、
絞り込まれた単語候補の候補文字の類似度を上記個別文
字認識手段に求めさせて上記候補文字ラティスバッファ
に格納させる単語検出手段と、 文字の形状情報を格納した文字形状辞書と、 上記文字形状辞書に格納された文字の形状情報と、上記
文字矩形パタン格納バッファに格納された文字矩形パタ
ンを参照して、上記単語検出手段により検出された単語
候補を構成する文字に対する文字形状の評価を行い上記
単語候補を絞り込む文字形状評価手段と、 単語の連接確率情報を格納した言語情報辞書と、 上記言語情報辞書に格納された単語の連接確率情報を参
照して、上記候補文字ラティスバッファに格納された候
補文字及び単語候補による文字列候補の単語の連接確率
情報を求めて、上記候補文字ラティスバッファに格納す
る連接確率情報評価手段と、 上記候補文字ラティスバッファに格納されている、候補
文字の類似度と文字列候補の単語の連接確率情報から最
適な文字列を選択する最適候補選択手段とを備えたこと
を特徴とするオンライン文字列認識装置。 - 【請求項2】 単語検出手段が、候補文字ラティスバッ
ファに格納されている候補文字から、単語辞書の内容を
参照して単語候補を検出する際に、候補文字から構成さ
れる単語と一部不一致の単語候補を含めて検出すること
を特徴とする請求項1記載のオンライン文字列認識装
置。 - 【請求項3】 最適候補選択手段が、候補文字ラティス
バッファに格納されている候補文字の類似度と文字列候
補の単語の連接確率情報を加算し、加算結果の最大値に
より最適な文字列を選択することを特徴とする請求項1
記載のオンライン文字列認識装置。 - 【請求項4】 文字形状辞書が、文字の形状情報とし
て、その文字の特徴的なストローク情報を格納し、 文字形状評価手段が、上記文字形状辞書に格納された文
字のストローク情報と、文字矩形パタン格納バッファに
格納された文字矩形パタンを参照して、単語検出手段に
より検出された単語候補を構成する文字に対する文字形
状の評価を行い上記単語候補を絞り込むことを特徴とす
る請求項1記載のオンライン文字列認識装置。 - 【請求項5】 文字形状評価手段が、文字形状辞書に格
納された文字のストローク情報における各ストローク
と、文字矩形パタン格納バッファに格納された文字矩形
パタンを照合し、照合できたストローク数の割合に基づ
き、単語検出手段により検出された単語候補を構成する
文字に対する文字形状の評価を行い上記単語候補を絞り
込むことを特徴とする請求項4記載のオンライン文字列
認識装置。 - 【請求項6】 文字形状辞書が文字の形状情報とその重
要度を格納し、 文字形状評価手段が、上記文字形状辞書に格納された文
字の形状情報と、文字矩形パタン格納バッファに格納さ
れた文字矩形パタンを参照して、単語検出手段により検
出された単語候補を構成する文字に対する文字形状の評
価を、上記文字形状辞書に格納された文字の形状情報の
重要度順に行い、所定の単語候補数になった時点で文字
形状の評価を終了することを特徴とする請求項1記載の
オンライン文字列認識装置。 - 【請求項7】 文字形状辞書が、文字の形状情報として
の文字の特徴的なストローク情報とその重要度を格納
し、 文字形状評価手段が、上記文字形状辞書に格納された文
字のストローク情報と、文字矩形パタン格納バッファに
格納された文字矩形パタンを参照して、単語検出手段に
より検出された単語候補を構成する文字に対する文字形
状の評価を、上記文字形状辞書に格納された文字のスト
ローク情報の重要度順に行い、所定の単語候補数になっ
た時点で文字形状の評価を終了することを特徴とする請
求項6記載のオンライン文字列認識装置。 - 【請求項8】 入力した文字列パタンから文字を構成す
る可能性がある文字矩形候補とそれに対応する文字矩形
パタンを生成する第1のステップと、 上記第1のステップで生成された文字矩形候補を、文字
の特徴データを格納した文字認識辞書を用いて認識し、
認識結果の候補文字とその類似度を求める第2のステッ
プと、 上記第2のステップで求められた候補文字から、単語情
報を格納した単語辞書の内容を参照して単語候補を検出
する第3のステップと、 文字形状辞書に格納された文字の形状情報と、上記第1
のステップで生成された文字矩形パタンを参照して、上
記第3のステップで検出された単語候補を構成する文字
に対する文字形状の評価を行い上記単語候補を絞り込む
第4のステップと、 上記第4のステップで絞り込まれた単語候補の候補文字
の類似度を上記文字認識辞書を用いて求める第5のステ
ップと、 言語情報辞書に格納された単語の連接確率情報を参照し
て、上記第1のステップで生成された候補文字及び上記
第4のステップで絞り込まれた単語候補による文字列候
補の単語の連接確率情報を求める第6のステップと、 上記第2のステップ及び上記第5のステップで求められ
た候補文字の類似度と、上記第6のステップで求められ
た文字列候補の単語の連接確率情報から最適な文字列を
選択する第7のステップとを備えたことを特徴とするオ
ンライン文字列認識方法。 - 【請求項9】 第3のステップにおいて、第2のステッ
プで求められた候補文字から、単語辞書の内容を参照し
て単語候補を検出する際に、候補文字から構成される単
語と一部不一致の単語候補を含めて検出することを特徴
とする請求項8記載のオンライン文字列認識方法。 - 【請求項10】 第7のステップにおいて、第2のステ
ップ及び第5のステップで求められた候補文字の類似度
と、第6のステップで求められた文字列候補の単語の連
接確率情報を加算し、加算結果の最大値により最適な文
字列を選択することを特徴とする請求項8記載のオンラ
イン文字列認識方法。 - 【請求項11】 第4のステップにおいて、文字形状辞
書に格納された文字の特徴的なストローク情報と、第1
のステップで生成された文字矩形パタンを参照して、第
3のステップで検出された単語候補を構成する文字に対
する文字形状の評価を行い上記単語候補を絞り込むこと
を特徴とする請求項8記載のオンライン文字列認識方
法。 - 【請求項12】 第4のステップにおいて、文字形状辞
書に格納された文字のストローク情報における各ストロ
ークと、第1のステップで生成された文字矩形パタンを
照合し、照合できたストローク数の割合に基づき、第3
のステップで検出された単語候補を構成する文字に対す
る文字形状の評価を行い上記単語候補を絞り込むことを
特徴とする請求項11記載のオンライン文字列認識方
法。 - 【請求項13】 第4のステップにおいて、文字形状辞
書に格納された文字の形状情報と、第1のステップで生
成された文字矩形パタンを参照して、第3のステップで
検出された単語候補を構成する文字に対する文字形状の
評価を、上記文字形状辞書に格納された文字の形状情報
の重要度順に行い、所定の単語候補数になった時点で文
字形状の評価を終了することを特徴とする請求項8記載
のオンライン文字列認識方法。 - 【請求項14】 第4のステップにおいて、文字形状辞
書に格納された文字の特徴的なストローク情報と、第1
のステップで生成された文字矩形パタンを参照して、第
3のステップで検出された単語候補を構成する文字に対
する文字形状の評価を、上記文字形状辞書に格納された
文字のストローク情報の重要度順に行い、所定の単語候
補数になった時点で文字形状の評価を終了することを特
徴とする請求項13記載のオンライン文字列認識方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2001050900A JP2002259912A (ja) | 2001-02-26 | 2001-02-26 | オンライン文字列認識装置及びオンライン文字列認識方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2001050900A JP2002259912A (ja) | 2001-02-26 | 2001-02-26 | オンライン文字列認識装置及びオンライン文字列認識方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2002259912A true JP2002259912A (ja) | 2002-09-13 |
Family
ID=18911788
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2001050900A Pending JP2002259912A (ja) | 2001-02-26 | 2001-02-26 | オンライン文字列認識装置及びオンライン文字列認識方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2002259912A (ja) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2007094078A1 (ja) * | 2006-02-14 | 2007-08-23 | Hitachi, Ltd. | 文字列検索方法およびその装置 |
JP2008186056A (ja) * | 2007-01-26 | 2008-08-14 | Mitsubishi Electric Corp | 手書き文字入力装置および手書き文字入力プログラム |
JP2009276709A (ja) * | 2008-05-19 | 2009-11-26 | Fujitsu Ltd | 学習支援システム、プログラムおよび学習支援方法 |
WO2014051015A1 (en) | 2012-09-26 | 2014-04-03 | Kabushiki Kaisha Toshiba | Character recognition apparatus, method and program |
WO2014174665A1 (ja) * | 2013-04-26 | 2014-10-30 | 株式会社 東芝 | システムおよび筆跡検索方法 |
-
2001
- 2001-02-26 JP JP2001050900A patent/JP2002259912A/ja active Pending
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2007094078A1 (ja) * | 2006-02-14 | 2007-08-23 | Hitachi, Ltd. | 文字列検索方法およびその装置 |
JPWO2007094078A1 (ja) * | 2006-02-14 | 2009-07-02 | 株式会社日立製作所 | 文字列検索方法およびその装置 |
JP4649512B2 (ja) * | 2006-02-14 | 2011-03-09 | 株式会社日立製作所 | 文字列検索方法およびその装置 |
JP2008186056A (ja) * | 2007-01-26 | 2008-08-14 | Mitsubishi Electric Corp | 手書き文字入力装置および手書き文字入力プログラム |
JP2009276709A (ja) * | 2008-05-19 | 2009-11-26 | Fujitsu Ltd | 学習支援システム、プログラムおよび学習支援方法 |
WO2014051015A1 (en) | 2012-09-26 | 2014-04-03 | Kabushiki Kaisha Toshiba | Character recognition apparatus, method and program |
WO2014174665A1 (ja) * | 2013-04-26 | 2014-10-30 | 株式会社 東芝 | システムおよび筆跡検索方法 |
JP5735126B2 (ja) * | 2013-04-26 | 2015-06-17 | 株式会社東芝 | システムおよび筆跡検索方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4568774B2 (ja) | 手書き文字認識で使用されるテンプレートを生成する方法 | |
JP2991473B2 (ja) | 文字の認識方法及び音素の認識方法 | |
JP5449521B2 (ja) | 検索装置及び検索プログラム | |
US20090077053A1 (en) | Method For Searching For, Recognizing And Locating A Term In Ink, And A Corresponding Device, Program And Language | |
JP2002215619A (ja) | 翻訳文書からの翻訳文抽出方法 | |
JPH0684006A (ja) | オンライン手書き文字認識方法 | |
WO2010044123A1 (ja) | 検索装置、検索用索引作成装置、および検索システム | |
JP5252596B2 (ja) | 文字認識装置、文字認識方法及びプログラム | |
JP2002259912A (ja) | オンライン文字列認識装置及びオンライン文字列認識方法 | |
JP3309174B2 (ja) | 文字認識方法及び装置 | |
JP2004133565A (ja) | インターネットを利用した文字認識の後処理装置 | |
JP2000259645A (ja) | 音声処理装置及び音声データ検索装置 | |
JP4878220B2 (ja) | モデル学習方法、情報抽出方法、モデル学習装置、情報抽出装置、モデル学習プログラム、情報抽出プログラム、およびそれらプログラムを記録した記録媒体 | |
JP2000089786A (ja) | 音声認識結果の修正方法および装置 | |
JP2003242446A (ja) | 文字列予測装置及び方法並びに当該方法を具現化するコンピュータ実行可能なプログラム | |
US6757647B1 (en) | Method for encoding regular expressions in a lexigon | |
JP2000056795A (ja) | 音声認識装置 | |
JP3975825B2 (ja) | 文字認識誤り訂正方法、装置及びプログラム | |
JP3369127B2 (ja) | 形態素解析装置 | |
JP2006163830A (ja) | 文字認識装置、文字認識方法、および文字認識プログラム | |
JP2007226359A (ja) | 読み評価方法、読み評価装置および読み評価用プログラム | |
JP2894305B2 (ja) | 認識装置の候補修正方式 | |
JP4140248B2 (ja) | データベース検索装置 | |
JP2827066B2 (ja) | 数字列混在文書の文字認識の後処理方法 | |
JP2000036008A (ja) | 文字認識装置及び記憶媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20071109 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20071109 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20071109 |