JP2700130B2 - 手書き文字の認識システム及び認識方法 - Google Patents

手書き文字の認識システム及び認識方法

Info

Publication number
JP2700130B2
JP2700130B2 JP6059239A JP5923994A JP2700130B2 JP 2700130 B2 JP2700130 B2 JP 2700130B2 JP 6059239 A JP6059239 A JP 6059239A JP 5923994 A JP5923994 A JP 5923994A JP 2700130 B2 JP2700130 B2 JP 2700130B2
Authority
JP
Japan
Prior art keywords
character
stroke information
list
stroke
handwritten
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP6059239A
Other languages
English (en)
Other versions
JPH06348904A (ja
Inventor
テツノスケ・フジサキ
ウイリアム・デイビッド・モドリン
コッタパラム・エム・モヒューディン
弘晏 高橋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of JPH06348904A publication Critical patent/JPH06348904A/ja
Application granted granted Critical
Publication of JP2700130B2 publication Critical patent/JP2700130B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/32Digital ink
    • G06V30/333Preprocessing; Feature extraction
    • G06V30/347Sampling; Contour coding; Stroke extraction
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/25Fusion techniques
    • G06F18/254Fusion techniques of classification results, e.g. of results related to same input data
    • G06F18/256Fusion techniques of classification results, e.g. of results related to same input data of results relating to different input data, e.g. multimodal recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/19Recognition using electronic means
    • G06V30/191Design or setup of recognition systems or techniques; Extraction of features in feature space; Clustering techniques; Blind source separation
    • G06V30/1918Fusion techniques, i.e. combining data from various sources, e.g. sensor fusion
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/32Digital ink
    • G06V30/36Matching; Classification

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Data Mining & Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Character Discrimination (AREA)

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、手書き文字(characte
r)(文字とは、可視的なすべての文字及び記号を意味す
る)の認識システム及びその方法に関する。
【0002】
【従来の技術】コンピユータ・ベースの手書き文字認識
に関する2つの基本的なアプローチは、オンライン手書
き文字認識(handwriting recognition-hardware)とオ
フライン・ハードウエアとして知られている。また、オ
フライン・ハードウエアのアプローチは、光学文字認識
(OCR)とも呼ばれている。一般論として言えば、オ
ンライン・ハードウエア技術は動的な手書き文字情報を
用いているのに反して、オフライン・ハードウエア技術
は静的な手書き文字情報を用いている。これら2つのア
プローチは、歴史的に言えば、手書き文字の異なつた環
境において用いるために夫々別個に開発されてきた。
【0003】与えられた入力文字の組に対して、オンラ
イン・ハードウエアは通常、オフライン・ハードウエア
技術よりも、より良い文字認識の精度を与えるので、手
書き文字の入力装置がストローク(運筆)の方向及びス
トロークの順序のような動的な情報を与える場合につい
ては、オンライン・ハードウエア技術の使用が元来好ま
れていた。一体化されたデジタイザ・タブレツトからの
ストロークを獲得するスタイラス・ベース(またはペン
・ベース)のコンピユータは、オンライン・ハードウエ
アの使用からの利益を享受する1つの例である。
【0004】他方、オフライン・ハードウエア技術は、
通常、デイジタイザからの動的な情報が入手できない場
合のアプリケーシヨンに対して用いられてきた。1例を
挙げると、文書がスキヤナから走査される時に、入力デ
ータ・ストリームは動的な手書き文字情報を含んでいな
い。このような場合には、オンライン・ハードウエアア
プローチは使用するのに不適当であり、オフライン・ハ
ードウエアアプローチは有用な代替方法を与える。
【0005】動的なストローク情報が利用可能な場合に
は、オンライン・ハードウエア技術は秀れた結果を与え
るけれども、これは同時に欠点を持つている。例えば、
オンライン・ハードウエア技術は、文字の形成がユーザ
に依存するので、認識処理の結果が左右される。これを
換言すると、オンライン・ハードウエア技術は文字や、
数字の構成ストロークを良好に形成した表示に対して最
高の認識を与えるということである。従つて、オンライ
ン・ハードウエア技術は、文字形成の順序と、構成スト
ロークの数とに対して認識結果が影響されることにな
る。例えば、代表的なオンライン・ハードウエア技術
は、ユーザが文字「C」を書く場合に、紙上からペンを
離すことのない一筆書き(1ストローク書き)と、反時
計方向のストロークとをユーザに期待する。然しなが
ら、これは、ユーザが文字「C」を書く場合に生じる1
つの可能性しか与えていない。例えば、他のユーザが文
字「C」を書く場合、複数のストロークを用いるかも知
れないし、ペンの運びを時計方向にするかも知れない。
【0006】ユーザに依存する文字形成によつて与えら
れる問題をしばしば複雑にするものは、通常のスタイラ
ス及びデイジタイザ・タブレツトによりユーザが書き込
む場合に多くのユーザが経験する不自然さである。デイ
ジタイザ・タブレツトの表面と接触するスタイラスの感
触は、紙上に接触するペン、または鉛筆の感触をそのま
ま引き写したものではなく、ユーザの視覚によるフイー
ドバツクは、ユーザが普段見馴れている文字とは異なつ
ているから、結果の入力文字は、形が悪く形成されるこ
とになるか、あるいは、通常でないストローク順序及び
/またはストローク方向によつて形成されることにな
る。ユーザによつてストロークを再度重ね書きすること
は、動的なハードウエア技術を適正に取り扱うために特
に困難な問題を生じる。その結果、オンライン・ハード
ウエア技術を使用する場合、認識エラーを生じることに
なる。
【0007】動的なストローク情報が考慮されていない
オフライン・ハードウエア技術は、このような規則から
外れた手書き文字を与えられた場合、認識の精度がより
良いことが分つている。然しながら、上述したように、
オフライン・ハードウエア技術の全体の認識精度は、通
常、オンライン・ハードウエア技術を用いた時に得られ
る精度よりも低い。
【0008】
【発明が解決しようとする課題】本発明の目的は、オン
ライン・ハードウエア及びオフライン・ハードウエアの
いずれか一方を使用した時に、両方の技術の何れかを使
用した場合を越えて向上した認識精度を達成したオンラ
イン・ハードウエア及びオフライン・ハードウエアの両
方を用いた手書き文字認識システム及びその方法を提供
することにある。
【0009】本発明の他の目的は、動的な文字表示が静
的な文字表示に変換され、動的及び静的な表示が並列に
処理され、かつ、認識される文字として最も可能性の高
い文字を選択するために動的及び静的な文字表示が、組
合わせられる手書き文字認識システムを提供することに
ある。
【0010】
【課題を解決するための手段】手書き文字の認識システ
ムを動作する方法及び本発明の方法に従つて動作する手
書き文字の認識システムによつて、上述の問題及び他の
問題を解決することができる。本発明の方法は、(a)
ユーザからの手書き文字入力に応答して、時間的に順序
付けられた動的なストローク情報を与えるステツプと、
(b)時間的に順序付けられた動的なストローク情報が
表示しようと意図している少なくとも1つの可能性ある
文字を含む第1のリストを決定するステツプと、(c)
時間的に順序付けられた動的なストローク情報を静的な
ストローク情報に変換するステツプと、(d)静的なス
トローク情報が表わす少なくとも1つの可能性ある文字
を含む第2のリストを決定するステツプと、(e)時間
的に順序付けられた動的なストローク情報が、表わそう
と意図している最も可能性の高い文字を表わす少なくと
も1つのエレメントを含む第3の均等化リストを与える
ために、第1のリスト及び第2のリストを併合するステ
ツプとを含んでいる。
【0011】変換するステツプは、ストローク情報の筆
跡の方向に基づいて1つ、またはそれ以上の第1のスト
ローク・フイーチヤを発生するステツプを含んでいる。
また、例えば凸形状及び凹形状のストローク情報に基づ
くフイーチヤのような他のタイプのストローク・フイー
チヤを発生し、使用することも本発明の技術的範囲に属
している。
【0012】更に、変換するステツプは、時間的に順序
付けられた動的なストローク情報をN×Mビツト・マツ
プされた表示にマツプする開始ステツプを含んでいる。
マツプするステツプは、ストロークがN×Mビツト・マ
ツプされた表示の中に完全に含まれるように、時間的に
順序付けられた動的なストローク情報を縮小するステツ
プを含んでいる。
【0013】第2のリストを決定するステツプは、少な
くとも第1のストローク・フイーチヤを受け取るための
複数個の入力ノードを有する少なくとも1つの神経系的
ネツトワーク(neural network)で行なうことができ
る。更に、少なくとも1つの神経系的ネツトワークは第
1のストローク・フイーチヤに応答して、可能性ある少
なくとも1つの文字を出力するための少なくとも1つの
出力ノードを持つている。
【0014】
【実施例】図1は本発明に従つて構成された実施例を示
す図であつて、オンライン・ハードウエア・サブシステ
ム16及びオフライン・ハードウエア・サブシステム2
2を含む手書き文字認識システム10が示されている。
手書き文字認識システム10は、全体としてデイジタイ
ザ・タブレツト12及びスタイラス、またはペン14と
して示された手書き文字変換装置を含んでいる。デイジ
タイザ・タブレツト12の出力はフイーチヤ・ベクトル
(FV)である。換言すれば、これは、アルフアベツト
の組の中の文字、数字、または、他の記号を構成するス
トロークの時間的に順序付けられた列である。1つのス
トロークは、ペン14の筆跡を表わすX−Y座標値のア
レイである。1つのストロークはペンをタブレツト上に
降した時に開始し、ペンを持ち上げた時に終了する。
【0015】手書き文字変換装置の出力は、オンライン
・ハードウエアエンジン、即ちオンライン・ハードウエ
ア・サブシステム16に接続されている。オンライン・
ハードウエア・サブシステム16はデイジタイザ・タブ
レツト12の出力から、動的な手書き文字情報(フイー
チヤ・ベクトル)を受け取り、そして、入力ストローク
を表わす最も可能性の高い文字、即ち候補文字のリスト
を得るために、ストローク数及びストローク方向のよう
なこの動的な情報を処理する。オンライン・ハードウエ
ア・サブシステムは幾つかの適当なオンライン・ハード
ウエア装置及び方法によつて実行することができる。オ
ンライン・ハードウエア技術の1例は米国特許第502
9223号に開示されており、本発明の実施例において
参照されている。
【0016】本発明に従つて、・ハードウエアシステム
10はベクトル複製装置18、ベクトルからラスタへの
変換器20及びオフライン・ハードウエアエンジン、即
ちオフライン・ハードウエア・サブシステム22を含ん
でいる。複製装置18はデイジタイザ・タブレツト12
によつて出力されたフイーチヤ・ベクトルを複製する、
即ちコピーするためのデータ・バツフアと同じ態様で動
作する。次に、動的なストローク情報をエンコードする
複製されたフイーチヤ・ベクトル(RFV)は、オフラ
イン・ハードウエア・サブシステム22へ入力するため
に、コンバータ20により静的な文字表示に変換され
る。本発明のこの良好な実施例において、オフライン・
ハードウエア・サブシステム22は3つのサブシステ
ム、即ち、大文字の英字を認識するためのオフライン・
ハードウエア・サブシステム22aと、小文字の英字を
認識するためのオフライン・ハードウエア・サブシステ
ム22bと、数字及び特殊記号を認識するためのオフラ
イン・ハードウエア・サブシステム22cとを含んでい
る。オフライン・ハードウエア・サブシステム22の出
力は静的な文字情報を表わす可能性の高い文字、即ち候
補文字のリストである。
【0017】オフライン・ハードウエア・サブシステム
22は幾つかの適当なオフライン・ハードウエア(OC
R)装置及び方法によつて実行することができる。この
良好な実施例は、公知の神経系的ネツトワークを用いて
おり、これは、1991年フランスのサン・マロ(Sain
t-Malo)における文書分析及び認識の第1回国際会議
(First International Conference for Document Anal
ysis and Recognition)の会報中の高橋(H.Takahasi)
による「A Neural Net OCR Using Geometrical and Zon
al-pattern Features」と題する論文の821頁乃至8
28頁に記載されたOCR技術に或る意味で類似するも
のである。
【0018】本発明の技術範囲における「オフライン」
ハードウエア技術は、動的な(オンライン)手書き文字
情報の処理とは逆に、静的な手書き文字情報が処理され
ることを表わすために意図されていることには注意を払
う必要がある。後述されるように、「オフライン」・ハ
ードウエア・サブシステム22は、本質的に実時間の態
様でユーザの手書き文字を処理し、認識するために、オ
ンライン・ハードウエア・サブシステム16と並列に動
作する能力を持つている。従つて、オンライン・ハード
ウエア及びオフライン・ハードウエアという術語を用い
ることは、処理の速度とか、情報が処理される時点とか
に基づく区別をするためではなく、処理される情報のタ
イプに基づいて一方の情報と他方の情報(静的な情報と
動的な情報)とを区別することを意図している。
【0019】オンライン・ハードウエア・サブシステム
16の出力及びオフライン・ハードウエア・サブシステ
ム22の出力は、併合処理装置24に接続されており、
併合処理装置24は候補文字のリストを併合するのに動
作し、そしてまた、システム10の認識処理の結果とし
て可能性の高い1つ以上の文字を選択することができ
る。その後、認識処理の結果はストアされるか、あるい
は、ワード処理プログラムか、またはユーザ・インター
フエース・プログラムのような認識文字の処理装置に与
えられる。認識文字の処理装置の細部は本発明に直接関
係がないので、これ以上の説明は省略する。
【0020】図1の手書き文字認識システム10は図3
に示された第1のタイプの書き込み(記号W1で示され
ている)を認識するのに特に有利である。このタイプの
書き込みは、個々の文字が個々の領界、即ちボツクス中
に形成され、これにより文字のセグメント化の処理を単
純化するボツクス分離型(box discrete)として知られ
ている。つまり、与えられたボツクスの中で形成された
すべてのストロークは単一の文字の形成ストロークであ
ると見做される。第2のタイプの書き込み(図3中の記
号W2で示されている)は、文字が相互に接触しないよ
うにユーザが各文字を意識的に形成するタイプの間隔分
離型(spaced discrete)と呼ばれている。第3のタイ
プの手書き(図3中の記号W3で示されている)は、ユ
ーザが相互に接触した文字、または「重なつた(run-o
n)」文字を形成することができるランオン分離型(run
-on discrete)と呼ばれている。
【0021】第2及び第3のタイプの手書き文字は図2
に示された手書き文字認識システム10'により処理さ
れるのが好ましい。システム10'は、手書き文字認識
システムのタブレツトと他の部分との間にセグメント化
プロセツサ26が接続されているのを除けば、図1の手
書き文字認識システム10の構成及び動作と本質的には
同じである。セグメント化プロセツサ26の目的は、1
つ、またはそれ以上のストロークのフイーチヤ・ベクト
ルを、文字を表示するビツト集合にグループ化すること
にある。例えば、隔離分離型の手書き(W2)に対し
て、セグメント化プロセツサ26は、接触するすべての
ストローク、または、所定の距離内に相互に接近してい
るすべてのストロークを識別する。接触し、または殆ど
接触しているストロークは同じ文字の構成ストロークで
あると見做され、関連するフイーチヤ・ベクトルは、認
識するためにシステム10'の残りの部分に通される。
【0022】図1及び図2に示したオフライン・ハード
ウエアプロセツサ22の細部を以下に説明すると、複製
装置18は文字のストロークのRFV表示を、オフライ
ンの手書き文字のフイーチヤの取り出しに適したN×M
ビツト・マツプに変換する動作を行なう。このビツト・
マツプから取り出された静的なフイーチヤに基づいて、
オフライン・ハードウエア・サブシステム22は入力の
認識処理を遂行し、オフラインの候補文字リストを与え
る。オフライン及びオンラインの候補文字リストは、一
体化された認識結果を発生するために併合処理装置24
に入力される。
【0023】上述の説明に基いて、本発明の手書き文字
の認識システム10は、相互に並列に動作する能力を有
する複数個の・ハードウエアエンジン、即ち・ハードウ
エア・サブシステムを含んでいることが分る。本発明の
良好な実施例において、並列に動作することのできる4
つの・ハードウエアエンジンがある。それらは、 a.オンライン・ハードウエア・サブシステム16と、 b.大文字の英字を認識するためのオフライン・ハード
ウエア・サブシステム22aと、 c.小文字の英字を認識するためのオフライン・ハード
ウエア・サブシステム22bと、 d.数字及び特殊記号を認識するためのオフライン・ハ
ードウエア・サブシステム22cとである。
【0024】手書き文字変換器の出力、つまりデイジタ
イザ・タブレツト12の出力はストロークのアレイであ
る。このアレイは「E」、「a」及び「7」などのよう
な文字を表示するようにされている。ストローク・アレ
イの各エレメントは文字の構成ストロークに対応してい
る。文字が単一のストロークで書かれているとき、スト
ローク・アレイのデメンシヨンは1である。転じて、各
ストロークはX及びY座標のアレイによつて表わされ
る。X及びY座標値の対は、時間的に順序付けられてお
り、そして、ペン14がデイジタイザ・タブレツト12
の表面に押付けられている間か、または、タブレツト1
2の表面に接触している間におけるデイジタイザ・タブ
レツト12に対するペン14の筆跡を表わしている。デ
イジタイザ・タブレツト12によるペンの位置のX及び
Y座標値のサンプル動作は、例えば10ミリ秒毎の時間
間隔で発生する。
【0025】ストローク・アレイの出力は、ストローク
のアレイにおいて検出された筆跡のX−Y座標値に最も
近似しているASCIIコードを決定するために、オン
ライン・ハードウエア・サブシステム16に入力され
る。オンライン・ハードウエア・サブシステム16の動
作の詳細は、上述の米国特許第5029223号に記載
されているので、ここでは説明しない。
【0026】オンライン・ハードウエア・サブシステム
16により処理されると、オンライン候補文字リストが
オンライン・ハードウエア・サブシステム16によつて
出力される。この候補文字リストはペンの筆跡に対して
可能性ある(可能性の高い)1つ、またはそれ以上の候
補文字を含んでいる。候補文字は尤度の順序でストアさ
れており、各候補文字は尤度に関連したスコア(点数)
を持つている。スコアが高ければ高い程、候補文字が正
しい文字である可能性が高くなる。
【0027】次に、オフライン・ハードウエア(OC
R)サブシステム22を参照すると、ベクトルからラス
タ変換器20はストローク・アレイからN行×M列のビ
ツト・マツプを発生する。本発明の良好な実施例におい
ては、N=24でM=16である(図9参照)。また、
変換器20は24×16ビツト・マツプ中に文字のサイ
ズを縮小して平均化するよう動作する。
【0028】これに関連して、図10乃至図12を参照
すると、図10は1つ、またはそれ以上のストロークが
適合される取り囲みボツクス、即ち領界ボツクス(boun
dingbox)の2つの変形(A及びB)を示している。領
界ボツクスは、領界ボツクスの形状比(高さ対幅)に制
限されるが、すべてのストロークを収容するために、必
要に応じて、伸長(A)または縮小(B)がある。本発
明の実施例では、形状比は24/16、または3/2で
ある。図11は、ストロークが領界ボツクスの上限及び
下限に接触するように領界ボツクス中に置かれた文字
「I」を表わすストロークを示している。ストローク
は、ストロークの重心(CG)が領界ボツクスの形状の
中心と一致するように水平(X軸)方向に沿つて整置さ
れる。図12は文字「W」の場合を示す図であつて、領
界ボツクスの左側及び右側が文字の左側及び右側に接触
し、そして、ストロークの重心が領界ボツクスの形状の
中心と一致するように垂直(Y軸)方向に沿つて整置さ
れている。
【0029】i番目のストロークのj番目の座標値を、 Yij、 Xij として表わした図5を参照すると、変換技術は下記のよ
うに動作する。
【0030】図5のブロツクA: 上記の各ストローク
座標値が領界ボツクスの座標系中のポイントから測られ
るように、タブレツト12の座標系から相対座標系にス
トロークを変換する。 図5のブロツクB及びC: どのストロークでも24×
16の範囲の領界ボツクスの境界線に接触してもよい
が、しかし境界線を越えずに、領界ボツクスの領界内に
収まるように、座標系を縮小する。予め決められたパラ
メータにより特定して縮小される寸法にするためのこの
縮小処理は、すべての構成ストロークの筆跡がより小さ
なボツクス(N×Mビツト・マツプよりも小さなボツク
ス)内に収納できない場合だけに限つて適用されるのが
望ましい。これは、例えば終止符とか、コンマが24×
16マトリツクスの領界ボツクスの境界線に接触するよ
うに縮小される問題が生じるのを回避する。 図5のブロツクD: 寸法が正規化されたストロークの
筆跡は、ストロークをビツト・マツプ化するために、領
界ボツクスの24×16領域に格納される(図9参
照)。ただ1つのビツト、または1つの画素だけが領界
ボツクスの各領域、または各セルの中に表示される。上
述の実施例においては、領界ボツクスは24×16=3
84の独立した領域、即ちセルを持つことになる。
【0031】本発明の良好な実施例において、オフライ
ン・ハードウエア・サブシステム22は3つの同じ神経
系的ネツトワーク(22a、22b及び22c)を含ん
でいる。各神経系的ネツトワークはS字型関数マツピン
グ(sigmoid function mapping)を持つフイードフォー
ワード型3層ネツトワークとして実行される。然しなが
ら、各神経系的ネツトワークは入力に基づく異なつたク
ラスの符号を認識するために訓練される。特に、神経系
的ネツトワーク22aは大文字の英字(A乃至Z)のク
ラスに対して訓練され、神経系的ネツトワーク22bは
小文字の英字(a乃至z)のクラスに対して訓練され、
神経系的ネツトワーク22cは数字(0乃至9)と、複
数の特殊記号とにクラスに対して訓練される。
【0032】図6及び図9に示されているように、オフ
ライン・ハードウエア・サブシステム22の前端は24
×16ビツト・マツプされたイメージを通して22個の
区分、即ち22個のスライスから、「筆跡方向に基づく
フイーチヤ」(FD)と呼ばれる88個のフイーチヤを
取り出す。88個のフイーチヤは下記の4種類の射影
(projection)で構成される。図6に示したように、そ
れらの射影は、 (a) 24×16ビツト・マツプ中のエツジ23aに
沿つた短かい水平ベクトル・パターンのX軸上に投影さ
れた射影と、 (b) 24×16ビツト・マツプ中のエツジ23bに
沿つた短かい垂直ベクトルのY軸上に投影された射影と
、 (c) 24×16ビツト・マツプ中のエツジ23cに
沿つた対角線(Y=X)ベクトル・パターンのY=−X
軸上に投影された射影と、 (d) 24×16ビツト・マツプ中のエツジ23dに
沿つた対角線(Y=−X)ベクトル・パターンのY=X
軸上に投影された射影とである。
【0033】ヒストグラムは、ストロークの24×16
ビツト・マツプされたイメージの384個のセル上で走
査された例えば2×2マスクのようなi×jマスクに基
づいて決定される。図6及び図7においては、2×2マ
スクが効率の観点から用いられているが、勿論、必要に
応じて他のサイズのマスクを用いることもできる。マス
クは、24×16ビツト・マツプされたイメージの各行
に沿つて水平方向と、各列に沿つて垂直方向とに、イメ
ージのセル毎に走査される。若しマスク中の黒画素(エ
ツジ領域)の数が1乃至3の間にあれば、つまり、若し
マスク中の4個の画素がすべて黒でもなく、すべて白で
もなければ、プリミテイブ・フイーチヤが検出される。
図6は4つのプリミテイブ・フイーチヤの方向23a、
23b、23c及び23dを示す図である。検出された
各方向は、4つの射影において24×16ビツト・マツ
プにわたって合計22個のスライス中の位置に従つて4
回計数される。22個のスライスは6個の水平領域、4
個の垂直領域と合計12個の対角線領域で構成されてい
る。これらの中で、プリミテイブ・ベクトルの4つの方
向(23a乃至23d)は、22個のスライスの各々の
中で累計され、合計22×4個のFDコンポーネント、
つまり88個のFDフイーチヤがある。
【0034】一例として説明すると、図9は上述したよ
うなビツト・マツプされた英文字「R」のストロークを
示す図である。説明を簡略化するために、幾つかのFD
コンポーネントの値として、6個の水平スライスと4個
の垂直スライスだけしか示されていない。この例によつ
て、フイーチヤ1乃至4は、最上部の水平区分、即ち水
平スライスに対して、プリミテイブ・ベクトル23a、
23b、23c及び23dの各々に対する合計を表示し
ている。この例において、水平ベクトル・パターン23
aは27のカウント値を持ち、垂直ベクトル・パターン
23bは6のカウント値を持ち、対角線ベクトル・パタ
ーン23cは1のカウント値を持ち、対角線ベクトル・
パターン23dは4のカウント値を持つている。
【0035】また、24×16ビツト・マツプされたイ
メージから他のプリミテイブ・フイーチヤを取り出すこ
とも本発明の技術的範囲に属する。一例として図7を参
照すると、2×3領域中に現われる凸状パターン及び凹
状パターンを作ることができることが分る。凸及び凹状
パターンは8つの角度(上、下、右、左、右上、左上、
左下、右下)に基づく異なつたフイーチヤとして取り扱
われる。これらのフイーチヤは「湾曲に基づくフイーチ
ヤ」(FB)と呼ばれる。図8は24×16ビツト・マ
ツプされたイメージからFDフイーチヤを取り出すため
のFDプロセツサ25に加えてFBプロセツサ27を選
択的に使用する場合を示す図である。
【0036】24×16ビツト・マツプされたイメージ
から取り出すことのできる他のタイプのプリミテイブ・
フイーチヤは「フイルタされたイメージに基づくフイー
チヤ」(FS)と呼ばれる。この場合、24×16ビツ
ト・マツプされたバイナリ文字イメージが12×8グレ
イ・イメージに減少され、ガウス・フイルタを用いて平
滑化されて、合計96個のフイーチヤ・エレメントを生
じる。
【0037】上述の説明から、24×16ビツト・マツ
プされたイメージが、神経系的ネツトワーク認識装置2
2a乃至22cへの入力に対して、その装置からフイー
チヤ・エレメントを取り出すための幾つかの異なつた技
術に従つて処理することができることが理解されるであ
ろう。従つて、本発明の実施例はFDフイーチヤのエレ
メントだけしか用いていないけれども、他のタイプのフ
イーチヤのエレメントは、FDフイーチヤのエレメント
の拡張に使用することができるし、あるいは、FDフイ
ーチヤのエレメントの代わりに使用することができる。
【0038】図8に示したように、FDプロセツサ25
により出力された88個の取り出されたFDフイーチヤ
のエレメントは、ブロツク29によつて88個のFDフ
イーチヤのエレメントの3つの組に複製される。上述し
たように、FDプロセツサ25はN×Mビツト・マツプ
されたイメージを22個のスライスに仕切り、イメージ
上の2×2マスクで走査し、そして、スライス中のプリ
ミテイブ・フイーチヤ23a乃至23dの発生をカウン
トするよう動作する。88個のFDフイーチヤのエレメ
ントの組の各独立した組は3つの神経系的ネツトワーク
(NN)23a乃至23cの入力の1つに与えられる。
各神経系的ネツトワークは88個の入力と、少なくとも
1つの隠された層とを持つている。神経系的ネツトワー
ク22a及び22bの各々は英文字A乃至Z及びa乃至
zに対応する26個の出力ノードを持つている。第3の
神経系的ネツトワーク22cは10個の数字(0乃至
9)と、20個の特殊記号(例えば、!、$、=など)
に対応する30個の出力ノードを持つている。
【0039】これらの入力は3つの神経系的ネツトワー
ク22a乃至22cと同じであるけれども、これらの出
力の数は、訓練動作のために、入力数とは異なつてい
る。より特定して言えば、帰還伝播技術(back propaga
tion technique)を用いることによつて、神経系的ネツ
トワーク22aは26個の大文字の英字についての積極
的な訓練が行なわれるが、しかし、残り56個の文字
(26個の小文字の英字、10個の数字及び20個の特
殊記号)については消極的な訓練しか行なわれない。神
経系的ネツトワーク22bは26個の小文字の英字につ
いての積極的な訓練が行なわれるが、しかし、残り56
個の文字については消極的な訓練しか行なわれない。神
経系的ネツトワーク22cは10個の数字及び20個の
特殊記号についての積極的な訓練が行なわれるが、しか
し、大文字及び小文字の52個の英字については消極的
な訓練しか行なわれない。例えば、各英文字、数字、ま
たは特殊記号について、積極的な訓練は、対応する文字
の2000個以上のサンプルについて行なわれ、消極的
な訓練は対応する文字の125個以上のサンプルについ
て行なわれる。
【0040】本発明の良好な実施例において各神経系的
ネツトワークは、隠された層中の約50個のノードに対
して88個の入力ノードと、26個か、または30個の
出力ノードとを持つている。各入力ノードは隠された層
のノードに完全に接続されており、転じて、隠された層
のノードは出力層のノードに完全に接続されている。2
つのノードの間の各リンクは関連された重み付けを持つ
ている。−1及び+1の間の範囲の値の応答をマツプす
るために、S字型関数が入力ノード及び出力ノードの間
に用いられる。隠された層からの入力のすべてを加算す
るために各出力ノードにおいて、S字型関数の代わり
に、一次関数が用いられる。これは、出力ノードが取る
ことのできる値を広い範囲の値で発生して、認識処理に
確実さを与えることができる。
【0041】複数の候補文字リストからのスコアを均等
に適合させるために、オフライン・ハードウエア・サブ
システム22からのスコアは「疑似確率(pseudo-proba
bility)」に変換される。確率に対するスコアの実験マ
ツピングが、神経系的ネツトワーク22a乃至22c
と、オンライン・ハードウエア・サブシステム16とに
使用される。図13は神経系的ネツトワーク(NN)の
出力を上述の疑似確率に変換するために適当なマツピン
グ関数のグラフを示している。
【0042】オンライン・ハードウエア・サブシステム
16は10個の上位の候補文字(つまり、最高位のスコ
アを持つ候補文字のうちの最も確率の高い10個の文
字)を戻すのに反して、各神経系的ネツトワーク(N
N)22a乃至22cは上位の3個の候補文字を戻す。
候補文字リストから外れた場合を取り扱うために、各候
補文字リストは、このリスト中で低位にスコアされた
(小さい確率)、例えば2/3よりも少ない確率を持つ
「その他(anything else)」が付加される。この技術
を使用することによつて、4つの候補文字リストは、下
記の例示から判るように、容易に併合することができ
る。
【0043】
【表1】 オンラインHWR16 NN22aから NN22bから NN22cから からのリスト のリスト のリスト のリスト Z 0.1 Z 0.1 z 0.15 2 0.5 2 0.07 A 0.8 a 0.13 & 0.1 z 0.06 L 0.06 e 0.08 3 0.05 y 0.03 その他 0.04 その他 0.06 その他 0.03 8 0.009 3 0.0085 a 0.0084 ・ 0.0066 & 0.0041 E 0.0040 その他0.0027
【0044】併合論理装置24により出力された結果の
均等化されたリストは下記の表2の通りである。
【0045】
【表2】
【0046】上述の場合、数字「2」は、均等化リスト
の最上部の項目として示されているように、最も確率の
高い入力文字である。数字「2」のための均等化リスト
中のスコア(0.67)は、文字「2」に対するオンラ
イン・ハードウエア16のスコア(0.07)と、文字
「2」に対するNN22cのスコア(0.5)と、NN
22a及びNN22bの「その他」に対する夫々のスコ
ア(0.04)及び(0.06)との合計で得られたも
のである。
【0047】図4を参照して、手書き文字の認識システ
ムを動作する本発明の方法を説明する。本発明の方法
は、(a)ユーザからの手書き文字入力に応答して、時
間的に順序付けられた動的なストローク情報を与えるス
テツプ(ブロツクA及びB)と、(b)時間的に順序付
けられた動的なストローク情報が表示しようと意図して
いる少なくとも1つの可能性ある文字を含む第1のリス
トを決定するステツプ(ブロツクD2)と、(c)時間
的に順序付けられた動的なストローク情報を静的なスト
ローク情報に変換するステツプ(ブロツクC)と、
(d)静的なストローク情報が表わす少なくとも1つの
可能性ある文字を含む第2のリストを決定するステツプ
(ブロツクD1)と、(e)時間的に順序付けられた動
的なストローク情報が表わそうと意図している可能性の
高い文字を表わす少なくとも1つのエレメントを含む第
3の均等化リストを与えるために、第1のリスト及び第
2のリストを併合するステツプ(ブロツクE及びF)と
を含んでいる。
【0048】変換するステツプはストローク情報の筆跡
の方向に基づいて1つ、またはそれ以上の第1のストロ
ーク・フイーチヤを発生するステツプ(図6)を含んで
いる。付加的に、例えば凸形状及び凹形状のストローク
情報などに基いて1つ以上の第2のストローク・フイー
チヤを発生することができる(図7)。
【0049】第2のリストを決定するステツプは、少な
くとも第1のストローク・フイーチヤを受け取るための
複数個の入力ノードを有する少なくとも1つの神経系的
ネツトワークで行なうことができる(図8)。更に、少
なくとも1つの神経系的ネツトワークは第1のストロー
ク・フイーチヤに応答して、少なくとも1つの可能性あ
る文字を出力するための少なくとも1つの出力ノードを
持つている。
【0050】更に、変換するステツプは、時間的に順序
付けられた動的なストローク情報をN×Mビツト・マツ
プされた表示にマツプする開始ステツプを含んでいる。
マツプするステツプは、ストロークがN×Mビツト・マ
ツプされた表示の中に完全に含まれるように、時間的に
順序付けられた動的なストローク情報を縮小するステツ
プを含んでいる。
【0051】手書き文字の認識システム10は、夫々の
書き手が1600個の文字を書き込んだ24人以上の書
き手で評価された。エラー率の平均減少率は、オンライ
ン・ハードウエア・サブシステム16だけしか使用しな
い場合に比べて、41%減少したことが見出されてい
る。従つて、本発明を使用すると、手書き文字を認識す
ることにおいて顕著な改善がなされることが理解できる
であろう。
【0052】以上、本発明の良好な実施例を参照して本
発明を説明してきたが、本発明は3個以下、あるいは3
個以上のオフラインの(OCR)認識装置を用いること
ができるのは自明であろう。例えば、1つのオフライン
認識装置を数字に使用し、他のオフライン認識装置を句
読点のような特殊記号だけに用いることができる。更
に、オフライン認識装置は他の形式で実行することがで
き、神経系的ネツトワークである必要はない。また、本
発明は、英語用の手書きの文字の認識のみに制限される
ものではなく、例えば漢字のような他の言語にも用いる
ことができるのは自明であろう。
【0053】
【発明の効果】本発明によれば、手書きの文字、記号の
認識システムにおいて、認識結果の正確度を顕著に向上
することができる。
【図面の簡単な説明】
【図1】オンライン・ハードウエア・サブシステム及び
オフライン・ハードウエア・サブシステムを含む本発明
の手書き文字の認識システムであつて、本発明の第1の
実施例に従つて構成され、動作される手書き文字の認識
システムのブロツク図である。
【図2】本発明の第2の実施例に従つて構成され、動作
される手書き文字の認識システムのブロツク図である。
【図3】本発明の手書き文字の認識方法によつて認識す
るのに適合している3つのタイプの手書き文字を示す図
である。
【図4】本発明の手書き文字の認識方法を説明するため
の論理的流れ図である。
【図5】図1、または図2のオフライン・ハードウエア
・サブシステムによつて使用するために、動的なストロ
ーク情報を静的なビツト・マツプに変換し、そして均等
化するための方法を説明するための論理的流れ図であ
る。
【図6】図1、または図2のオフライン・ハードウエア
・サブシステムの一部を形成した「筆跡の方向に基づく
フイーチヤ」(FD)を説明するための図である。
【図7】図1、または図2のオフライン・ハードウエア
・サブシステムの一部として付加的に用いられる「湾曲
形状に基づくフイーチヤ」(FB)を説明するための図
である。
【図8】図1及び図2のオフライン・ハードウエア・サ
ブシステムの実施例を形成する複数個の神経系的ネツト
ワークへの入力における、静的なFD及びFBコンポー
ネントの組合わせを説明するための図である。
【図9】ストロークのビツト・マツプされたビツト集合
の例であつて、「筆跡の方向に基づくフイーチヤ」(F
D)の取り出しを説明するための図である。
【図10】静的なフイーチヤ・ベクトルの取り出しの前
に、入力ストロークの平均化及び縮小化を説明するため
の図である。
【図11】静的なフイーチヤ・ベクトルの取り出しの前
に、入力ストロークの平均化及び縮小化を説明するため
の図である。
【図12】静的なフイーチヤ・ベクトルの取り出しの前
に、入力ストロークの平均化及び縮小化を説明するため
の図である。
【図13】神経系的ネツトワーク認識装置の出力スコア
と疑似確率との間の変換を説明するためのグラフであ
る。
【符号の説明】
10、10' 手書き文字の認識(・ハードウエア)シ
ステム 12 デイジタイザ・タブレツト 14 スタイラス(ペン) 16 オンライン・ハードウエア・サブシステム 18、29 複製装置 20 ベクトルからラスタ変換器 22 オフライン・ハードウエア・サブシステム 24 併合処理装置 25 FDプロセツサ 26 セグメント化プロセツサ 27 FBプロセツサ
───────────────────────────────────────────────────── フロントページの続き (72)発明者 ウイリアム・デイビッド・モドリン アメリカ合衆国 フロリダ州、ボカ・ラ トン、ノースイースト・ツゥエンティ ス・ストリート 255 (72)発明者 コッタパラム・エム・モヒューディン アメリカ合衆国 カリフォルニア州、サ ンノゼ、クウェイル・クリーク・サーク ル 1086 (72)発明者 高橋 弘晏 神奈川県横浜市緑区たちばな台1丁目18 −29 (56)参考文献 特開 平1−156889(JP,A) 特開 昭61−143887(JP,A) 特開 平4−279965(JP,A) 特開 昭60−59489(JP,A)

Claims (16)

    (57)【特許請求の範囲】
  1. 【請求項1】ユーザからの手書き文字の入力に応答し
    て、時間的に順序付けられた動的なストローク情報を出
    力するための手書き文字変換手段と、 上記手書き文字変換手段の出力に接続されている入力を
    有し、時間的に順序付けられた動的なストローク情報が
    表わそうと意図している可能性のある少なくとも1つの
    文字を含む第1のリストを決定するための第1の決定手
    段と、 上記手書き文字変換手段の上記出力に接続されている入
    力を有し、時間的に順序付けられた動的なストローク情
    報を静的なストローク情報に変換するための変換手段
    と、 上記手書き文字変換手段の出力に接続された入力を有
    し、静的なストローク情報が表わす可能性のある少なく
    とも1つの文字を含む第2のリストを決定するための第
    2の決定手段と、 上記第1の決定手段の出力に接続された第1の入力と、
    第2の決定手段の出力に接続された第2の入力とを有
    し、時間的に順序付けられた動的なストローク情報が表
    わそうと意図している可能性の高い少なくとも1つの文
    字を含む第3のリストを与えるために、上記第1のリス
    ト及び少なくとも1つの上記第2のリストを併合する手
    段とからなる手書き文字の認識システム。
  2. 【請求項2】上記変換手段は静的なストローク情報の筆
    跡の方向に基づいてストローク・フイーチヤを発生する
    第1の発生手段を含む請求項1記載の手書き文字の認識
    システム。
  3. 【請求項3】上記第2の決定手段はストローク・フイー
    チヤを受け取るために、上記変換手段に接続された複数
    個の入力ノードを有する少なくとも1つの神経系的ネツ
    トワーク手段を含み、上記少なくとも1つの神経系的ネ
    ツトワーク手段は前記ストローク・フイーチヤに応答し
    て少なくとも1つの可能性のある文字を出力するための
    少なくとも1つの出力ノードを有する請求項2記載の手
    書き文字の認識システム。
  4. 【請求項4】上記変換手段は時間的に順序付けられた動
    的なストローク情報に応答して、時間的に順序付けられ
    た動的なストローク情報をN×Mビツト・マツプされた
    表示に変換する手段を含み、上記第1の発生手段はビツ
    ト・マツプされた表示に応答する請求項2記載の手書き
    文字の認識システム。
  5. 【請求項5】上記時間的に順序付けられたストロークの
    変換手段はストロークがN×Mビツト・マツプされた表
    示中に完全に含まれるように、時間的に順序付けられた
    動的なストローク情報を縮小する手段を含む請求項4記
    載の手書き文字の認識システム。
  6. 【請求項6】ユーザからの手書き文字の入力に応答し
    て、時間的に順序付けられた動的なストローク情報を与
    えるステツプと、 時間的に順序付けられた動的なストローク情報を静的な
    ストローク情報に変換するステツプと、 時間的に順序付けられた動的なストローク情報が表わそ
    うと意図している可能性のある少なくとも1つの文字を
    含む第1のリストを決定するステツプと、 静的なストローク情報が表わしている可能性のある少な
    くとも1つの文字を含む第2のリストを決定するステツ
    プと、 時間的に順序付けられた動的なストローク情報が表わそ
    うと意図している可能性のある少なくとも1つの文字を
    含む第3のリストを与えるために第1のリスト及び第2
    のリストを併合するステツプとからなる手書き文字の認
    識システムの動作方法。
  7. 【請求項7】変換するステツプは静的なストローク情報
    の筆跡の方向に基づいたストローク・フイーチヤを発生
    するステツプを含む請求項6記載の手書き文字認識シス
    テムの動作方法。
  8. 【請求項8】第2のリストを決定するステツプは静的な
    ストローク情報の筆跡の方向に基づいたストローク・フ
    イーチヤを受け取るための複数個の入力ノードを持つ少
    なくとも1つの神経系的ネツトワーク手段により行なわ
    れることと、少なくとも1つの神経系的ネツトワーク手
    段は前記ストローク・フイーチヤに応答して可能性ある
    少なくとも1つの文字を出力するための少なくとも1つ
    の出力ノードを有することとを含む請求項6記載の手書
    き文字認識システムの動作方法。
  9. 【請求項9】変換するステツプは時間的に順序付けられ
    た動的なストローク情報をN×Mビツト・マツプされた
    表示にマツプするステツプを含む請求項6記載の手書き
    文字認識システムの動作方法。
  10. 【請求項10】マツプするステツプはストロークがN×
    Mビツト・マツプされた表示の中に完全に含まれるよう
    に、時間的に順序付けられた動的なストローク情報を縮
    小するステツプを含む請求項9記載の手書き文字認識シ
    ステムの動作方法。
  11. 【請求項11】静的なストローク情報が表わしている可
    能性のある少なくとも1つの文字を含む第2のリストを
    決定するステツプは、 N×Mビット・マップ表示の中のプリミテイブ・フイー
    チヤの発生個数をカウントし、カウントされた発生個数
    に応答して、N×Mビツト・マツプされたイメージが表
    わす1つ、またはそれ以上の文字を含む第2のリストを
    発生するステツプ、 を含むことを特徴とする請求項9に記載の手書き文字の
    認識方法。
  12. 【請求項12】動的なストローク情報をセグメント化す
    るステツプを含む請求項9に記載の手書き文字の認識方
    法。
  13. 【請求項13】第2のリストを発生するステツプは、プ
    リミテイブ・フイーチヤの発生をカウントした信号を、
    少なくとも1つの神経系的ネツトワーク手段の入力に印
    加するステツプを含み、上記少なくとも1つの神経系的
    ネツトワークは少なくとも1つの所定の文字を認識する
    ように訓練されていることを含む請求項11に記載の手
    書き文字の認識方法。
  14. 【請求項14】第2のリストを発生するステツプは、プ
    リミテイブ・フイーチヤの発生をカウントした信号を複
    数個の神経系的ネツトワーク手段の個々の入力に印加す
    ることと、複数個の神経系的ネツトワークの各々は文字
    の所定のクラスの中で少なくとも1つの所定の文字を認
    識するように訓練されていることとを含む請求項11に
    記載の手書き文字の認識方法。
  15. 【請求項15】プリミテイブ・フイーチヤの発生をカウ
    ントするステツプは、 N×Mビツト・マツプされたイメージを複数個のスライ
    スに区切るステツプと、 プリミテイブ・フイーチヤの発生を見つけるために、N
    ×Mビツト・マツプされたイメージ上にi×jマスクを
    適用するステツプと、 複数個のスライスの各々の中の見つけられた位置付けら
    れたプリミテイブ・フイーチヤの発生をカウントするス
    テツプとを含む請求項11記載の手書き文字の認識方
    法。
  16. 【請求項16】マスクを適用するステツプは筆跡の方向
    に基いてプリミテイブ・フイーチヤを識別するステツプ
    を含む請求項15に記載の手書き文字の認識方法。
JP6059239A 1993-05-12 1994-03-29 手書き文字の認識システム及び認識方法 Expired - Fee Related JP2700130B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US61495 1993-05-12
US08/061,495 US6011865A (en) 1993-05-12 1993-05-12 Hybrid on-line handwriting recognition and optical character recognition system
US061495 1993-05-12

Publications (2)

Publication Number Publication Date
JPH06348904A JPH06348904A (ja) 1994-12-22
JP2700130B2 true JP2700130B2 (ja) 1998-01-19

Family

ID=22036160

Family Applications (1)

Application Number Title Priority Date Filing Date
JP6059239A Expired - Fee Related JP2700130B2 (ja) 1993-05-12 1994-03-29 手書き文字の認識システム及び認識方法

Country Status (3)

Country Link
US (1) US6011865A (ja)
EP (1) EP0624853A3 (ja)
JP (1) JP2700130B2 (ja)

Families Citing this family (47)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB9701793D0 (en) 1997-01-29 1997-03-19 Gay Geoffrey N W Means for inputting characters or commands into a computer
US6167411A (en) * 1998-06-22 2000-12-26 Lucent Technologies Inc. User interface for entering and editing data in data entry fields
US7155033B1 (en) * 1999-02-01 2006-12-26 Thomson Licensing Coarse representation of visual object's shape for search/query/filtering applications
US7016885B1 (en) * 2001-08-28 2006-03-21 University Of Central Florida Research Foundation, Inc. Self-designing intelligent signal processing system capable of evolutional learning for classification/recognition of one and multidimensional signals
US7283669B2 (en) * 2003-01-29 2007-10-16 Lockheed Martin Corporation Fine segmentation refinement for an optical character recognition system
US20040146200A1 (en) * 2003-01-29 2004-07-29 Lockheed Martin Corporation Segmenting touching characters in an optical character recognition system to provide multiple segmentations
US20050111735A1 (en) * 2003-11-21 2005-05-26 International Business Machines Corporation Video based handwriting recognition system and method
US7428516B2 (en) * 2005-06-23 2008-09-23 Microsoft Corporation Handwriting recognition using neural networks
US7715629B2 (en) * 2005-08-29 2010-05-11 Microsoft Corporation Style aware use of writing input
US7633493B2 (en) * 2006-06-19 2009-12-15 International Business Machines Corporation Camera-equipped writing tablet apparatus for digitizing form entries
US7724957B2 (en) * 2006-07-31 2010-05-25 Microsoft Corporation Two tiered text recognition
JP4873554B2 (ja) * 2006-12-25 2012-02-08 株式会社リコー 画像配信装置および画像配信方法
US8768062B2 (en) 2010-11-09 2014-07-01 Tata Consulting Services Limited Online script independent recognition of handwritten sub-word units and words
JP5418576B2 (ja) * 2011-11-28 2014-02-19 コニカミノルタ株式会社 情報閲覧装置及び表示制御プログラム
US9591339B1 (en) 2012-11-27 2017-03-07 Apple Inc. Agnostic media delivery system
US9774917B1 (en) 2012-12-10 2017-09-26 Apple Inc. Channel bar user interface
US10200761B1 (en) 2012-12-13 2019-02-05 Apple Inc. TV side bar user interface
US9532111B1 (en) 2012-12-18 2016-12-27 Apple Inc. Devices and method for providing remote control hints on a display
US10521188B1 (en) 2012-12-31 2019-12-31 Apple Inc. Multi-user TV user interface
US20140361983A1 (en) * 2013-06-09 2014-12-11 Apple Inc. Real-time stroke-order and stroke-direction independent handwriting recognition
US9495620B2 (en) 2013-06-09 2016-11-15 Apple Inc. Multi-script handwriting recognition using a universal recognizer
US9898187B2 (en) 2013-06-09 2018-02-20 Apple Inc. Managing real-time handwriting recognition
US9330331B2 (en) 2013-11-11 2016-05-03 Wipro Limited Systems and methods for offline character recognition
US9864509B2 (en) 2014-06-24 2018-01-09 Apple Inc. Character recognition on a computing device
JP6496752B2 (ja) 2014-06-24 2019-04-03 アップル インコーポレイテッドApple Inc. 入力デバイス及びユーザインターフェース対話
US10650052B2 (en) 2014-06-24 2020-05-12 Apple Inc. Column interface for navigating in a user interface
CN106446896B (zh) * 2015-08-04 2020-02-18 阿里巴巴集团控股有限公司 一种字符分割方法、装置及电子设备
DK179374B1 (en) 2016-06-12 2018-05-28 Apple Inc Handwriting keyboard for monitors
DK201670581A1 (en) 2016-06-12 2018-01-08 Apple Inc Device-level authorization for viewing content
DK201670582A1 (en) 2016-06-12 2018-01-02 Apple Inc Identifying applications on which content is available
US11966560B2 (en) 2016-10-26 2024-04-23 Apple Inc. User interfaces for browsing content from multiple content applications on an electronic device
CN108509955B (zh) * 2017-02-28 2022-04-15 柯尼卡美能达美国研究所有限公司 用于字符识别的方法、系统和非瞬时计算机可读介质
US10192127B1 (en) 2017-07-24 2019-01-29 Bank Of America Corporation System for dynamic optical character recognition tuning
US10346702B2 (en) 2017-07-24 2019-07-09 Bank Of America Corporation Image data capture and conversion
US11683565B2 (en) 2019-03-24 2023-06-20 Apple Inc. User interfaces for interacting with channels that provide content that plays in a media browsing application
US11467726B2 (en) 2019-03-24 2022-10-11 Apple Inc. User interfaces for viewing and accessing content on an electronic device
CN113711169A (zh) 2019-03-24 2021-11-26 苹果公司 包括内容项的可选表示的用户界面
CN113906419A (zh) 2019-03-24 2022-01-07 苹果公司 用于媒体浏览应用程序的用户界面
US11863837B2 (en) 2019-05-31 2024-01-02 Apple Inc. Notification of augmented reality content on an electronic device
US11797606B2 (en) 2019-05-31 2023-10-24 Apple Inc. User interfaces for a podcast browsing and playback application
US11194467B2 (en) 2019-06-01 2021-12-07 Apple Inc. Keyboard management user interfaces
CN110956133A (zh) * 2019-11-29 2020-04-03 上海眼控科技股份有限公司 单字符文本归一化模型训练方法、文本识别方法及装置
US11843838B2 (en) 2020-03-24 2023-12-12 Apple Inc. User interfaces for accessing episodes of a content series
US11899895B2 (en) 2020-06-21 2024-02-13 Apple Inc. User interfaces for setting up an electronic device
CN112132050B (zh) * 2020-09-24 2024-03-29 北京计算机技术及应用研究所 联机手写汉字识别算法及可视化关键笔画评估方法
US11720229B2 (en) 2020-12-07 2023-08-08 Apple Inc. User interfaces for browsing and presenting content
US11934640B2 (en) 2021-01-29 2024-03-19 Apple Inc. User interfaces for record labels

Family Cites Families (32)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US31692A (en) * 1861-03-12 Improvement in mowing-machines
JPS6249483A (ja) * 1985-08-28 1987-03-04 Hitachi Ltd 実時間手書き文字認識の文字入力方式
NL265383A (ja) * 1960-05-31
USRE31692E (en) 1972-05-02 1984-10-02 Optical Recognition Systems, Inc. Combined magnetic optical character reader
US3949363A (en) * 1974-06-28 1976-04-06 Recognition Equipment, Incorporated Bar-Code/MICR/OCR merge
US4024500A (en) * 1975-12-31 1977-05-17 International Business Machines Corporation Segmentation mechanism for cursive script character recognition systems
JPS5580183A (en) * 1978-12-12 1980-06-17 Nippon Telegr & Teleph Corp <Ntt> On-line recognition processing system of hand-written character
JPS5827551B2 (ja) * 1979-05-18 1983-06-10 日本電信電話株式会社 オンライン手書き文字認識方式
JPS59725A (ja) * 1982-06-28 1984-01-05 Canon Inc 入力装置
JPS5975375A (ja) * 1982-10-21 1984-04-28 Sumitomo Electric Ind Ltd 文字認識装置
JPS5998283A (ja) * 1982-11-27 1984-06-06 Hitachi Ltd パターン切出しおよび認識方法、ならびにそのシステム
US4628532A (en) * 1983-07-14 1986-12-09 Scan Optics, Inc. Alphanumeric handprint recognition
JPS6059489A (ja) * 1983-09-12 1985-04-05 Oki Electric Ind Co Ltd 文字認識装置
JPS60136892A (ja) * 1983-12-26 1985-07-20 Hitachi Ltd オンライン手書き図形認識装置
GB8404827D0 (en) * 1984-02-24 1984-03-28 De La Rue Co Plc Sign verification
JPH0650538B2 (ja) * 1984-03-28 1994-06-29 株式会社日立製作所 手書き文字・図形認識の認識モード指定方法
US4731857A (en) * 1984-06-29 1988-03-15 International Business Machines Corporation Recognition system for run-on handwritten characters
CA1223366A (en) * 1984-09-27 1987-06-23 Abijah S. Fox System for automatic adjustment and editing of handwritten text images
JPS61143887A (ja) * 1984-12-18 1986-07-01 Matsushita Electric Ind Co Ltd 文字認識装置
US4764972A (en) * 1985-05-23 1988-08-16 Nec Corporation Continuous characters recognition system
JPS6282486A (ja) * 1985-10-08 1987-04-15 Hitachi Ltd オンライン手書き図形認識装置
US4837842A (en) * 1986-09-19 1989-06-06 Holt Arthur W Character and pattern recognition machine and method
JPH07107708B2 (ja) * 1986-09-26 1995-11-15 株式会社日立製作所 パタ−ン認識方法
US4805225A (en) * 1986-11-06 1989-02-14 The Research Foundation Of The State University Of New York Pattern recognition method and apparatus
US5034989A (en) * 1987-12-11 1991-07-23 Loh Shiu Chang On-line handwritten character recognition apparatus with non-ambiguity algorithm
JPH01156889A (ja) * 1987-12-14 1989-06-20 Nippon Telegr & Teleph Corp <Ntt> オンライン手書き文字認識方式
DE3822671A1 (de) * 1988-07-05 1990-01-11 Kromer Theodor Gmbh & Co Kg Verfahren und vorrichtung zum elektronischen vergleichen von linienzuegen
US5109426A (en) * 1989-11-10 1992-04-28 National Research Development Corporation Methods and apparatus for signature verification
US5029223A (en) * 1990-02-02 1991-07-02 International Business Machines Corporation Constraint driven-on line recognition of handwritten characters and symbols
JPH04279965A (ja) * 1991-03-07 1992-10-06 Koizumi Sangyo Kk パターン認識装置
US5105468A (en) * 1991-04-03 1992-04-14 At&T Bell Laboratories Time delay neural network for printed and cursive handwritten character recognition
US5491758A (en) * 1993-01-27 1996-02-13 International Business Machines Corporation Automatic handwriting recognition using both static and dynamic parameters

Also Published As

Publication number Publication date
EP0624853A3 (en) 1995-02-22
US6011865A (en) 2000-01-04
JPH06348904A (ja) 1994-12-22
EP0624853A2 (en) 1994-11-17

Similar Documents

Publication Publication Date Title
JP2700130B2 (ja) 手書き文字の認識システム及び認識方法
Bhattacharya et al. On recognition of handwritten Bangla characters
US7729538B2 (en) Spatial recognition and grouping of text and graphics
Perwej et al. Neural networks for handwritten English alphabet recognition
EP1971957B1 (en) Methods and apparatuses for extending dynamic handwriting recognition to recognize static handwritten and machine generated text
US7929769B2 (en) Script recognition for ink notes
JP3452774B2 (ja) 文字認識方法
JPH08180139A (ja) 拘束のない手書き英数字のオンライン認識の方法及び装置
JP2005228328A (ja) デジタルインク質疑検索装置及びその方法
WO2018090011A1 (en) System and method of character recognition using fully convolutional neural networks
Al Abodi et al. An effective approach to offline Arabic handwriting recognition
Wang Character and handwriting recognition: Expanding frontiers
Al Aghbari et al. HAH manuscripts: A holistic paradigm for classifying and retrieving historical Arabic handwritten documents
US11837001B2 (en) Stroke attribute matrices
CN111832390B (zh) 一种手写古文字检测方法
Oladele et al. Offline yorùbá handwritten word recognition using geometric feature extraction and support vector machine classifier
JPH08320914A (ja) 表認識方法および装置
Sagar et al. OCR for printed Kannada text to machine editable format using database approach
Mandal et al. A Novel Approach of Normalization for Online Handwritten Characters using Geometrical Parameters on a 2D Plane
Welekar et al. Survey on existing techniques for writer verification
Imama et al. A Slice-based Character Recognition Technique for Handwritten Devanagari Script
Alsurori et al. Review on Arabic Handwritten Recognition Using Deep Learning and Machine Learning
Choi et al. Constraints on handwriting Korean characters to improve the machine readability
Sahle Segmentation of Real Life Amharic Documents for Improving Recognition
Hamad et al. Integrated multi-layer perceptron neural network and novel feature extraction for handwritten Arabic recognition

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees