JP2001325564A - 部首モデルに基づく草書体漢字の手書き注釈の検索 - Google Patents

部首モデルに基づく草書体漢字の手書き注釈の検索

Info

Publication number
JP2001325564A
JP2001325564A JP2001096811A JP2001096811A JP2001325564A JP 2001325564 A JP2001325564 A JP 2001325564A JP 2001096811 A JP2001096811 A JP 2001096811A JP 2001096811 A JP2001096811 A JP 2001096811A JP 2001325564 A JP2001325564 A JP 2001325564A
Authority
JP
Japan
Prior art keywords
radical
radicals
annotation
extracted
images
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2001096811A
Other languages
English (en)
Inventor
Yue Ma
マ ユェ
Zang Chi
ツァング チ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Publication of JP2001325564A publication Critical patent/JP2001325564A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/142Image acquisition using hand-held instruments; Constructional details of the instruments
    • G06V30/1423Image acquisition using hand-held instruments; Constructional details of the instruments the instrument generating sequences of position coordinates corresponding to handwriting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/16Image preprocessing

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Discrimination (AREA)
  • Document Processing Apparatus (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 (修正有) 【課題】 草書体漢字の高性能部首抽出技術を提供す
る。 【解決手段】 草書体の漢字は意味的整合法を用いて解
析し、まず文字内の部首を抽出し、その部首を用いて、
整合する部首を含む文字だけに、全ての辞書の検索空間
を小さくする。部首を抽出する場合、入力した文字を規
格化し、複数の画に分割し、次に画の上下情報と局所的
な最大および最小情報に基づいて、その画を編成する。
不明瞭な切れ目や接続している画は、この過程で取り除
く。次に、動的計画法の整合を画毎に実行して、接線ベ
クトル解析、中心関係評価、および始点終点評価を含む
様々な技術によって、ポイント毎に置換コストを評価す
る。動的計画法のコストは、参照部首の長さに基づいて
規格化し、位置の違いを取り除く。

Description

【発明の詳細な説明】
【0001】(発明の属する技術分野)この発明は、一
般に手書き処理に関する。特に、この発明は草書体漢字
の改良されたインク整合技術に関する。中国語で書かれ
たものには非常の多くの数の文字があり、英語のアルフ
ァベットで文字を整合させるために使われるような既存
の整合技術は、単に検索用としては十分な性能ではない
という事実に、このインク整合技術は対処する。
【0002】インクの整合は、認識させようとすること
なく整合可能な第一クラスデータとして、電子インクを
提供できるという基本的な仮定上で機能する。つまり、
使用者は草書体の文字を書いてもよく、草書体の一画に
関する時間的および空間的情報を有する電子インクデー
タを検索または整合操作で用い、それらの一画が何の文
字を表すかを解釈する必要はない。
【0003】ここで説明する改良は、高性能部首抽出技
術にあり、動的計画法の整合における改良と関連してい
る。この発明は、全ての中国語と同様に、漢字を用いる
他の言語に対して役立つ。漢字は、中国、台湾、日本、
韓国などアジアの多くの場所で現在一般的に用いられて
いる。
【0004】漢字は、人間の最古の書き方の一つである
象形文字に端を発する。一つの文字は、部首として知ら
れる一つ以上の下位の記号から構成され、一つの単語、
思考、または概念を表す。従って、英語で言葉を綴るた
めに使われるアルファベットの文字とは異なり、漢字は
より緻密である。各々が、一つの文字で単語、思考、ま
たは概念を表す。
【0005】漢字は緻密で高効率なコミュニケーション
形態を表現するが、自動化システムには問題をもたら
す。コンピュータに漢字を入力することがボトルネック
であり、キーボードではなく、離散化タブレットを用い
て解決するいくつかの方法が提案されている。タブレッ
トによって、使用者は手書きでコンピュータに入力する
ことができ、手書き認識技術によって、使用者の手書き
は認識されたテキストに変換され、コンピュータに入力
される。手書きの漢字認識の分野では、オンライン認識
が、描かれた通りに入力点と画の時間的な順序を捕捉す
るのに有利である。従って、オンライン認識システム
は、線が描かれた通りに生成した時間的なデータによっ
て、上から下に描いた線と下から上に描いた線を区別す
ることができる。
【0006】手書き漢字認識は長足の進歩を遂げている
が、その問題の複雑さは、当初の予想以上であることが
証明されている。これは少なからず、通常の業務用を意
図した辞書で必要とされる文字が非常に多いことによ
る。例えば、中国語で書かれたものでは、平均3,00
0〜5,000文字が日常使われている。日本語で書か
れたものでは、中国の文字、つまり「漢字」の文字数は
幾分少ない。それでも、日本の新聞を読むためには、な
お数千の文字を理解する必要がある。さらに、手書き文
字認識の別の問題は、手書きの形が書き手によって非常
に異なり、草書体で書く人も多いことによる。
【0007】近年、インク整合技術は、文書検索用途で
手書き注釈を検索する等の所定の用途で有望であること
が示されている。別の背景については、米国特許第5,
832,474号「使用者が書いた注釈の部分整合検索
を用いた文書探索および検索システム」に示されてい
る。これらの用途では、インク整合は既存の文字認識技
術より、様々な形の手書き、特に草書体の手書きを処理
する場合に有利である。つい最近、意味的整合技術が導
入され、この技術では文字はその部首に再分割され、こ
れらの部首を事前に検索して、文字整合の問題をより小
さなものの一つに限定する。抽出した部首に基づいて部
分整合を実行することによって、次の文字整合過程で
は、整合した部首を含んでいない文字を調べる必要性が
なくなる。
【0008】参照部首に基づく意味的整合は非常に有望
な技術であるが、この技術の成功は、完全な文字から部
首を抽出するシステムの能力次第である。部首の抽出
は、最も困難な問題である。手書きの漢字は通常自由な
形態で書かれ、いかなる格子線もないので、文字内の部
首の位置は、その文字が書かれる毎に著しく変化する。
また、その部首は文字の他の部分と偶然交差することも
あり、文字内の別個の要素として部首を識別することを
困難にする。さらに、急いで書くと、使用者は、文字の
一部の終わりの画と別の部分の始まりの画をつなげる、
偶然に接続している画をペンで書くことがある。この接
続している画は実際には文字の一部ではないが、それで
も単に使用者が、文字の各々の部分を書く間に、ペンま
たはスタイラスを持ち上げなかったために画のデータに
存在している。
【0009】上記の問題とは別に、動的計画法の別の問
題がある。動的計画法は、一つのパターン(部首内の一
画など)が別のパターンと適合するかどうかの決定にお
いて、挿入コスト、削除コストおよび置換コストを評価
するパターン整合技術である。従来、画の挿入コストと
削除コストは、その画の長さに直接比例して計算されて
いる。画の置換コストは、二つの画の間の形状の類似性
の測定を含むのでより複雑である。既存の技術を用いる
と、動的計画法によって、置換に対して考慮される二つ
の画の間の一組の対の点が得られる。置換コストは、二
つの点の各対に対するユークリッド距離の合計として測
定される。置換コストを計算する前に、画を各々一時的
に移動させ、その画の枠の左上の角が原点(0,0)に
重なるようにする。
【0010】置換コストを計算する既存のユークリッド
ベースの方法には二つの欠点がある。一つ目は、動的計
画法の手続きに時間がかかることである。二つ目は、ユ
ークリッド距離法を用いることによってもたらされる誤
差が蓄積されることである。参照画とテストされる画を
各々移動させて、それらの左上の角が原点に重なるよう
にした後、ポイント毎に距離を解析する。各々の画の基
本的な形状が比較的同様であれば、ユークリッド距離法
は有用な性能指数を与えることができる。しかし、各々
の画がその左上の角を除いて基本的に同様の形状でなけ
れば、ユークリッド距離法は機能しない。二つの画の左
上の角を揃えることによって、その画の残りの部分が大
きなユークリッド距離で分離することとなり、その画が
互いに同様の形状ではないという不正確な評価となる。
【0011】この発明は、非常に改良された部首抽出技
術を提供し、意味的整合性能を著しく向上させる。ここ
でより詳しく説明するように、この技術は文字規格化手
続きと改善された画分割手続きを用い、動的計画法の手
続きを混乱させる多くの問題となるアーティファクトを
取り除く。
【0012】さらに、この技術は新しい動的計画法を用
い、接線ベクトル、中心関係評価および始点終点評価に
よって、置換コストをより確実に評価する。さらに、動
的計画法の手続きは部首分類データ構造を用いて、より
よい整合のために開始部首と終了部首にタグを付ける。
さらに、動的計画法の手続きは、参照部首の長さを用い
て動的計画法のコストを規格化し、これらの規格化した
コストを対話形式で調整して、動的計画法のコストのラ
ンクに基づく位置の違いを取り除く。
【0013】改良した動的計画法の手続きの結果は、最
もよく抽出された部首、またはn個の部首の出力であ
る。次に、最もよく抽出された部首(またはn個の部
首)を用いて、以降に文字全体を整合させるための辞書
の大きさを低減する。動的計画法における改良は、特に
部首の抽出で役立つが、以降の文字全体の抽出または整
合操作に用いてもよい。
【0014】この発明、その目的および利点のより完全
な理解のために、下記の詳しい説明と添付の図面を示
す。
【0015】図1は、例示的な漢字を機械印刷された形
式または植字された形式10、及び手書きされた形式1
2の双方で示している。この特定の漢字は「ねこ」を意
味し、部首14(当該文字の最左部分)のような少なく
とも1つの部首を含んでいる。本部首自体は、「動物」
という意味を有している。このように、「ねこ」を意味
する漢字は、これに内蔵される形で「動物」を意味する
より基本的な文字を含んでいる。日常的に使用される漢
字の書体には少なくとも200の部首が存在するため、
この例は無論、単に例示を目的とするものである。
【0016】概して中国語及び漢字を使用する他の言語
においては、部首は、これらの文字における小さな基本
的意味を持つ要素である。1つまたは複数の部首は、組
合わされて文字を形成することができる。正しく書かれ
た各部首は、文字ブロック内の1つの周知の小区域にし
か存在しないはずである。本明細書で使用されているよ
うに、文字ブロックとは、文字が印刷ページ上に占有す
るほぼ矩形の領域である。文字ブロックを評するために
は、文字の周囲に矩形の有界ボックスを描けばよい。従
って有界ボックスは、伸ばされたり縮小されたりして文
字の周囲にぴたりとはまり、文字とはその端でのみ接触
する概して矩形の弾力的形状として考えることができ
る。部首は、文字ブロック内の予め限定された位置に配
置されている。
【0017】例えば図1が示す例示的文字の場合、部首
14は文字ブロックの最左区域を占めて正しく書かれ、
本質的に同文字の全高に渡って伸長している。他の漢字
では、構成要素である部首は他の場所を占めている可能
性がある。これらの場所は、時に文字ブロックの全高
(または全幅)いっぱいに伸長する小区域に及ぶ。他の
部首は、文字ブロックの全高または全幅より小さい区域
に及ぶ。
【0018】(漢字整合工程の概要)基本的な漢字整合
工程は、図2を参照して説明することができる。図2が
示すシステムは、本発明の方法及び装置を実施すること
のできるシステムの例示的な一実施形態を示している
が、他のシステムも可能である。漢字整合工程は、好適
には、時間情報及び空間情報を共に記録する「インク」
データと呼ばれる動的に記録されたデータに基づいて実
行される。ディジタイズ用タブレット16上にスタイラ
ス18で書かれる一画は、連続する点(例えば、タブレ
ットのx−y座標空間における点)として任意のタイム
スタンプ印と共に記録される。タイムスタンプ印から
は、一画の方向を推測することができる。一画は、一画
の方向を表示しかつ一画の開始ポイントと終了ポイント
とを区別するために使用されることが可能なデータ構造
で表示される。本好適な実施形態で使用されているイン
クデータタイプは、時間的(時刻)情報及び位置(x,
y点)情報を保持する。
【0019】任意の手書き漢字処理システムの基本的な
目的は、(ユーザによって供給される)手書きされた文
字をシステムトレーニングを介して取得されかつ予め記
憶された情報と整合させることにある。ユーザは図1の
文字12のような手書きされた文字を入力し、システム
はこの文字を予め記憶されたデータと整合する。この方
法で、予め書かれた手書きの付注は直接検索されること
が可能である。記憶されたデータを植字された文字に対
応させるルックアップ表を利用できる場合は、ユーザの
手書きによる入力は、後の処理または表示のために植字
された文字に変換されることが可能である。
【0020】引き続き図2を参照すると、ユーザの手書
きによる入力は、問合せインクデータ構造内に問合せイ
ンクとして記憶される。予め取得されたデータは、デー
タ記憶装置22内にデータベースインクとして記憶され
る。データ記憶装置22は、ユーザに彼または彼女の他
の筆跡例でシステムを訓練させることによって配置され
ることが可能である。訓練は、先に同一性が知られてい
る漢字の例をユーザに入力させることを含んでいる。従
って、ユーザによる訓練用入力は、用語集における各文
字について標識されたデータを構築するために使用され
ることが可能である。次に、弾力的的整合として周知の
工程がデータ構造20内の問合せインクとデータベース
構造22内のデータベースインクとの比較に使用される
ことが可能であり、問合せインクのデータ記憶装置にお
ける文字に最も密接に整合しているのはデータベースイ
ンクのデータ記憶装置におけるどの文字であるかが選択
される。
【0021】弾力的整合の実行は、特にデータベースイ
ンクのデータ記憶装置が、典型的にはそうであるように
大量の用語集を含んでいる場合には、時間のかかる工程
である。中国語は、日常的に使用される三千乃至五千文
字を包含していることを思い出していただきたい。
【0022】従来の弾力的整合手順をスピードアップす
るために、図2の部首抽出技術が使用されてきた。図2
では、ブロック24で従来の弾力的整合オペレーション
が実行される。但し、このオペレーションが実行される
までには、整合作業または検索は部首抽出手順を介して
大幅に縮小されている。
【0023】部首抽出手順は、まず問合せインク及びデ
ータベースインクを分割し、各文字をその構成要素部分
に解体することを含んでいる。セグメンテーションブロ
ック30及び32は、この目的のために設けられてい
る。図1が示す例示的な文字では、部首14は、構成要
素間の白い空間を同定して文字の残りの部分から分割ま
たは分離される、もしくは接続される構成要素の解析に
よって分割または分離されることが可能である。但し、
後の好適な実施形態の説明においてより完全に探求され
る通り、手書きの文字がこれほどきちんと描かれること
はほとんどない。部首が文字の他の部分に触れたり重な
ったりすることは極めて多く、また、ユーザが急いで書
いて構成要素間の字画をつなげるために部首の分割及び
抽出はさらに困難になる。本発明は、以下でより詳細に
論議するように、部首の分割及び抽出工程を改良するこ
とによってこれらの問題に対処する幾つかの技術を提供
する。
【0024】工程26及び28で分割された各文字は、
各々の弾力的整合ブロック30及び32で試験され、任
意のセグメントが周知の部首を表しているかどうかが決
定される。これを達成するために、34には参照部首の
データベースが供給されている。ある例示的な実施形態
では、約200の参照部首が存在する可能性がある。こ
れらは、文字の目録における最もよく使用される部首セ
ットから選択されている。参照部首は、例えば部首をユ
ーザに後で標識付けされる別々の構成要素として書かせ
ることにより訓練を介して、もしくは完全な文字訓練デ
ータから部首の好例を人手で抽出することによって取得
されることが可能である。何れにしても、参照部首は、
ユーザの問合せインク及びデータベースインクを比較す
ることのできる部首の明確で優れたインクデータ例を提
供する。
【0025】モジュール30及び32で抽出された部首
は、次に部首コード評価ブロック36において比較され
る。ブロック36は、部首コードの整合に基づいて最上
位の候補のみを返す。最上位の整合する部首コードは、
次にさらなる部首コード評価ブロック38に供給され、
同ブロック38は、データベースインクデータ記憶装置
22から最上位の部首候補を有する最上位の文字候補を
選択する。選択された文字は、次に弾力的整合ブロック
24に供給され、データ記憶装置20からの問合せイン
クと比較される。
【0026】こうして、(問合せインクのデータ記憶装
置20に記憶された)ユーザによる入力された問合せ
は、データベースインクのデータ記憶装置22から唯一
選択された文字と弾力的に整合される。部首に関してま
ず弾力的整合を実行することにより(ブロック30及び
32)、全体的な整合工程ははるかに迅速に実行される
ことが可能である。(200文字から)上位30個の文
字候補を返すことで、計算時間の85%の短縮が達成さ
れる。
【0027】次に、意味論的(部首抽出)モデルに留意
しながら、好適な実施形態の部首抽出技術及び改良され
た動的プログラミング技術について説明する。これらの
技術はブロック30及び32における部首抽出の実行に
際して使用されることが可能であり、改良された動的プ
ログラミング技術は、弾力的整合が実行される(図2の
ブロック30、32及び24等)場合に使用が可能であ
る。現時点では図2が例示する部首抽出のフレームワー
クが好適であるが、本発明のこの技術が他の用途でも利
用可能であることは理解されるであろう。
【0028】(改良された部首抽出)次に、図3及び4
を参照して、本好適な部首抽出技術について説明する。
入力される字画データ40は、問合せインクとしてユー
ザにより、もしくはデータベースから供給される。入力
されたデータに対する文字の正規化処理及び字画分割処
理は、動的プログラミング整合オペレーションに先立っ
て実行される。図3では、文字の正規化はステップ42
で始まり、字画分割はステップ50で、動的プログラミ
ングはステップ60で始まる。動的プログラミングステ
ップの詳細は、図4に示されている。
【0029】(文字の正規化)罫線のない用紙に文字を
書く場合、人の筆跡はその都度大きさが変わる可能性が
ある。従って、1つの文字が予め記憶された文字と比較
される場合、もしくは1つの部首が予め記憶された部首
と比較される場合、各々の字画長は異なる可能性があ
る。
【0030】これに対処するため、本好適な実施形態
は、まず文字の周囲に有界ボックスを限定し、次にこの
有界ボックスの大きさを正規化されたサイズまたは基準
サイズに調節することにより、文字の正規化を実行す
る。図3では、有界ボックス45は文字12の周囲に描
かれ、次に基準サイズの有界ボックス46へと縮小され
る。図示された例では、書かれたもとの文字は正規化さ
れた文字よりも大きかった。無論、例によっては書かれ
たもとの文字が基準文字より小さくなる場合もあり、こ
うした場合は有界ボックスの大きさが拡大される。
【0031】ステップ47で指示されているように、文
字を作り上げているピクセルまたは点は次に、48が示
す通り、書かれたもとの文字が正規化された有界ボック
ス46を満たすサイズに縮小または拡大されるようにシ
フトされる。
【0032】本好適な実施形態では、線形正規化が使用
されている。各文字の有界ボックスは基準の文字サイズ
に正規化され、文字内のピクセルがこれに合わせてシフ
トされる。(x1,y1)、(x2,y2)を各々、文字の
有界ボックスの左上の角及び右下の角とすると、文字内
の点(x,y)の正規化後の新たな座標は以下のように
なる。 x’=0+(x−x1)fx y’=0+(y−y1)fy 但し、fx及びfyは各々x及びy方向の換算係数であ
り、以下のように定義される。 fx=Sx/(x2−x1) fy=Sy/(y2−y1) 但し、Sxは幅として選択する基準文字サイズであり、
yは同じくその高さの場合である。目下、Sx及びSy
は各々40及び50として選択されている。正規化の
後、各文字の有界ボックスの左上の角が原点(0,0)
にシフトされる。
【0033】本好適な実施形態では、同様の正規化オペ
レーションが参照部首34(図2)に対して実行され
る。参照部首を正規化する場合には、当該部首を有する
全ての文字が正規化される。トレーニング工程では、参
照部首は直接は訓練されない。各参照部首の部首ロケー
ション情報を維持するために、この部首を含む文字を選
択し、ユーザにその文字を書くように依頼する。その
後、参照部首は、その対応する文字から対話的に抽出さ
れることが可能である。参照(訓練用)文字のサイズ
は、動的プログラミングが使用される前に正規化され
る。
【0034】(字画の分割)文字の正規化を介して字画
データが正規化されると、ステップ52が示すように、
ペンダウン及びペンアップ情報に従ってまず字画を分類
することにより、字画の分割が始まる。入力される字画
データ40が取り込まれると、着信する点のペンダウン
及びペンアップ情報及び時間的順序が取得される。着信
ポイントは、ペンダウンポイントで始まり、ペンアップ
ポイントで終わる最初の字画に分類される。次に本シス
テムは、ステップ54が示すように、これらの最初の字
画をさらに小さな字画に細分する。このさらなる分割
は、最初の字画をy値の極小及び極大及びx値の極小で
遮断することにより実行される。私達はこれらの分断点
を「内部ブレークポイント」と称し、最初の字画のペン
ダウン及びペンアップポイントと区別している。
【0035】数学的な極小ポイントまたは極大ポイント
は、時として人の目に直ぐには明白でないことがある。
しかしながら、これらはデータとしては存在する。私達
はこれらのポイントを、「曖昧な」ブレークポイントと
呼んでいる。本好適な実施形態は、ステップ56で曖昧
なブレークポイントを除去する。曖昧なブレークポイン
トの除去工程は、曖昧なブレークポイントを以下のよう
に定義している。即ち、pn-i,...,pn-1,pn
n+1,...,pn+jをその時間的順序で表した連続す
る着信ポイントと仮定し、pn-i、pn及びpn+jをブレ
ークポイント、pnをそのy値の極小故の内部ブレーク
ポイントとする。pnが「曖昧」であるかどうかを確認
するため、以下のようにdy1を「暫定字画」
n-i,...,pnの2つの連続するポイントのy値に
おける平均差と定義し、dy2を暫定字画pn,...,
n+jの場合の平均差とする。 内部ブレークポイントが明白であるためには、dy1
びdy2の絶対値は比較的大きいことが好適である。d
1及びdy2は通常反対方向にあることから、下記の規
則が採用される。即ち、│dy1−dy2│≦Tであれ
ば、pnは曖昧な内部ブレークポイントである。故に、
これは除去されなければならない。Tは限界値であり、
現在は0.5に設定されている。曖昧なx最小及びy最
大ブレークポイントの除去手順は、類似している。
【0036】曖昧なブレークポイントが除去された後、
ステップ58では任意の接続字画が同定され、除去され
る。接続字画は、手書きされた漢字においては極めて一
般的である。接続字画は、印刷される手書き文字の場合
には基準文字の一部ではない字画のことである。筆記体
の手書きの場合、2つの分離された字画が余分の字画、
即ち接続字画によって接続されることがある。
【0037】接続字画は、字画データを調査して当該字
画の方向を査定することにより検出される。その字画が
右下から左上に伸びるものであれば、これは接続字画で
ある可能性が高い。
【0038】実際には、手書きされた文字に接続字画が
必ず現出するとは限らない。むしろ余分の接続字画は、
文字が形成される際のスタイラスの速度及び方向に影響
される傾向が強い。例えばあるユーザは、通常は接続字
画が一切ない、きちんとした印刷形式で文字を書くこと
ができる。但し、同ユーザが急いでいるときには、接続
字画が現れることがある。
【0039】本好適な字画除去技術は、下記の規則を使
用して接続字画を検出し、除去する。即ち、ey−sy
1及びex−sx≦1であれば、これは接続字画である。
【0040】上式の(sx,sy)及び(ex,ey)は各
々、分割された字画の開始ポイント及び終了ポイントで
あり、原点(0,0)はディジタイズ用タブレットまた
は取込み用デバイスの左上の角に位置づけられている。
【0041】上述の字画分割工程が完了すると、次に
は、ステップ60に表示されているように動的プログラ
ミングを実行することができる。本好適な実施形態の動
的プログラミング手順は、図4に詳述されている。
【0042】(動的プログラミング)動的プログラミン
グの目的は、参照部首及び問題の文字等の2つの部分を
整合させることにある。整合処理は字画レベルで実行さ
れるため、その結果は、2つの筆跡の間の最良の字画関
係または整合であり、この整合に関するコストが計算さ
れる。動的プログラミングは字画レベルで行われるた
め、本好適な実施形態では、字画オペレーション(字画
の挿入、字画の削除または字画の置換)がまず計算され
る。
【0043】本好適な実施形態は、62が示すように、
ポイントレベルのデータを使用して字画オペレーション
のコストを計算する。これは、字画の挿入コスト及び削
除コストが字画の長さに比例する方向に計算され、置換
コストが形状の類似性を基礎として計算される従来の方
法とは異なる。これに対して、本好適な実施形態は各字
画を連続するポイントシーケンスとして捉え、動的プロ
グラミングはそのポイントレベルで実行され、2つのポ
イントシーケンスが完全に整合される。ポイントレベル
の計算は、挿入64、削除66及び置換68の基本的オ
ペレーションを含んでいる。本好適な実施形態における
置換コスト査定は、接ベクトル方法論70、センター関
係査定72及び開始ポイント−終了ポイント査定74を
含む多数の改良された技術を使用している。これらにつ
いては後述するが、これらの改良された技術に関する論
議に進む前に、従来の置換コスト測定における短所を示
す図5を参照する。
【0044】従来の置換コスト測定では、aにおける字
画s1及びbにおける字画s2等の2つの字画間の形状類
似性査定は、まずcにおけるように、2つの字画をそれ
らの左上の角(またはそれらの各々の有界ボックスの左
上の角)が重なるように時間的に合わせることによって
実行される。c1で示されているように、両字画をそれ
らの上側最左端で合わせると、両字画は上側最左部分を
除けば基本的に相似しているという事実にも関わらず、
両字画の残りの部分は比較的大きなユークリッド距離で
離れて存在する。これはエラーの累積を招き、置換コス
トは、そうでなければ全体的な形状によって指示される
ものと思われる値よりも高い値で評価される。
【0045】図6は、本発明の好適な実施形態による置
換コストの査定方法を示したものである。図6では、2
つの字画の対応するポイントを以下のように定義してい
る。即ち、s1をl1個のポイントを有する字画、s2
2個のポイントを有する字画であるとする。Piはs1
上におけるi番目のポイントであり、Piの字画s2上の
対応するポイントはPjである。但し、 である。次に、2つの対応するポイントP及びPj
置換を以下のように計算する。 (ポイント置換コスト) 但し、ViはポイントPiにおける接ベクトル、VjはPj
における接ベクトル、θ(Vi,Vj)は2つのベクトル
間の角度であり、θ∈[0,π]である。
【0046】cosθ(Vi,Vj)は、以下のように計
算することができる。 但し、(x1,y1)及び(x2,y2)は各々Viの開始
ポイント及び終了ポイントであり、(x3,y3)及び
(x4,y4)は各々Vjの開始ポイント及び終了ポイン
トである。
【0047】上記式から分かるように、θ(Vi,Vj
が大きいほど、ポイント置換コスト(Vi,Vj)の値は
大きい。2つの対応するポイントの置換はそれらのユー
クリッド距離を反映しないが、これらの対応するポイン
トにおける2字画間の「瞬間」形状の差を反映する。
【0048】字画s1に沿った全ポイントのポイント置
換コストを合計すると、以下のように字画s1及びs2
の置換コストを取得することができる。 但し、l1は字画s1の長さである。
【0049】以下のように、この字画置換コストをさら
なる正規化によって修正してみる。 但し、項 は2つの字画間の平均長を反映し、最大 は字画サイズの差を反映しており、字画サイズの差が大
きいほど、置換コストは大きくなる。
【0050】正規化の後は、ほぼ以下のような式が得ら
れるはずである。 (字画置換コスト) 新規字画置換コストは、幾つかの欠点を克服することが
できる。第1に、対応するポイントを発見することによ
り、ポイント置換コストの計算における動的プログラミ
ング手順を排除することができる。第2に、図6が示す
ように、接ベクトルを使用する置換コストの計算は蓄積
効果を保有しない。
【0051】先に概説した置換コストを査定する接ベク
トル法は、字画の構造情報を考慮することなくその整合
を可能にする。性能をさらに向上させるためには、字画
のセンター関係及びそれらの開始ポイント及び終了ポイ
ントの査定を通じて字画の構造関係を査定することがで
きる。
【0052】ユーザが漢字を形成する場合、文字内の字
画は構造上の関係性(即ち、字画間の空間関係)におい
て配置される。構造関係の査定に際しては、一画の加重
されたセンターが計算され、当該字画の位置の表示に使
用される。構造情報は、図7が示すように、2つの字画
センター間の空間関係に反映されることが可能である。
2つの字画が整合され、かつそれらの置換コストが計算
される前に、本システムはまず、既に整合された、もし
くは置換された最終の2字画を調べる。図7を参照する
と、最終の整合された2字画は、ri(参照部首の
目の字画)及びcj(当該文字のj番目の字画)であ
る。本システムは次に、rm及びcnを整合させる。
【0053】pi、pj、pm、pnを各々、ri、cj、r
m、cnの加重されたセンターとする。ベクトルpi
mは、2字画ri及びrm間の空間関係を反映することが
できる。同様に、ベクトルpjnは、cj及びcn間の空
間関係を反映することができる。rmをcnに整合させよ
うとする場合には、rm及びcnは形状が類似していなけ
ればならないだけでなく、先行して整合された字画(即
ち、各々ri及びcj)に対するそれらの空間関係も類似
していなければならない。言い替えれば、ベクトルpi
m及びベクトルpjn間の角度は小さくなければなら
ない。
【0054】私達の判断基準は、以下のようなものであ
る。即ち、 であれば、rm及びcnは整合されない。θTは限界値で
あり、現在はπ/2に設定されている。動的プログラミ
ングにおいては、検査対象である2字画が整合しないと
決定されれば、置換コストは超高値に設定され、よって
置換は発生しない。そうでなければ、上述の方法を使用
して字画置換コストの計算に取りかかる。
【0055】但し、pi=pmまたはpj=pnであれば、
結果的に生じるゼロ長ベクトルの方向は意味を持たない
ので例外である。従ってこの場合は、上述の基準は無視
され、置換コストが計算される。
【0056】本好適な実施形態はまた、置換コストの計
算において開始ポイント及び終了ポイントを査定する。
本システムは、まず整合された、或いは置換された最終
の2字画を調べることによって、2字画の整合の可能性
について精査する。一画の開始ポイント及び次の一画の
終了ポイントは、整合される両字画の比較基準である角
度を確定するベクトルの限定に使用される。この手順
は、図8を参照すれば理解することができる。
【0057】図8が示すように、最終に整合された2字
画をri(当該部首のi番目の字画)及びcj(当該文字
のj番目の字画)とする。調査対象の2字画は、rm
びc nである。ei及びejを各々、字画ri及びcjの終
了ポイントとする。sm及びs nを各々、字画rm及びcn
の開始ポイントとする。ベクトルeimは、2字画ri
及びrm間の空間関係を反映している。同様に、ベクト
ルejnは、字画cj及びcn間の空間関係を反映してい
る。字画rmを字画cnに整合させようとする場合には、
m及びcnは形状が類似していなければならないだけで
なく、先行して整合された字画(即ち、各々ri及び
j)に対するそれらの空間関係も類似していなければ
ならない。言い替えれば、ベクトルeim及びベクトル
jn間の角度は小さくなければならない。
【0058】私達の判断基準は、以下のようなものであ
る。即ち、 であれば、rm及びcnは整合されない。θTは限界値で
あり、現在はπ/2に設定されている。センターポイン
トベクトルと同様に、動的プログラミングにおいては、
検査対象である2字画が整合しないと決定されれば、置
換コストは超高値に設定され、よって置換は発生しな
い。そうでなければ、上述の方法を使用して字画置換コ
ストの計算に取りかかる。
【0059】この場合もやはり、連続する2字画が接続
されている場合には、第1の字画の終了ポイントが第2
の字画の開始ポイントとなってしまう、即ちei=sm
たはej=snとなることがある。この場合は、上述の基
準は無視され、置換コストが計算される。
【0060】上述のように挿入コスト、削除コスト及び
置換コストが計算されると、76で動的プログラミング
整合が実行される。本好適な実施形態における動的プロ
グラミング整合は、部首を2つの主要な分類区分に分類
する部首分類手順78によって改良されている。第1の
の分類区分では、部首が文字の最初の数画を開始する。
第2の分類区分では、部首が当該文字の最後の数画を終
了する。
【0061】部首が属する分類区分は通常、予め周知で
ある。本好適な動的プログラミング整合工程では、この
分類区分情報が強化されている。参照部首がある文字に
整合される場合、当該文字内の整合された字画がその部
首について予想される分類区分に当てはまらなければ、
さらなるコストが加算される。本好適な実施について
は、以下の動的プログラミング手順を通じて説明するこ
とができる。
【0062】これまで、動的プログラミングは、参照部
首R=r12,...,rmをある文字の部分列C=c
12,...,cmに整合させるために使用されている。この
工程では、各オペレーションコストに依存して挿入、削
除または置換の3つのオペレーションが発生する可能性
がある。最終目標は、最小の合計コストで最適なオペレ
ーション列を発見することである。例えば一例として、
r=r1234を4画より成る参照部首とし、C=c
123,...,c8を8画より成る整合部首とする。Rを
Cの部分列、即ちc’=c=c3456に変換するた
めの可能な1つのオペレーションシーケンスは、表1が
示すように、c1を挿入し、c2を挿入し、r1をc3で置
換し、r2をc4で置換し、c5を挿入し、r3をc6で置
換し、r4を削除する、というものが考えられる。
【0063】
【表1】
【0064】原初の動的プログラミング手順では、整合
を字画シーケンスC内の任意場所で開始させ、終了させ
ることができる。上述の例では、実際の整合はr1とc3
との置換に始まり、r4の削除で終了する。従って、合
計コストは、r1のc3による置換、r2のr4による置
換、c5の挿入、r3のc6による置換及びr4の削除の和
であり、c1の挿入及びc2の挿入は考慮されない。
【0065】部首の分類区分を考慮する場合、第1の分
類区分における、文字の最初の数画に整合しない部首、
または第2の分類区分における、文字の最後の数画に整
合しない部首への罰金の付加を試行する。これを行うた
めに、動的プログラミング手順を、第1の分類区分に属
する部首の場合は整合文字の第一画で開始し任意場所で
終了する整合を可能にするように、また第2の分類区分
に属する部首の場合は文字内の任意場所で開始し最終画
で終了する整合を可能にするように修正する。表1の場
合、合計コストは、c1の挿入、c2の挿入、r1のc3
よる置換、r2のr4による置換、c5の挿入、r3のc6
による置換及びr4の削除の和となる。以上から分かる
ように、置換はCの第一画では始まらないため、整合は
1の挿入及びc2の挿入によって罰されている。以前の
ように、第1の分類区分に属する部首では、動的プログ
ラミングは文字内の任意場所で終了することができる。
【0066】同様に、第2の分類区分に属する部首Rの
場合、これはCの最終字画であるc mにおいて終了する
Cの部分列に整合することが予測される。ある可能なオ
ペレーションシーケンスは、例えば表2が示すような、
1の挿入、C2の挿入、r1のC3による置換、r2のr4
による置換、C5の挿入、r3のC6による置換、r4の削
除、C7の挿入及びC8の挿入であることが可能である。
【0067】
【表2】
【0068】この場合、最初の2つの挿入オペレーショ
ン(C1の挿入及びC2の挿入)は、整合が当該文字の任
意場所で開始できるために、ゼロコストで行われなけれ
ばならない。但し、最後の2つの挿入オペレーション
(C7の挿入及びC8の挿入)のコストは無視されてはな
らない。
【0069】動的プログラミング整合ステップ76は、
参照部首を文字の一部に整合させるための動的プログラ
ミング合計コストを作成する。合計コストは、全てのオ
ペレーションコスト(挿入、削除及び置換)の和であ
る。従って、各文字について全ての参照部首が当該文字
との整合を試行されると、より少ない字画を有する部首
がより低い動的プログラミングコストを生み出す傾向が
ある。これは異常な結果を導く可能性がある。これを解
決するため、本好適な実施形態は、ステップ80が指示
するように、参照部首82の長さを使用して動的プログ
ラミングコストを正規化する。動的プログラミングコス
トの正規化は、より少ない字画を有する部首が保有しが
ちな固有の便益を除去し、結果としてより強力な部首抽
出手順が得られる。
【0070】2つの部首(参照部首と試験部首等)の位
置の相似性は、部首抽出スキームにおいて利用可能な幾
分かのコース情報である。ステップ84が示すように、
本好適な実施形態は、部首を精選するための基礎として
位置の相似性を使用し、位置の異なる部首を除去する。
各文字に関して、本除去工程は、動的プログラミングを
基礎とする弾力的な整合の全参照部首への適用が含まれ
る。次いで本手順は、参照部首と当該文字との整合され
た字画の位置の相似性を計算する。否定的な位置の相似
性を有する部首が除去されると、残りの部首に対する動
的プログラミングコストがランク付けされ、最小コスト
を有する上位2つの部首が当該文字の抽出された部首と
して選ばれる。図示されている通り、ランキングステッ
プ86と非相似性除去ステップ84が、全参照部首につ
いて繰り返される。従って、本手順の最終結果は、88
が示す抽出された1つまたは複数の部首を表す。
【0071】(部首コードの評価)各文字について部首
が抽出されると、文字列は部首コード、即ち部首IDの
シーケンスとなる。2つの文字列が比較される場合、整
合は部首コードレベルの動的プログラミングを介して行
われる。これは、手書きのものと整合される手書き(即
ち、手書きデータベース対手書きの問合せ)、及びタイ
プされたテキストと整合される手書き(即ち、手書きデ
ータベース対タイプテキストの問合せ)の両方に適用さ
れる。タイプされた問合せの場合、これらは即座に部首
コードに変換され、部首コードのデータベース列と比較
されることが可能である。
【0072】2つの文字列を整合させるための動的プロ
グラミングにおいては、文字の挿入、文字の削除及び文
字の置換の3つのオペレーションが定義されており、各
々にオペレーションコストが付随している。その目的
は、問合せ列の部首コードをデータ列の部首コードに変
換することにある。動的プログラミングの使用により、
本システムは、最小の編集距離(最小の合計オペレーシ
ョンコスト)を達成する最適整合シーケンスを取得す
る。
【0073】文字の挿入コスト及び削除コストは、定数
として指定される。文字の置換コストは、2文字(各文
字につき2コード、即ち4つの部首コード)間の差を反
映する。文字の置換は、1つの文字における部首コード
が他方の文字内には発見されないことの発生数として定
義される。文字が抽出される部首コードを保有していな
ければ、当該文字は2つのヌル部首コード(IDゼロを
有するコード)で表示され、置換コストも同様に計算さ
れる。
【0074】所望されれば、ヌル部首コードは以下のよ
うに修正することができる。各文字は2つの抽出された
部首を有し、よって各文字は部首IDに対応する2つの
数字で表示されることが可能である。抽出される部首が
なければ、その部首コードはヌルであり、部首IDはゼ
ロである。ある実施形態では、文字の置換は、不整合の
部首コードまたは非抽出部首コードの場合と同様に計算
される。但し所望されれば、非抽出部首コードには、不
整合の部首コードよりも過酷な罰を課すことができる。
【0075】さらに、先のアルゴリズムから分かるよう
に、抽出された各部首は同等に処理される。特に、2つ
の部首コードが同一である場合には、これらは置換コス
トに何ら寄与しない。この方法は、部首コードにおける
整合を促進するが、より低い部首抽出コストを有する、
即ちより信頼度の高い抽出された部首を有する部首コー
ドにおける整合には益さない。各部首コードが部首抽出
工程において取得されると、動的プログラミングコスト
がこれに付随する。本新規方法は、先行する部首抽出か
らのこの動的プログラミングコストを置換コストの計算
に付随させるように提案している。共に高い信頼度(部
首抽出コストが低い)を有する2つの部首コードが整合
すれば、それらの置換コストは、低い信頼度を有する2
つの部首コードの置換コストよりも低くなるはずであ
る。これらの方法を組み合わせて、私達の新規文字置換
コストを以下のように説明する。
【0076】2つの文字C1=a1,a2、及びC2=b1,
2を比較してみる。但し、a12はC1から抽出された
部首であり、b12はC2から抽出された部首である。
また、dpCOST_b1、dpCOST_b2、dp
COST_a1、dpCOST_a2は各々字画レベル
の動的プログラミングコスト、即ちb1、b2、a1及び
2の部首抽出コストである。これらの2文字の置換コ
ストは、以下のようになる。 但し、COST(b1;a1,a2)はb1の置換コスト、即
ち、 また、COST(b2;a1,a2)はb2の置換コスト、即
ち、 但し、csub_maxは、(a12)及び(b12)が完全
に相違する最悪の場合の置換コストを表す指定された定
数である。経験上、dpCOST_xは常に任意の字画
xのcsub_max未満である。
【0077】部首コードに整合が存在する(例えばb1
=a2)場合は常に、COST(b1;a1,a2)及びCO
ST(b2;a1,a2)はcsub_max/2未満となり、最終
的な置換コストはcsub_max未満となる。
【0078】(参照部首)実用的な実施形態を構築する
際には、参照部首は、全体的な意味論的整合工程を向上
させるという視点で選択されなければならない。参照部
首の選択は、部首抽出工程に直接影響する。一般に、正
しく抽出される部首の数が多いほど、最終的な整合率は
高くなる。正しく抽出される部首の数を増大させる1つ
の方法は、参照部首の数を増やすことである。その結
果、より多くの部首が抽出される。但し、参照部首のデ
ータベースが増大すると、参照部首を訓練する時間が長
くなり、参照部首を抽出する時間も長くなる。従って、
適正数の部首の選択は、処理時間と整合率とを天秤に掛
けることになる。
【0079】部首の選択において考慮すべき他の事項に
は、部首間の類似性が含まれる。類似する部首を1つの
訓練セットに纏めて入れると、混乱が生じる可能性があ
る。また部首によっては、単に異なる書き方が多くあり
過ぎるという理由で抽出がより困難なものがある。混乱
を引き起こしそうな部首及び多くの異なる方法で書くこ
とが可能な部首は、部首の抽出に使用される参照部首か
らは排除されることが最良である。図9は、漢字認識シ
ステムを実行する際に使用される本好適な部首を描いた
ものである。図示されている最初の参照部首45個は、
普通に使用されている約2000の漢字に最もよく現れ
るものである。これらの文字は、手書きの漢字において
必ずしも同じ頻度では現れないため、このセットは、デ
ータベース列における最も使用頻度の高い部首から選択
された追加の部首12個で補足されている。実用的な実
施形態を設計する際には、これらの参照部首を使用して
初期の実施形態を構築することができる。その後は、シ
ステムの使用に伴なって、使用頻度統計に基づく幾つか
の追加部首を同定し、参照部首のデータセットに追加す
ることができる。
【0080】以上の説明に鑑みて、上述の部首抽出技術
は、単独使用、または全体的な意味論的整合工程を向上
させる組合せ使用の何れも可能であることは理解される
であろう。本発明について現時点で好適な形態において
説明してきたが、添付の請求の範囲に記載された本発明
の精神から逸脱することなく所定の修正を行えることは
理解されるであろう。
【図面の簡単な説明】
【図1】部首識別過程の所定の態様の理解に役立つ、機
械印刷および手書き形状の典型的な漢字を示す図であ
る。
【図2】手書きの漢字の注釈用の意味的インク整合シス
テムの概略を示すブロック図である。
【図3】好ましい実施例の部首抽出過程を示すフローチ
ャート図である。
【図4】好ましい実施例の部首抽出過程を示すフローチ
ャート図である。
【図5】既存の形状類似性評価の欠点の一つを示す部首
整合図である。
【図6】好ましい実施例の接線ベクトル技術を示す部首
整合図である。
【図7】中心関係技術を示す部首整合図である。
【図8】始点終点評価を示す部首整合図である。
【図9】現時点での好ましい組の部首を示す図である。
【符号の説明】
(22)データベースインク (24)従来の伸縮整合 (26)分割 (28)分割 (30)部首抽出(弾力的整合) (32)部首抽出(弾力的整合) (34)参照部首 (36)部首コード評価ブロック (38)部首コード評価ブロック (40)字画データの入力 (42)文字の規格化 (44)枠の規格化 (47)画素の移動 (50)画の分割 (52)上下情報による画のグループ化 (54)x最小、y最小、y最大のさらなる分割 (56)不明瞭な切れ目の除去 (58)除去する接続画の識別 (60)動的計画法 (62)点レベルのデータを用いた画の操作のコスト計
算 (70)接線ベクトル法 (72)センタ−関係査定 (74)開始ポイント−終了ポイント査定 (76)動的計画法の整合 (78)部首の分類 (80)動的計画法のコストの規格化 (82)参照部首の長さの使用 (84)非相似性除去 (86)動的計画法のコストのランクキング (88)抽出した部首の出力
───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.7 識別記号 FI テーマコート゛(参考) G06F 17/22 506 G06F 17/22 506A 508 508E // G06F 17/30 170 17/30 170Z

Claims (51)

    【特許請求の範囲】
  1. 【請求項1】草書体の手書き注釈を検索する方法であっ
    て、 注釈の辞書を格納し、 前記注釈の意味的に重要な部分に対応する複数の部首を
    格納し、 検索されるべき手書き注釈を入力し、 まず前記入力した手書き注釈を規格化し、次に前記手書
    き注釈の一部を識別して、抽出した部首を表現すること
    によって、前記入力した手書き注釈から少なくとも一つ
    の部首を抽出し、 前記抽出した部首と前記格納した複数の部首の間で評価
    操作を実行して、少なくとも一つの部首候補を識別し、 前記部首候補を用いて、前記辞書の一部を選択し、 前記入力した手書き注釈と前記一部の間で整合操作を実
    行して、前記辞書から注釈を検索する方法。
  2. 【請求項2】前記規格化段階が、複数の点として前記手
    書き注釈を表現し、入力した手書き注釈が所定の大きさ
    に対応するように、前記点の間の間隔を伸縮することに
    よって行われる請求項1記載の方法。
  3. 【請求項3】前記抽出段階が、前記入力した手書き注釈
    内の複数の画を識別し、前記複数の画に関する上下情報
    に基づいて、前記複数の画を編成することによって行わ
    れる請求項1記載の方法。
  4. 【請求項4】前記抽出段階が、前記入力した手書き注釈
    内の複数の画を識別し、前記複数の画内の局所的な最大
    点と最小点に基づいて、前記複数の画を編成することに
    よって行われる請求項1記載の方法。
  5. 【請求項5】さらに、選択した局所的な最大点と最小点
    を選択的に取り除く請求項4記載の方法。
  6. 【請求項6】前記抽出段階が、前記入力した手書き注釈
    内の接続している画を識別し、前記接続している画を取
    り除くことによって行われる請求項1記載の方法。
  7. 【請求項7】前記評価段階が、前記抽出した部首と前記
    格納した複数の部首の両方を、一連の接触した点として
    表現し、前記各々の一連の接触した点上で、動的計画法
    の整合を実行することによって行われる請求項1記載の
    方法。
  8. 【請求項8】前記評価操作が、整合の接近度を示す少な
    くとも一つの計画コストの距離を得る動的計画法の整合
    操作を含む請求項1記載の方法。
  9. 【請求項9】さらに、参照部首の長さを決定し、前記参
    照部首の長さに対して、前記計画コストの距離を規格化
    する請求項8記載の方法。
  10. 【請求項10】前記評価操作が、始点および終点に基づ
    いて部首を分類する段階を有する、動的計画法の整合操
    作を含む請求項1記載の方法。
  11. 【請求項11】前記評価操作が、前記抽出した部首と、
    前記格納した複数の部首に関する接線ベクトルを比較す
    ることによって、置換コストを計算する段階を有する動
    的計画法の整合操作を含む請求項1記載の方法。
  12. 【請求項12】前記評価操作が、前記抽出した部首の中
    心と前記格納した複数の部首の中心の間の関係を評価す
    る段階を有する、動的計画法の整合操作を含む請求項1
    記載の方法。
  13. 【請求項13】前記評価操作が、前記抽出した部首と前
    記格納した複数の部首の始点および終点を評価する段階
    を有する、動的計画法の整合操作を含む請求項1記載の
    方法。
  14. 【請求項14】前記評価操作が、前記抽出した部首内の
    画と前記複数の部首内の画を比較し、負の位置の類似性
    を備えた前記部首候補を取り除く段階を有する請求項1
    記載の方法。
  15. 【請求項15】前記評価操作が、複数の抽出した部首候
    補を生成し、動的計画法のコストに基づいて前記候補に
    ランクを付ける段階を有する請求項1記載の方法。
  16. 【請求項16】草書体の手書き注釈を検索する方法であ
    って、 注釈の辞書を格納し、 前記注釈の意味的に重要な部分に対応する複数の部首を
    格納し、 検索されるべき手書き注釈を入力し、 画の始点および終点情報を用いて、前記手書き注釈内の
    各々の画を識別して、さらに局所的な最大点と最小点に
    基づいて前記各々の画を分割し、前記分割した各々の画
    を用いて前記抽出した部首を表現し、 前記抽出した部首と前記格納した複数の部首の間で評価
    操作を実行して、少なくとも一つの部首候補を選択し、 前記部首候補を用いて、前記辞書の一部を選択し、 前記入力した手書き注釈と前記一部の間で整合操作を実
    行して、前記辞書から注釈を検索する方法。
  17. 【請求項17】さらに、選択した局所的な最大点と最小
    点を選択的に取り除く請求項16記載の方法。
  18. 【請求項18】前記抽出段階が、前記入力した手書き注
    釈内の接続している画を識別し、前記接続している画を
    取り除くことによって行われる請求項16記載の方法。
  19. 【請求項19】前記評価段階が、前記抽出した部首と前
    記格納した複数の部首の両方を、一連の接触した点とし
    て表現し、前記各々の一連の接触した点上で、動的計画
    法の整合を実行することによって行われる請求項16記
    載の方法。
  20. 【請求項20】前記評価操作が、整合の接近度を示す少
    なくとも一つの計画コストの距離を得る動的計画法の整
    合操作である請求項16記載の方法。
  21. 【請求項21】さらに、参照部首の長さを決定し、前記
    参照部首の長さに対して、前記計画コストの距離を規格
    化する請求項20記載の方法。
  22. 【請求項22】前記評価操作が、始点および終点に基づ
    いて部首を分類する段階を有する、動的計画法の整合操
    作である請求項16記載の方法。
  23. 【請求項23】前記評価操作が、前記抽出した部首と、
    前記格納した複数の部首に関する接線ベクトルを比較す
    ることによって、置換コストを計算する段階を有する動
    的計画法の整合操作である請求項16記載の方法。
  24. 【請求項24】前記評価操作が、前記抽出した部首の中
    心と前記格納した複数の部首の中心の間の関係を評価す
    る段階を有する、動的計画法の整合操作である請求項1
    6記載の方法。
  25. 【請求項25】前記評価操作が、前記抽出した部首と前
    記格納した複数の部首の始点および終点を評価する段階
    を有する、動的計画法の整合操作である請求項16記載
    の方法。
  26. 【請求項26】前記評価操作が、前記抽出した部首内の
    画と前記複数の部首内の画を比較し、負の位置の類似性
    を備えた前記部首候補を取り除く段階を有する請求項1
    6記載の方法。
  27. 【請求項27】前記評価操作が、複数の抽出した部首候
    補を生成し、動的計画法のコストに基づいて前記候補に
    ランクを付ける段階を有する請求項16記載の方法。
  28. 【請求項28】草書体の手書き注釈から部首を抽出する
    方法であって、 検索されるべき手書き注釈を入力し、 まず前記入力した手書き注釈を規格化し、次に前記手書
    き注釈の一部を識別して、抽出した部首を表現すること
    によって、前記入力した手書き注釈から少なくとも一つ
    の部首を抽出する方法。
  29. 【請求項29】前記規格化段階が、複数の点として前記
    手書き注釈を表現し、入力した手書き注釈が所定の大き
    さに対応するように、前記点の間の間隔を伸縮すること
    によって行われる請求項28記載の方法。
  30. 【請求項30】前記抽出段階が、前記入力した手書き注
    釈内の複数の画を識別し、前記複数の画に関する上下情
    報に基づいて、前記複数の画を編成することによって行
    われる請求項28記載の方法。
  31. 【請求項31】前記抽出段階が、前記入力した手書き注
    釈内の複数の画を識別し、前記複数の画内の局所的な最
    大点と最小点に基づいて、前記複数の画を編成すること
    によって行われる請求項28記載の方法。
  32. 【請求項32】さらに、選択した局所的な最大点と最小
    点を選択的に取り除く請求項31記載の方法。
  33. 【請求項33】前記抽出段階が、前記入力した手書き注
    釈内の接続している画を識別し、前記接続している画を
    取り除くことによって行われる請求項28記載の方法。
  34. 【請求項34】草書体の手書き注釈から部首を抽出する
    方法であって、 検索されるべき手書き注釈を入力し、 画の始点および終点情報を用いて、前記手書き注釈内の
    各々の画を識別し、さらに局所的な最大点と最小点に基
    づいて前記各々の画を分割し、前記分割した各々の画を
    用いて、前記抽出した部首を表現することによって、前
    記入力した手書き注釈から少なくとも一つの部首を抽出
    する方法。
  35. 【請求項35】さらに、選択した局所的な最大点と最小
    点を選択的に取り除く請求項34記載の方法。
  36. 【請求項36】前記抽出段階が、前記入力した手書き注
    釈内の接続している画を識別し、前記接続している画を
    取り除くことによって行われる請求項34記載の方法。
  37. 【請求項37】手書き注釈を整合する動的計画法の手続
    きにおいて、画の置換コストを決定する改良された方法
    であって、 比較されるべき複数の画を識別し、 比較する各々の画に接線ベクトルを割り当て、 置換コストを前記ベクトル間の関係に基づくものとする
    方法。
  38. 【請求項38】手書き注釈を整合する動的計画法の手続
    きにおいて、画の置換コストを決定する改良された方法
    であって、 比較されるべき複数の画を識別し、 比較する各々の画に関する重心を決定し、 置換コストを前記重心間の関係に基づくものとする方
    法。
  39. 【請求項39】手書き注釈を整合する動的計画法の手続
    きにおいて、画の置換コストを決定する改良された方法
    であって、 比較されるべき複数の画を識別し、 整合操作を実行して一対の画を識別し、 前記複数の画の始点および終点の関係を用いて、置換コ
    ストを計算する方法。
  40. 【請求項40】請求項34記載の草書体の手書き注釈を
    検索する方法であって、さらに、 入力した注釈を使用者から受け取り、 注釈の辞書を格納し、 前記抽出した部首を用いて前記辞書の一部を選択し、 前記入力した手書き注釈と前記一部の間で整合操作を実
    行して、前記辞書から注釈を検索する方法。
  41. 【請求項41】草書体の手書き注釈を検索する方法であ
    って、 注釈の辞書を格納し、 前記注釈の意味的に重要な部分に対応する複数の部首を
    抽出し、 検索されるべき手書き注釈を入力し、 前記入力した手書き注釈から少なくとも一つの部首を抽
    出し、 前記抽出した部首と前記格納した複数の部首の間で評価
    操作を実行して、少なくとも一つの部首候補を識別し、 前記部首候補を用いて前記辞書の一部を選択し、 前記入力した手書き注釈と前記一部の間で整合操作を実
    行して、前記辞書から注釈を検索する方法。
  42. 【請求項42】草書体の手書き注釈を検索する方法であ
    って、 注釈の辞書を格納し、 前記注釈の意味的に重要な部分に対応する複数の部首を
    格納し、 検索されるべき手書き注釈を入力し、 前記手書き部首内の各々の画を識別し、前記各々の画と
    前記格納した複数の部首の各々に接線ベクトルを割り当
    て、置換コストの計算において前記接線ベクトル間の関
    係を用い、前記各々の画と前記格納した複数の部首の間
    で動的計画法を実行して、置換コストの計算において前
    記割り当てた接線ベクトルを用いることによって、前記
    入力した手書き注釈から少なくとも一つの部首を抽出
    し、前記抽出した部首と前記格納した複数の部首の間で
    評価操作を実行して、少なくとも一つの部首候補を識別
    し、 前記部首候補を用いて前記辞書の一部を選択し、 前記入力した手書き注釈と前記一部の間で整合操作を実
    行して、前記辞書から注釈を検索する方法。
  43. 【請求項43】接線ベクトルの前記割り当てにおいて、 少なくとも一対の点の第一点を前記各々の画から、前記
    一対の点の第二点を前記格納した複数の部首から見出
    し、 前記各々の画の第一接線ベクトルを前記一対の点の前記
    第一点で、前記格納した複数の部首の第二接線ベクトル
    を前記一対の点の前記第二点で計算する請求項42記載
    の方法。
  44. 【請求項44】前記関係が、前記第一接線ベクトルと前
    記第二接線ベクトルの間の角度である請求項42記載の
    方法。
  45. 【請求項45】草書体の手書き注釈を検索する方法であ
    って、 注釈の辞書を格納し、 前記注釈の意味的に重要な部分に対応する複数の部首を
    格納し、 検索されるべき手書き注釈を入力し、 前記手書き部首内の各々の画を識別し、前記各々の画と
    前記格納した複数の部首に関する重心情報を決定し、そ
    の重心情報内の関係を用いて、置換コストを計算し、 前記抽出した部首と前記格納した複数の部首の間で評価
    操作を実行して、少なくとも一つの部首候補を識別し、 前記部首候補を用いて前記辞書の一部を選択し、 前記入力した手書き注釈と前記一部の間で整合操作を実
    行して、前記辞書から注釈を検索する方法。
  46. 【請求項46】前記重心情報を決定する段階で、 前記
    各々の画から第一の対の画を識別し、 前記格納した複数の部首から第二の対の画を識別し、第
    一画が前記第一の対の画の第一画に対応し、第二画が前
    記第一の対の画の第二画に対応し、 前記第一の対の画の重心間で第一ベクトルを構成し、 前記第二の対の画の重心間で第二ベクトルを構成する請
    求項45記載の方法。
  47. 【請求項47】前記関係が、前記第一ベクトルと前記第
    二ベクトルの間の角度である請求項45記載の方法。
  48. 【請求項48】草書体の手書き注釈を検索する方法であ
    って、 注釈の辞書を格納し、 前記注釈の意味的に重要な部分に対応する複数の部首を
    格納し、 検索されるべき手書き注釈を入力し、 前記手書き部首内の各々の画を識別し、前記各々の画と
    前記格納した複数の部首に関する始点および終点情報を
    決定し、その始点および終点情報内の関係を用いて、置
    換コストを計算し、 前記抽出した部首と前記格納した複数の部首の間で評価
    操作を実行して、少なくとも一つの部首候補を識別し、 前記部首候補を用いて前記辞書の一部を選択し、 前記入力した手書き注釈と前記一部の間で整合操作を実
    行して、前記辞書から注釈を検索する方法。
  49. 【請求項49】前記始点および終点情報の決定におい
    て、 前記各々の画から第一の対の画を識別し、 前記格納した複数の部首から第二の対の画を識別し、第
    一画が前記第一の対の画の第一画に対応し、第二画が前
    記第一の対の画の第二画に対応し、 前記第一の対の画の第一画の終点と、前記第一の対の画
    の第二画の始点の間で第一ベクトルを構成し、 前記第二の対の画の第一画の終点と、前記第二の対の画
    の第二画の始点の間で第二ベクトルを構成する請求項4
    8記載の方法。
  50. 【請求項50】前記関係が、前記第一ベクトルと前記第
    二ベクトルの間の角度である請求項48記載の方法。
  51. 【請求項51】手書き注釈を整合する動的計画法の手続
    きにおいて、前記注釈内に含まれる部首を評価する改良
    された方法であって、 入力した手書き注釈上で部首を抽出し、第一の動的計画
    法の操作を用いて複数の抽出した部首候補を生成し、前
    記操作が前記複数の抽出した部首候補の各々に関する一
    組のコストを生成し、 前記部首候補の各々を部首コードと関連付け、 第二の動的計画法の操作を用いて前記部首コードを評価
    し、前記操作において、前記第一の動的計画法の操作中
    に決定した前記一組のコストを用いて、置換コストを決
    定する方法。
JP2001096811A 2000-03-29 2001-03-29 部首モデルに基づく草書体漢字の手書き注釈の検索 Pending JP2001325564A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US09/538101 2000-03-29
US09/538,101 US6681044B1 (en) 2000-03-29 2000-03-29 Retrieval of cursive Chinese handwritten annotations based on radical model

Publications (1)

Publication Number Publication Date
JP2001325564A true JP2001325564A (ja) 2001-11-22

Family

ID=24145489

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001096811A Pending JP2001325564A (ja) 2000-03-29 2001-03-29 部首モデルに基づく草書体漢字の手書き注釈の検索

Country Status (4)

Country Link
US (1) US6681044B1 (ja)
JP (1) JP2001325564A (ja)
KR (1) KR100487386B1 (ja)
CN (1) CN1226696C (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008250154A (ja) * 2007-03-30 2008-10-16 Nintendo Co Ltd 図形評価プログラムおよび図形評価装置

Families Citing this family (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020141643A1 (en) * 2001-02-15 2002-10-03 Denny Jaeger Method for creating and operating control systems
AUPS020302A0 (en) * 2002-01-31 2002-02-21 Silverbrook Research Pty. Ltd. Methods and systems (npw007)
US7262764B2 (en) * 2002-10-31 2007-08-28 Microsoft Corporation Universal computing device for surface applications
US20040243531A1 (en) * 2003-04-28 2004-12-02 Dean Michael Anthony Methods and systems for representing, using and displaying time-varying information on the Semantic Web
US7369702B2 (en) * 2003-11-07 2008-05-06 Microsoft Corporation Template-based cursive handwriting recognition
CN1622121B (zh) * 2003-11-28 2012-08-29 诺基亚公司 改进的手写汉字输入识别方法
US8280719B2 (en) * 2005-05-05 2012-10-02 Ramp, Inc. Methods and systems relating to information extraction
US8428358B2 (en) * 2005-05-31 2013-04-23 Microsoft Corporation Radical-base classification of East Asian handwriting
WO2008066441A1 (en) * 2006-12-01 2008-06-05 Zi Decuma Ab Method for character recognition
US8131536B2 (en) * 2007-01-12 2012-03-06 Raytheon Bbn Technologies Corp. Extraction-empowered machine translation
US8094939B2 (en) * 2007-06-26 2012-01-10 Microsoft Corporation Digital ink-based search
US8315482B2 (en) * 2007-06-26 2012-11-20 Microsoft Corporation Integrated platform for user input of digital ink
US7890539B2 (en) * 2007-10-10 2011-02-15 Raytheon Bbn Technologies Corp. Semantic matching using predicate-argument structure
JP2010015238A (ja) * 2008-07-01 2010-01-21 Sony Corp 情報処理装置、及び補助情報の表示方法
CN101452368B (zh) * 2008-12-29 2011-06-22 北京文通科技有限公司 一种手写文字输入方法
CN101604393B (zh) * 2009-07-10 2011-08-31 华南理工大学 一种用于联机手写汉字识别的汉字笔画特征提取方法
CN101604392B (zh) * 2009-07-10 2011-09-07 华南理工大学 一种用于联机手写汉字识别的汉字笔画特征并行提取方法
US8094941B1 (en) * 2011-06-13 2012-01-10 Google Inc. Character recognition for overlapping textual user input
CN103186911B (zh) * 2011-12-28 2015-07-15 北大方正集团有限公司 一种处理扫描书数据的方法及装置
JP5330576B1 (ja) * 2012-07-09 2013-10-30 株式会社東芝 情報処理装置および筆跡検索方法
JP6094400B2 (ja) * 2013-06-25 2017-03-15 ソニー株式会社 情報処理装置、情報処理方法、および情報処理プログラム
KR102125212B1 (ko) * 2013-08-29 2020-07-08 삼성전자 주식회사 전자 필기 운용 방법 및 이를 지원하는 전자 장치
KR102240279B1 (ko) 2014-04-21 2021-04-14 삼성전자주식회사 컨텐트 처리 방법 및 그 전자 장치
US9940511B2 (en) * 2014-05-30 2018-04-10 Kofax, Inc. Machine print, hand print, and signature discrimination
CN116416629B (zh) * 2023-06-12 2023-08-29 北京量子伟业信息技术股份有限公司 电子档案生成方法、装置、设备和介质

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5333209A (en) * 1992-03-24 1994-07-26 At&T Bell Laboratories Method of recognizing handwritten symbols
US5812697A (en) * 1994-06-10 1998-09-22 Nippon Steel Corporation Method and apparatus for recognizing hand-written characters using a weighting dictionary
AU3590795A (en) * 1994-09-14 1996-03-29 Apple Computer, Inc. System and method for automatic subcharacter unit and lexicon generation for handwriting recognition
TW338815B (en) * 1995-06-05 1998-08-21 Motorola Inc Method and apparatus for character recognition of handwritten input
US6041137A (en) * 1995-08-25 2000-03-21 Microsoft Corporation Radical definition and dictionary creation for a handwriting recognition system
US5832474A (en) 1996-02-26 1998-11-03 Matsushita Electric Industrial Co., Ltd. Document search and retrieval system with partial match searching of user-drawn annotations
US5923778A (en) * 1996-06-12 1999-07-13 Industrial Technology Research Institute Hierarchical representation of reference database for an on-line Chinese character recognition system
US6275611B1 (en) * 1996-10-17 2001-08-14 Motorola, Inc. Handwriting recognition device, method and alphabet, with strokes grouped into stroke sub-structures

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008250154A (ja) * 2007-03-30 2008-10-16 Nintendo Co Ltd 図形評価プログラムおよび図形評価装置

Also Published As

Publication number Publication date
CN1324068A (zh) 2001-11-28
KR20010093764A (ko) 2001-10-29
KR100487386B1 (ko) 2005-05-04
US6681044B1 (en) 2004-01-20
CN1226696C (zh) 2005-11-09

Similar Documents

Publication Publication Date Title
JP2001325564A (ja) 部首モデルに基づく草書体漢字の手書き注釈の検索
Giotis et al. A survey of document image word spotting techniques
Roy et al. HMM-based Indic handwritten word recognition using zone segmentation
US7778464B2 (en) Apparatus and method for searching for digital ink query
Pati et al. Word level multi-script identification
Sharma et al. Online handwritten Gurmukhi character recognition using elastic matching
EP1971957B1 (en) Methods and apparatuses for extending dynamic handwriting recognition to recognize static handwritten and machine generated text
US7729538B2 (en) Spatial recognition and grouping of text and graphics
Khurshid et al. Word spotting in historical printed documents using shape and sequence comparisons
Al-Helali et al. Arabic online handwriting recognition (aohr) a survey
Singh et al. Offline script identification from multilingual indic-script documents: a state-of-the-art
JP3452774B2 (ja) 文字認識方法
JPH0844826A (ja) 手書き入力照合方法
Bai et al. Keyword spotting in document images through word shape coding
Davis et al. Recognition of handwritten characters—a review
Wang et al. A coarse-to-fine word spotting approach for historical handwritten documents based on graph embedding and graph edit distance
JP4649512B2 (ja) 文字列検索方法およびその装置
Roy et al. Word retrieval in historical document using character-primitives
Madhvanath et al. Syntactic methodology of pruning large lexicons in cursive script recognition
JP3917349B2 (ja) 文字認識結果を利用して情報を検索する検索装置および方法
Hassan et al. Word shape descriptor-based document image indexing: a new DBH-based approach
Singh et al. Online handwritten Gurmukhi words recognition: An inclusive study
Marinai Text retrieval from early printed books
Bhattacharya et al. Sub-stroke-wise relative feature for online indic handwriting recognition
JPH0610829B2 (ja) 手書き文字認識方法

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20050830

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20051031

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060110

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060313

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20060905