JP2001325564A

JP2001325564A - 部首モデルに基づく草書体漢字の手書き注釈の検索

Info

Publication number: JP2001325564A
Application number: JP2001096811A
Authority: JP
Inventors: Yue Ma; マユェ; Zang Chi; ツァングチ
Original assignee: Matsushita Electric Industrial Co Ltd
Current assignee: Panasonic Holdings Corp
Priority date: 2000-03-29
Filing date: 2001-03-29
Publication date: 2001-11-22
Also published as: CN1324068A; KR20010093764A; KR100487386B1; US6681044B1; CN1226696C

Abstract

(57)【要約】（修正有）【課題】草書体漢字の高性能部首抽出技術を提供す
る。【解決手段】草書体の漢字は意味的整合法を用いて解
析し、まず文字内の部首を抽出し、その部首を用いて、
整合する部首を含む文字だけに、全ての辞書の検索空間
を小さくする。部首を抽出する場合、入力した文字を規
格化し、複数の画に分割し、次に画の上下情報と局所的
な最大および最小情報に基づいて、その画を編成する。
不明瞭な切れ目や接続している画は、この過程で取り除
く。次に、動的計画法の整合を画毎に実行して、接線ベ
クトル解析、中心関係評価、および始点終点評価を含む
様々な技術によって、ポイント毎に置換コストを評価す
る。動的計画法のコストは、参照部首の長さに基づいて
規格化し、位置の違いを取り除く。

Description

【発明の詳細な説明】

【０００１】（発明の属する技術分野）この発明は、一
般に手書き処理に関する。特に、この発明は草書体漢字
の改良されたインク整合技術に関する。中国語で書かれ
たものには非常の多くの数の文字があり、英語のアルフ
ァベットで文字を整合させるために使われるような既存
の整合技術は、単に検索用としては十分な性能ではない
という事実に、このインク整合技術は対処する。

【０００２】インクの整合は、認識させようとすること
なく整合可能な第一クラスデータとして、電子インクを
提供できるという基本的な仮定上で機能する。つまり、
使用者は草書体の文字を書いてもよく、草書体の一画に
関する時間的および空間的情報を有する電子インクデー
タを検索または整合操作で用い、それらの一画が何の文
字を表すかを解釈する必要はない。

【０００３】ここで説明する改良は、高性能部首抽出技
術にあり、動的計画法の整合における改良と関連してい
る。この発明は、全ての中国語と同様に、漢字を用いる
他の言語に対して役立つ。漢字は、中国、台湾、日本、
韓国などアジアの多くの場所で現在一般的に用いられて
いる。

【０００４】漢字は、人間の最古の書き方の一つである
象形文字に端を発する。一つの文字は、部首として知ら
れる一つ以上の下位の記号から構成され、一つの単語、
思考、または概念を表す。従って、英語で言葉を綴るた
めに使われるアルファベットの文字とは異なり、漢字は
より緻密である。各々が、一つの文字で単語、思考、ま
たは概念を表す。

【０００５】漢字は緻密で高効率なコミュニケーション
形態を表現するが、自動化システムには問題をもたら
す。コンピュータに漢字を入力することがボトルネック
であり、キーボードではなく、離散化タブレットを用い
て解決するいくつかの方法が提案されている。タブレッ
トによって、使用者は手書きでコンピュータに入力する
ことができ、手書き認識技術によって、使用者の手書き
は認識されたテキストに変換され、コンピュータに入力
される。手書きの漢字認識の分野では、オンライン認識
が、描かれた通りに入力点と画の時間的な順序を捕捉す
るのに有利である。従って、オンライン認識システム
は、線が描かれた通りに生成した時間的なデータによっ
て、上から下に描いた線と下から上に描いた線を区別す
ることができる。

【０００６】手書き漢字認識は長足の進歩を遂げている
が、その問題の複雑さは、当初の予想以上であることが
証明されている。これは少なからず、通常の業務用を意
図した辞書で必要とされる文字が非常に多いことによ
る。例えば、中国語で書かれたものでは、平均３，００
０〜５，０００文字が日常使われている。日本語で書か
れたものでは、中国の文字、つまり「漢字」の文字数は
幾分少ない。それでも、日本の新聞を読むためには、な
お数千の文字を理解する必要がある。さらに、手書き文
字認識の別の問題は、手書きの形が書き手によって非常
に異なり、草書体で書く人も多いことによる。

【０００７】近年、インク整合技術は、文書検索用途で
手書き注釈を検索する等の所定の用途で有望であること
が示されている。別の背景については、米国特許第５，
８３２，４７４号「使用者が書いた注釈の部分整合検索
を用いた文書探索および検索システム」に示されてい
る。これらの用途では、インク整合は既存の文字認識技
術より、様々な形の手書き、特に草書体の手書きを処理
する場合に有利である。つい最近、意味的整合技術が導
入され、この技術では文字はその部首に再分割され、こ
れらの部首を事前に検索して、文字整合の問題をより小
さなものの一つに限定する。抽出した部首に基づいて部
分整合を実行することによって、次の文字整合過程で
は、整合した部首を含んでいない文字を調べる必要性が
なくなる。

【０００８】参照部首に基づく意味的整合は非常に有望
な技術であるが、この技術の成功は、完全な文字から部
首を抽出するシステムの能力次第である。部首の抽出
は、最も困難な問題である。手書きの漢字は通常自由な
形態で書かれ、いかなる格子線もないので、文字内の部
首の位置は、その文字が書かれる毎に著しく変化する。
また、その部首は文字の他の部分と偶然交差することも
あり、文字内の別個の要素として部首を識別することを
困難にする。さらに、急いで書くと、使用者は、文字の
一部の終わりの画と別の部分の始まりの画をつなげる、
偶然に接続している画をペンで書くことがある。この接
続している画は実際には文字の一部ではないが、それで
も単に使用者が、文字の各々の部分を書く間に、ペンま
たはスタイラスを持ち上げなかったために画のデータに
存在している。

【０００９】上記の問題とは別に、動的計画法の別の問
題がある。動的計画法は、一つのパターン（部首内の一
画など）が別のパターンと適合するかどうかの決定にお
いて、挿入コスト、削除コストおよび置換コストを評価
するパターン整合技術である。従来、画の挿入コストと
削除コストは、その画の長さに直接比例して計算されて
いる。画の置換コストは、二つの画の間の形状の類似性
の測定を含むのでより複雑である。既存の技術を用いる
と、動的計画法によって、置換に対して考慮される二つ
の画の間の一組の対の点が得られる。置換コストは、二
つの点の各対に対するユークリッド距離の合計として測
定される。置換コストを計算する前に、画を各々一時的
に移動させ、その画の枠の左上の角が原点（０，０）に
重なるようにする。

【００１０】置換コストを計算する既存のユークリッド
ベースの方法には二つの欠点がある。一つ目は、動的計
画法の手続きに時間がかかることである。二つ目は、ユ
ークリッド距離法を用いることによってもたらされる誤
差が蓄積されることである。参照画とテストされる画を
各々移動させて、それらの左上の角が原点に重なるよう
にした後、ポイント毎に距離を解析する。各々の画の基
本的な形状が比較的同様であれば、ユークリッド距離法
は有用な性能指数を与えることができる。しかし、各々
の画がその左上の角を除いて基本的に同様の形状でなけ
れば、ユークリッド距離法は機能しない。二つの画の左
上の角を揃えることによって、その画の残りの部分が大
きなユークリッド距離で分離することとなり、その画が
互いに同様の形状ではないという不正確な評価となる。

【００１１】この発明は、非常に改良された部首抽出技
術を提供し、意味的整合性能を著しく向上させる。ここ
でより詳しく説明するように、この技術は文字規格化手
続きと改善された画分割手続きを用い、動的計画法の手
続きを混乱させる多くの問題となるアーティファクトを
取り除く。

【００１２】さらに、この技術は新しい動的計画法を用
い、接線ベクトル、中心関係評価および始点終点評価に
よって、置換コストをより確実に評価する。さらに、動
的計画法の手続きは部首分類データ構造を用いて、より
よい整合のために開始部首と終了部首にタグを付ける。
さらに、動的計画法の手続きは、参照部首の長さを用い
て動的計画法のコストを規格化し、これらの規格化した
コストを対話形式で調整して、動的計画法のコストのラ
ンクに基づく位置の違いを取り除く。

【００１３】改良した動的計画法の手続きの結果は、最
もよく抽出された部首、またはｎ個の部首の出力であ
る。次に、最もよく抽出された部首（またはｎ個の部
首）を用いて、以降に文字全体を整合させるための辞書
の大きさを低減する。動的計画法における改良は、特に
部首の抽出で役立つが、以降の文字全体の抽出または整
合操作に用いてもよい。

【００１４】この発明、その目的および利点のより完全
な理解のために、下記の詳しい説明と添付の図面を示
す。

【００１５】図１は、例示的な漢字を機械印刷された形
式または植字された形式１０、及び手書きされた形式１
２の双方で示している。この特定の漢字は「ねこ」を意
味し、部首１４（当該文字の最左部分）のような少なく
とも１つの部首を含んでいる。本部首自体は、「動物」
という意味を有している。このように、「ねこ」を意味
する漢字は、これに内蔵される形で「動物」を意味する
より基本的な文字を含んでいる。日常的に使用される漢
字の書体には少なくとも２００の部首が存在するため、
この例は無論、単に例示を目的とするものである。

【００１６】概して中国語及び漢字を使用する他の言語
においては、部首は、これらの文字における小さな基本
的意味を持つ要素である。１つまたは複数の部首は、組
合わされて文字を形成することができる。正しく書かれ
た各部首は、文字ブロック内の１つの周知の小区域にし
か存在しないはずである。本明細書で使用されているよ
うに、文字ブロックとは、文字が印刷ページ上に占有す
るほぼ矩形の領域である。文字ブロックを評するために
は、文字の周囲に矩形の有界ボックスを描けばよい。従
って有界ボックスは、伸ばされたり縮小されたりして文
字の周囲にぴたりとはまり、文字とはその端でのみ接触
する概して矩形の弾力的形状として考えることができ
る。部首は、文字ブロック内の予め限定された位置に配
置されている。

【００１７】例えば図１が示す例示的文字の場合、部首
１４は文字ブロックの最左区域を占めて正しく書かれ、
本質的に同文字の全高に渡って伸長している。他の漢字
では、構成要素である部首は他の場所を占めている可能
性がある。これらの場所は、時に文字ブロックの全高
（または全幅）いっぱいに伸長する小区域に及ぶ。他の
部首は、文字ブロックの全高または全幅より小さい区域
に及ぶ。

【００１８】（漢字整合工程の概要）基本的な漢字整合
工程は、図２を参照して説明することができる。図２が
示すシステムは、本発明の方法及び装置を実施すること
のできるシステムの例示的な一実施形態を示している
が、他のシステムも可能である。漢字整合工程は、好適
には、時間情報及び空間情報を共に記録する「インク」
データと呼ばれる動的に記録されたデータに基づいて実
行される。ディジタイズ用タブレット１６上にスタイラ
ス１８で書かれる一画は、連続する点（例えば、タブレ
ットのｘ−ｙ座標空間における点）として任意のタイム
スタンプ印と共に記録される。タイムスタンプ印から
は、一画の方向を推測することができる。一画は、一画
の方向を表示しかつ一画の開始ポイントと終了ポイント
とを区別するために使用されることが可能なデータ構造
で表示される。本好適な実施形態で使用されているイン
クデータタイプは、時間的（時刻）情報及び位置（ｘ，
ｙ点）情報を保持する。

【００１９】任意の手書き漢字処理システムの基本的な
目的は、（ユーザによって供給される）手書きされた文
字をシステムトレーニングを介して取得されかつ予め記
憶された情報と整合させることにある。ユーザは図１の
文字１２のような手書きされた文字を入力し、システム
はこの文字を予め記憶されたデータと整合する。この方
法で、予め書かれた手書きの付注は直接検索されること
が可能である。記憶されたデータを植字された文字に対
応させるルックアップ表を利用できる場合は、ユーザの
手書きによる入力は、後の処理または表示のために植字
された文字に変換されることが可能である。

【００２０】引き続き図２を参照すると、ユーザの手書
きによる入力は、問合せインクデータ構造内に問合せイ
ンクとして記憶される。予め取得されたデータは、デー
タ記憶装置２２内にデータベースインクとして記憶され
る。データ記憶装置２２は、ユーザに彼または彼女の他
の筆跡例でシステムを訓練させることによって配置され
ることが可能である。訓練は、先に同一性が知られてい
る漢字の例をユーザに入力させることを含んでいる。従
って、ユーザによる訓練用入力は、用語集における各文
字について標識されたデータを構築するために使用され
ることが可能である。次に、弾力的的整合として周知の
工程がデータ構造２０内の問合せインクとデータベース
構造２２内のデータベースインクとの比較に使用される
ことが可能であり、問合せインクのデータ記憶装置にお
ける文字に最も密接に整合しているのはデータベースイ
ンクのデータ記憶装置におけるどの文字であるかが選択
される。

【００２１】弾力的整合の実行は、特にデータベースイ
ンクのデータ記憶装置が、典型的にはそうであるように
大量の用語集を含んでいる場合には、時間のかかる工程
である。中国語は、日常的に使用される三千乃至五千文
字を包含していることを思い出していただきたい。

【００２２】従来の弾力的整合手順をスピードアップす
るために、図２の部首抽出技術が使用されてきた。図２
では、ブロック２４で従来の弾力的整合オペレーション
が実行される。但し、このオペレーションが実行される
までには、整合作業または検索は部首抽出手順を介して
大幅に縮小されている。

【００２３】部首抽出手順は、まず問合せインク及びデ
ータベースインクを分割し、各文字をその構成要素部分
に解体することを含んでいる。セグメンテーションブロ
ック３０及び３２は、この目的のために設けられてい
る。図１が示す例示的な文字では、部首１４は、構成要
素間の白い空間を同定して文字の残りの部分から分割ま
たは分離される、もしくは接続される構成要素の解析に
よって分割または分離されることが可能である。但し、
後の好適な実施形態の説明においてより完全に探求され
る通り、手書きの文字がこれほどきちんと描かれること
はほとんどない。部首が文字の他の部分に触れたり重な
ったりすることは極めて多く、また、ユーザが急いで書
いて構成要素間の字画をつなげるために部首の分割及び
抽出はさらに困難になる。本発明は、以下でより詳細に
論議するように、部首の分割及び抽出工程を改良するこ
とによってこれらの問題に対処する幾つかの技術を提供
する。

【００２４】工程２６及び２８で分割された各文字は、
各々の弾力的整合ブロック３０及び３２で試験され、任
意のセグメントが周知の部首を表しているかどうかが決
定される。これを達成するために、３４には参照部首の
データベースが供給されている。ある例示的な実施形態
では、約２００の参照部首が存在する可能性がある。こ
れらは、文字の目録における最もよく使用される部首セ
ットから選択されている。参照部首は、例えば部首をユ
ーザに後で標識付けされる別々の構成要素として書かせ
ることにより訓練を介して、もしくは完全な文字訓練デ
ータから部首の好例を人手で抽出することによって取得
されることが可能である。何れにしても、参照部首は、
ユーザの問合せインク及びデータベースインクを比較す
ることのできる部首の明確で優れたインクデータ例を提
供する。

【００２５】モジュール３０及び３２で抽出された部首
は、次に部首コード評価ブロック３６において比較され
る。ブロック３６は、部首コードの整合に基づいて最上
位の候補のみを返す。最上位の整合する部首コードは、
次にさらなる部首コード評価ブロック３８に供給され、
同ブロック３８は、データベースインクデータ記憶装置
２２から最上位の部首候補を有する最上位の文字候補を
選択する。選択された文字は、次に弾力的整合ブロック
２４に供給され、データ記憶装置２０からの問合せイン
クと比較される。

【００２６】こうして、（問合せインクのデータ記憶装
置２０に記憶された）ユーザによる入力された問合せ
は、データベースインクのデータ記憶装置２２から唯一
選択された文字と弾力的に整合される。部首に関してま
ず弾力的整合を実行することにより（ブロック３０及び
３２）、全体的な整合工程ははるかに迅速に実行される
ことが可能である。（２００文字から）上位３０個の文
字候補を返すことで、計算時間の８５％の短縮が達成さ
れる。

【００２７】次に、意味論的（部首抽出）モデルに留意
しながら、好適な実施形態の部首抽出技術及び改良され
た動的プログラミング技術について説明する。これらの
技術はブロック３０及び３２における部首抽出の実行に
際して使用されることが可能であり、改良された動的プ
ログラミング技術は、弾力的整合が実行される（図２の
ブロック３０、３２及び２４等）場合に使用が可能であ
る。現時点では図２が例示する部首抽出のフレームワー
クが好適であるが、本発明のこの技術が他の用途でも利
用可能であることは理解されるであろう。

【００２８】（改良された部首抽出）次に、図３及び４
を参照して、本好適な部首抽出技術について説明する。
入力される字画データ４０は、問合せインクとしてユー
ザにより、もしくはデータベースから供給される。入力
されたデータに対する文字の正規化処理及び字画分割処
理は、動的プログラミング整合オペレーションに先立っ
て実行される。図３では、文字の正規化はステップ４２
で始まり、字画分割はステップ５０で、動的プログラミ
ングはステップ６０で始まる。動的プログラミングステ
ップの詳細は、図４に示されている。

【００２９】（文字の正規化）罫線のない用紙に文字を
書く場合、人の筆跡はその都度大きさが変わる可能性が
ある。従って、１つの文字が予め記憶された文字と比較
される場合、もしくは１つの部首が予め記憶された部首
と比較される場合、各々の字画長は異なる可能性があ
る。

【００３０】これに対処するため、本好適な実施形態
は、まず文字の周囲に有界ボックスを限定し、次にこの
有界ボックスの大きさを正規化されたサイズまたは基準
サイズに調節することにより、文字の正規化を実行す
る。図３では、有界ボックス４５は文字１２の周囲に描
かれ、次に基準サイズの有界ボックス４６へと縮小され
る。図示された例では、書かれたもとの文字は正規化さ
れた文字よりも大きかった。無論、例によっては書かれ
たもとの文字が基準文字より小さくなる場合もあり、こ
うした場合は有界ボックスの大きさが拡大される。

【００３１】ステップ４７で指示されているように、文
字を作り上げているピクセルまたは点は次に、４８が示
す通り、書かれたもとの文字が正規化された有界ボック
ス４６を満たすサイズに縮小または拡大されるようにシ
フトされる。

【００３２】本好適な実施形態では、線形正規化が使用
されている。各文字の有界ボックスは基準の文字サイズ
に正規化され、文字内のピクセルがこれに合わせてシフ
トされる。（ｘ₁，ｙ₁）、（x₂，ｙ₂）を各々、文字の
有界ボックスの左上の角及び右下の角とすると、文字内
の点（ｘ，ｙ）の正規化後の新たな座標は以下のように
なる。ｘ’＝０＋（ｘ−ｘ₁）ｆ_x ｙ’＝０＋（ｙ−ｙ₁）ｆ_y 但し、ｆ_x及びｆ_yは各々ｘ及びｙ方向の換算係数であ
り、以下のように定義される。ｆ_x＝Ｓ_x／（ｘ₂−ｘ₁）ｆ_y＝Ｓ_y／（ｙ₂−ｙ₁）但し、Ｓ_xは幅として選択する基準文字サイズであり、
Ｓ_yは同じくその高さの場合である。目下、Ｓ_x及びＳ_y
は各々４０及び５０として選択されている。正規化の
後、各文字の有界ボックスの左上の角が原点（０，０）
にシフトされる。

【００３３】本好適な実施形態では、同様の正規化オペ
レーションが参照部首３４（図２）に対して実行され
る。参照部首を正規化する場合には、当該部首を有する
全ての文字が正規化される。トレーニング工程では、参
照部首は直接は訓練されない。各参照部首の部首ロケー
ション情報を維持するために、この部首を含む文字を選
択し、ユーザにその文字を書くように依頼する。その
後、参照部首は、その対応する文字から対話的に抽出さ
れることが可能である。参照（訓練用）文字のサイズ
は、動的プログラミングが使用される前に正規化され
る。

【００３４】（字画の分割）文字の正規化を介して字画
データが正規化されると、ステップ５２が示すように、
ペンダウン及びペンアップ情報に従ってまず字画を分類
することにより、字画の分割が始まる。入力される字画
データ４０が取り込まれると、着信する点のペンダウン
及びペンアップ情報及び時間的順序が取得される。着信
ポイントは、ペンダウンポイントで始まり、ペンアップ
ポイントで終わる最初の字画に分類される。次に本シス
テムは、ステップ５４が示すように、これらの最初の字
画をさらに小さな字画に細分する。このさらなる分割
は、最初の字画をｙ値の極小及び極大及びｘ値の極小で
遮断することにより実行される。私達はこれらの分断点
を「内部ブレークポイント」と称し、最初の字画のペン
ダウン及びペンアップポイントと区別している。

【００３５】数学的な極小ポイントまたは極大ポイント
は、時として人の目に直ぐには明白でないことがある。
しかしながら、これらはデータとしては存在する。私達
はこれらのポイントを、「曖昧な」ブレークポイントと
呼んでいる。本好適な実施形態は、ステップ５６で曖昧
なブレークポイントを除去する。曖昧なブレークポイン
トの除去工程は、曖昧なブレークポイントを以下のよう
に定義している。即ち、ｐ_n-i，．．．，ｐ_n-1，ｐ_n，
ｐ_n+1，．．．，ｐ_n+jをその時間的順序で表した連続す
る着信ポイントと仮定し、ｐ_n-i、ｐ_n及びｐ_n+jをブレ
ークポイント、ｐ_nをそのｙ値の極小故の内部ブレーク
ポイントとする。ｐ_nが「曖昧」であるかどうかを確認
するため、以下のようにｄｙ1を「暫定字画」
ｐ_n-i，．．．，ｐ_nの２つの連続するポイントのｙ値に
おける平均差と定義し、ｄｙ2を暫定字画ｐ_n，．．．，
ｐ_n+jの場合の平均差とする。内部ブレークポイントが明白であるためには、ｄｙ₁及
びｄｙ₂の絶対値は比較的大きいことが好適である。ｄ
ｙ₁及びｄｙ₂は通常反対方向にあることから、下記の規
則が採用される。即ち、│ｄｙ₁−ｄｙ₂│≦Ｔであれ
ば、ｐ_nは曖昧な内部ブレークポイントである。故に、
これは除去されなければならない。Ｔは限界値であり、
現在は０．５に設定されている。曖昧なｘ最小及びｙ最
大ブレークポイントの除去手順は、類似している。

【００３６】曖昧なブレークポイントが除去された後、
ステップ５８では任意の接続字画が同定され、除去され
る。接続字画は、手書きされた漢字においては極めて一
般的である。接続字画は、印刷される手書き文字の場合
には基準文字の一部ではない字画のことである。筆記体
の手書きの場合、２つの分離された字画が余分の字画、
即ち接続字画によって接続されることがある。

【００３７】接続字画は、字画データを調査して当該字
画の方向を査定することにより検出される。その字画が
右下から左上に伸びるものであれば、これは接続字画で
ある可能性が高い。

【００３８】実際には、手書きされた文字に接続字画が
必ず現出するとは限らない。むしろ余分の接続字画は、
文字が形成される際のスタイラスの速度及び方向に影響
される傾向が強い。例えばあるユーザは、通常は接続字
画が一切ない、きちんとした印刷形式で文字を書くこと
ができる。但し、同ユーザが急いでいるときには、接続
字画が現れることがある。

【００３９】本好適な字画除去技術は、下記の規則を使
用して接続字画を検出し、除去する。即ち、ｅ_y−ｓ_y≦
１及びｅ_x−ｓ_x≦１であれば、これは接続字画である。

【００４０】上式の（ｓ_x，ｓ_y）及び（ｅ_x，ｅ_y）は各
々、分割された字画の開始ポイント及び終了ポイントで
あり、原点（０，０）はディジタイズ用タブレットまた
は取込み用デバイスの左上の角に位置づけられている。

【００４１】上述の字画分割工程が完了すると、次に
は、ステップ６０に表示されているように動的プログラ
ミングを実行することができる。本好適な実施形態の動
的プログラミング手順は、図４に詳述されている。

【００４２】（動的プログラミング）動的プログラミン
グの目的は、参照部首及び問題の文字等の２つの部分を
整合させることにある。整合処理は字画レベルで実行さ
れるため、その結果は、２つの筆跡の間の最良の字画関
係または整合であり、この整合に関するコストが計算さ
れる。動的プログラミングは字画レベルで行われるた
め、本好適な実施形態では、字画オペレーション（字画
の挿入、字画の削除または字画の置換）がまず計算され
る。

【００４３】本好適な実施形態は、６２が示すように、
ポイントレベルのデータを使用して字画オペレーション
のコストを計算する。これは、字画の挿入コスト及び削
除コストが字画の長さに比例する方向に計算され、置換
コストが形状の類似性を基礎として計算される従来の方
法とは異なる。これに対して、本好適な実施形態は各字
画を連続するポイントシーケンスとして捉え、動的プロ
グラミングはそのポイントレベルで実行され、２つのポ
イントシーケンスが完全に整合される。ポイントレベル
の計算は、挿入６４、削除６６及び置換６８の基本的オ
ペレーションを含んでいる。本好適な実施形態における
置換コスト査定は、接ベクトル方法論７０、センター関
係査定７２及び開始ポイント−終了ポイント査定７４を
含む多数の改良された技術を使用している。これらにつ
いては後述するが、これらの改良された技術に関する論
議に進む前に、従来の置換コスト測定における短所を示
す図５を参照する。

【００４４】従来の置換コスト測定では、ａにおける字
画ｓ₁及びｂにおける字画ｓ₂等の２つの字画間の形状類
似性査定は、まずｃにおけるように、２つの字画をそれ
らの左上の角（またはそれらの各々の有界ボックスの左
上の角）が重なるように時間的に合わせることによって
実行される。ｃ₁で示されているように、両字画をそれ
らの上側最左端で合わせると、両字画は上側最左部分を
除けば基本的に相似しているという事実にも関わらず、
両字画の残りの部分は比較的大きなユークリッド距離で
離れて存在する。これはエラーの累積を招き、置換コス
トは、そうでなければ全体的な形状によって指示される
ものと思われる値よりも高い値で評価される。

【００４５】図６は、本発明の好適な実施形態による置
換コストの査定方法を示したものである。図６では、２
つの字画の対応するポイントを以下のように定義してい
る。即ち、ｓ₁をｌ₁個のポイントを有する字画、ｓ₂を
ｌ₂個のポイントを有する字画であるとする。Ｐ_iはｓ₁
上におけるｉ番目のポイントであり、Ｐ_iの字画ｓ₂上の
対応するポイントはＰ_jである。但し、である。次に、２つの対応するポイントＰ_ｉ及びＰ_jの
置換を以下のように計算する。（ポイント置換コスト）但し、Ｖ_iはポイントＰ_iにおける接ベクトル、Ｖ_jはＰ_j
における接ベクトル、θ（Ｖ_i，Ｖ_j）は２つのベクトル
間の角度であり、θ∈[０，π]である。

【００４６】ｃｏｓθ（Ｖ_i，Ｖ_j）は、以下のように計
算することができる。但し、（ｘ₁，ｙ₁）及び（ｘ₂，ｙ₂）は各々Ｖ_iの開始
ポイント及び終了ポイントであり、（ｘ₃，ｙ₃）及び
（ｘ₄，ｙ₄）は各々Ｖ_jの開始ポイント及び終了ポイン
トである。

【００４７】上記式から分かるように、θ（Ｖ_i，Ｖ_j）
が大きいほど、ポイント置換コスト（Ｖ_i，Ｖ_j）の値は
大きい。２つの対応するポイントの置換はそれらのユー
クリッド距離を反映しないが、これらの対応するポイン
トにおける２字画間の「瞬間」形状の差を反映する。

【００４８】字画ｓ₁に沿った全ポイントのポイント置
換コストを合計すると、以下のように字画ｓ₁及びｓ₂間
の置換コストを取得することができる。但し、ｌ₁は字画ｓ₁の長さである。

【００４９】以下のように、この字画置換コストをさら
なる正規化によって修正してみる。但し、項は２つの字画間の平均長を反映し、最大は字画サイズの差を反映しており、字画サイズの差が大
きいほど、置換コストは大きくなる。

【００５０】正規化の後は、ほぼ以下のような式が得ら
れるはずである。（字画置換コスト）新規字画置換コストは、幾つかの欠点を克服することが
できる。第１に、対応するポイントを発見することによ
り、ポイント置換コストの計算における動的プログラミ
ング手順を排除することができる。第２に、図６が示す
ように、接ベクトルを使用する置換コストの計算は蓄積
効果を保有しない。

【００５１】先に概説した置換コストを査定する接ベク
トル法は、字画の構造情報を考慮することなくその整合
を可能にする。性能をさらに向上させるためには、字画
のセンター関係及びそれらの開始ポイント及び終了ポイ
ントの査定を通じて字画の構造関係を査定することがで
きる。

【００５２】ユーザが漢字を形成する場合、文字内の字
画は構造上の関係性（即ち、字画間の空間関係）におい
て配置される。構造関係の査定に際しては、一画の加重
されたセンターが計算され、当該字画の位置の表示に使
用される。構造情報は、図７が示すように、２つの字画
センター間の空間関係に反映されることが可能である。
２つの字画が整合され、かつそれらの置換コストが計算
される前に、本システムはまず、既に整合された、もし
くは置換された最終の２字画を調べる。図７を参照する
と、最終の整合された２字画は、ｒ_i（参照部首の_ｉ番
目の字画）及びｃ_j（当該文字のｊ番目の字画）であ
る。本システムは次に、ｒ_m及びｃ_nを整合させる。

【００５３】ｐ_i、ｐ_j、ｐ_m、ｐ_nを各々、ｒ_i、ｃ_j、ｒ
_m、ｃ_nの加重されたセンターとする。ベクトルｐ_iｐ
_mは、２字画ｒ_i及びｒ_m間の空間関係を反映することが
できる。同様に、ベクトルｐ_jｐ_nは、ｃ_j及びｃ_n間の空
間関係を反映することができる。ｒ_mをｃ_nに整合させよ
うとする場合には、ｒ_m及びｃ_nは形状が類似していなけ
ればならないだけでなく、先行して整合された字画（即
ち、各々ｒ_i及びｃ_j）に対するそれらの空間関係も類似
していなければならない。言い替えれば、ベクトルｐ_i
ｐ_m及びベクトルｐ_jｐ_n間の角度は小さくなければなら
ない。

【００５４】私達の判断基準は、以下のようなものであ
る。即ち、であれば、ｒ_m及びｃ_nは整合されない。θ_Tは限界値で
あり、現在はπ／２に設定されている。動的プログラミ
ングにおいては、検査対象である２字画が整合しないと
決定されれば、置換コストは超高値に設定され、よって
置換は発生しない。そうでなければ、上述の方法を使用
して字画置換コストの計算に取りかかる。

【００５５】但し、ｐ_i＝ｐ_mまたはｐ_j＝ｐ_nであれば、
結果的に生じるゼロ長ベクトルの方向は意味を持たない
ので例外である。従ってこの場合は、上述の基準は無視
され、置換コストが計算される。

【００５６】本好適な実施形態はまた、置換コストの計
算において開始ポイント及び終了ポイントを査定する。
本システムは、まず整合された、或いは置換された最終
の２字画を調べることによって、２字画の整合の可能性
について精査する。一画の開始ポイント及び次の一画の
終了ポイントは、整合される両字画の比較基準である角
度を確定するベクトルの限定に使用される。この手順
は、図８を参照すれば理解することができる。

【００５７】図８が示すように、最終に整合された２字
画をｒ_i（当該部首のｉ番目の字画）及びｃ_j（当該文字
のｊ番目の字画）とする。調査対象の２字画は、ｒ_m及
びｃ _nである。ｅ_i及びｅ_jを各々、字画ｒ_i及びｃ_jの終
了ポイントとする。ｓ_m及びｓ _nを各々、字画ｒ_m及びｃ_n
の開始ポイントとする。ベクトルｅ_iｓ_mは、２字画ｒ_i
及びｒ_m間の空間関係を反映している。同様に、ベクト
ルｅ_jｓ_nは、字画ｃ_j及びｃ_n間の空間関係を反映してい
る。字画ｒ_mを字画ｃ_nに整合させようとする場合には、
ｒ_m及びｃ_nは形状が類似していなければならないだけで
なく、先行して整合された字画（即ち、各々ｒ_i及び
ｃ_j）に対するそれらの空間関係も類似していなければ
ならない。言い替えれば、ベクトルｅ_iｓ_m及びベクトル
ｅ_jｓ_n間の角度は小さくなければならない。

【００５８】私達の判断基準は、以下のようなものであ
る。即ち、であれば、ｒ_m及びｃ_nは整合されない。θ_Tは限界値で
あり、現在はπ／２に設定されている。センターポイン
トベクトルと同様に、動的プログラミングにおいては、
検査対象である２字画が整合しないと決定されれば、置
換コストは超高値に設定され、よって置換は発生しな
い。そうでなければ、上述の方法を使用して字画置換コ
ストの計算に取りかかる。

【００５９】この場合もやはり、連続する２字画が接続
されている場合には、第１の字画の終了ポイントが第２
の字画の開始ポイントとなってしまう、即ちｅ_i＝ｓ_mま
たはｅ_j＝ｓ_nとなることがある。この場合は、上述の基
準は無視され、置換コストが計算される。

【００６０】上述のように挿入コスト、削除コスト及び
置換コストが計算されると、７６で動的プログラミング
整合が実行される。本好適な実施形態における動的プロ
グラミング整合は、部首を２つの主要な分類区分に分類
する部首分類手順７８によって改良されている。第１の
の分類区分では、部首が文字の最初の数画を開始する。
第２の分類区分では、部首が当該文字の最後の数画を終
了する。

【００６１】部首が属する分類区分は通常、予め周知で
ある。本好適な動的プログラミング整合工程では、この
分類区分情報が強化されている。参照部首がある文字に
整合される場合、当該文字内の整合された字画がその部
首について予想される分類区分に当てはまらなければ、
さらなるコストが加算される。本好適な実施について
は、以下の動的プログラミング手順を通じて説明するこ
とができる。

【００６２】これまで、動的プログラミングは、参照部
首Ｒ＝ｒ₁ｒ₂,...,ｒ_mをある文字の部分列Ｃ＝ｃ
₁ｃ₂,...,ｃ_mに整合させるために使用されている。この
工程では、各オペレーションコストに依存して挿入、削
除または置換の３つのオペレーションが発生する可能性
がある。最終目標は、最小の合計コストで最適なオペレ
ーション列を発見することである。例えば一例として、
ｒ＝ｒ₁ｒ₂ｒ₃ｒ₄を４画より成る参照部首とし、Ｃ＝ｃ
₁ｃ₂ｃ₃,...,ｃ₈を８画より成る整合部首とする。Ｒを
Ｃの部分列、即ちｃ’＝ｃ＝ｃ₃ｃ₄ｃ₅ｃ₆に変換するた
めの可能な１つのオペレーションシーケンスは、表１が
示すように、ｃ₁を挿入し、ｃ₂を挿入し、ｒ₁をｃ₃で置
換し、ｒ₂をｃ₄で置換し、ｃ₅を挿入し、ｒ₃をｃ₆で置
換し、ｒ₄を削除する、というものが考えられる。

【００６３】

【表１】

【００６４】原初の動的プログラミング手順では、整合
を字画シーケンスＣ内の任意場所で開始させ、終了させ
ることができる。上述の例では、実際の整合はｒ₁とｃ₃
との置換に始まり、ｒ₄の削除で終了する。従って、合
計コストは、r₁のｃ₃による置換、ｒ₂のｒ₄による置
換、ｃ₅の挿入、ｒ₃のｃ₆による置換及びｒ₄の削除の和
であり、ｃ₁の挿入及びｃ₂の挿入は考慮されない。

【００６５】部首の分類区分を考慮する場合、第１の分
類区分における、文字の最初の数画に整合しない部首、
または第２の分類区分における、文字の最後の数画に整
合しない部首への罰金の付加を試行する。これを行うた
めに、動的プログラミング手順を、第１の分類区分に属
する部首の場合は整合文字の第一画で開始し任意場所で
終了する整合を可能にするように、また第２の分類区分
に属する部首の場合は文字内の任意場所で開始し最終画
で終了する整合を可能にするように修正する。表１の場
合、合計コストは、ｃ₁の挿入、ｃ₂の挿入、r₁のｃ₃に
よる置換、ｒ₂のｒ₄による置換、ｃ₅の挿入、ｒ₃のｃ₆
による置換及びｒ₄の削除の和となる。以上から分かる
ように、置換はＣの第一画では始まらないため、整合は
ｃ₁の挿入及びｃ₂の挿入によって罰されている。以前の
ように、第１の分類区分に属する部首では、動的プログ
ラミングは文字内の任意場所で終了することができる。

【００６６】同様に、第２の分類区分に属する部首Ｒの
場合、これはＣの最終字画であるｃ _mにおいて終了する
Ｃの部分列に整合することが予測される。ある可能なオ
ペレーションシーケンスは、例えば表２が示すような、
Ｃ₁の挿入、Ｃ₂の挿入、ｒ₁のＣ₃による置換、ｒ₂のｒ₄
による置換、Ｃ₅の挿入、ｒ₃のＣ₆による置換、ｒ₄の削
除、Ｃ₇の挿入及びＣ₈の挿入であることが可能である。

【００６７】

【表２】

【００６８】この場合、最初の２つの挿入オペレーショ
ン（Ｃ₁の挿入及びＣ₂の挿入）は、整合が当該文字の任
意場所で開始できるために、ゼロコストで行われなけれ
ばならない。但し、最後の２つの挿入オペレーション
（Ｃ₇の挿入及びＣ₈の挿入）のコストは無視されてはな
らない。

【００６９】動的プログラミング整合ステップ７６は、
参照部首を文字の一部に整合させるための動的プログラ
ミング合計コストを作成する。合計コストは、全てのオ
ペレーションコスト（挿入、削除及び置換）の和であ
る。従って、各文字について全ての参照部首が当該文字
との整合を試行されると、より少ない字画を有する部首
がより低い動的プログラミングコストを生み出す傾向が
ある。これは異常な結果を導く可能性がある。これを解
決するため、本好適な実施形態は、ステップ８０が指示
するように、参照部首８２の長さを使用して動的プログ
ラミングコストを正規化する。動的プログラミングコス
トの正規化は、より少ない字画を有する部首が保有しが
ちな固有の便益を除去し、結果としてより強力な部首抽
出手順が得られる。

【００７０】２つの部首（参照部首と試験部首等）の位
置の相似性は、部首抽出スキームにおいて利用可能な幾
分かのコース情報である。ステップ８４が示すように、
本好適な実施形態は、部首を精選するための基礎として
位置の相似性を使用し、位置の異なる部首を除去する。
各文字に関して、本除去工程は、動的プログラミングを
基礎とする弾力的な整合の全参照部首への適用が含まれ
る。次いで本手順は、参照部首と当該文字との整合され
た字画の位置の相似性を計算する。否定的な位置の相似
性を有する部首が除去されると、残りの部首に対する動
的プログラミングコストがランク付けされ、最小コスト
を有する上位２つの部首が当該文字の抽出された部首と
して選ばれる。図示されている通り、ランキングステッ
プ８６と非相似性除去ステップ８４が、全参照部首につ
いて繰り返される。従って、本手順の最終結果は、８８
が示す抽出された１つまたは複数の部首を表す。

【００７１】（部首コードの評価）各文字について部首
が抽出されると、文字列は部首コード、即ち部首ＩＤの
シーケンスとなる。２つの文字列が比較される場合、整
合は部首コードレベルの動的プログラミングを介して行
われる。これは、手書きのものと整合される手書き（即
ち、手書きデータベース対手書きの問合せ）、及びタイ
プされたテキストと整合される手書き（即ち、手書きデ
ータベース対タイプテキストの問合せ）の両方に適用さ
れる。タイプされた問合せの場合、これらは即座に部首
コードに変換され、部首コードのデータベース列と比較
されることが可能である。

【００７２】２つの文字列を整合させるための動的プロ
グラミングにおいては、文字の挿入、文字の削除及び文
字の置換の３つのオペレーションが定義されており、各
々にオペレーションコストが付随している。その目的
は、問合せ列の部首コードをデータ列の部首コードに変
換することにある。動的プログラミングの使用により、
本システムは、最小の編集距離（最小の合計オペレーシ
ョンコスト）を達成する最適整合シーケンスを取得す
る。

【００７３】文字の挿入コスト及び削除コストは、定数
として指定される。文字の置換コストは、２文字（各文
字につき２コード、即ち４つの部首コード）間の差を反
映する。文字の置換は、１つの文字における部首コード
が他方の文字内には発見されないことの発生数として定
義される。文字が抽出される部首コードを保有していな
ければ、当該文字は２つのヌル部首コード（ＩＤゼロを
有するコード）で表示され、置換コストも同様に計算さ
れる。

【００７４】所望されれば、ヌル部首コードは以下のよ
うに修正することができる。各文字は２つの抽出された
部首を有し、よって各文字は部首ＩＤに対応する２つの
数字で表示されることが可能である。抽出される部首が
なければ、その部首コードはヌルであり、部首ＩＤはゼ
ロである。ある実施形態では、文字の置換は、不整合の
部首コードまたは非抽出部首コードの場合と同様に計算
される。但し所望されれば、非抽出部首コードには、不
整合の部首コードよりも過酷な罰を課すことができる。

【００７５】さらに、先のアルゴリズムから分かるよう
に、抽出された各部首は同等に処理される。特に、２つ
の部首コードが同一である場合には、これらは置換コス
トに何ら寄与しない。この方法は、部首コードにおける
整合を促進するが、より低い部首抽出コストを有する、
即ちより信頼度の高い抽出された部首を有する部首コー
ドにおける整合には益さない。各部首コードが部首抽出
工程において取得されると、動的プログラミングコスト
がこれに付随する。本新規方法は、先行する部首抽出か
らのこの動的プログラミングコストを置換コストの計算
に付随させるように提案している。共に高い信頼度（部
首抽出コストが低い）を有する２つの部首コードが整合
すれば、それらの置換コストは、低い信頼度を有する２
つの部首コードの置換コストよりも低くなるはずであ
る。これらの方法を組み合わせて、私達の新規文字置換
コストを以下のように説明する。

【００７６】２つの文字Ｃ₁＝ａ₁,ａ₂、及びＣ₂＝ｂ₁,
ｂ₂を比較してみる。但し、ａ₁ａ₂はＣ₁から抽出された
部首であり、ｂ₁ｂ₂はＣ₂から抽出された部首である。
また、ｄｐＣＯＳＴ＿ｂ１、ｄｐＣＯＳＴ＿ｂ２、ｄｐ
ＣＯＳＴ＿ａ１、ｄｐＣＯＳＴ＿ａ２は各々字画レベル
の動的プログラミングコスト、即ちｂ₁、ｂ₂、ａ₁及び
ａ₂の部首抽出コストである。これらの２文字の置換コ
ストは、以下のようになる。但し、ＣＯＳＴ（ｂ₁;ａ₁,ａ₂）はｂ₁の置換コスト、即
ち、また、ＣＯＳＴ（ｂ₂;ａ₁,ａ₂）はｂ₂の置換コスト、即
ち、但し、ｃ_{sub_max}は、（ａ₁ａ₂）及び（ｂ₁ｂ₂）が完全
に相違する最悪の場合の置換コストを表す指定された定
数である。経験上、ｄｐＣＯＳＴ＿ｘは常に任意の字画
ｘのｃ_{sub_max}未満である。

【００７７】部首コードに整合が存在する（例えばｂ₁
＝ａ₂）場合は常に、ＣＯＳＴ（ｂ₁;ａ₁,ａ₂）及びＣＯ
ＳＴ（ｂ₂;ａ₁,ａ₂）はｃ_{sub_max}／２未満となり、最終
的な置換コストはｃ_{sub_max}未満となる。

【００７８】（参照部首）実用的な実施形態を構築する
際には、参照部首は、全体的な意味論的整合工程を向上
させるという視点で選択されなければならない。参照部
首の選択は、部首抽出工程に直接影響する。一般に、正
しく抽出される部首の数が多いほど、最終的な整合率は
高くなる。正しく抽出される部首の数を増大させる１つ
の方法は、参照部首の数を増やすことである。その結
果、より多くの部首が抽出される。但し、参照部首のデ
ータベースが増大すると、参照部首を訓練する時間が長
くなり、参照部首を抽出する時間も長くなる。従って、
適正数の部首の選択は、処理時間と整合率とを天秤に掛
けることになる。

【００７９】部首の選択において考慮すべき他の事項に
は、部首間の類似性が含まれる。類似する部首を１つの
訓練セットに纏めて入れると、混乱が生じる可能性があ
る。また部首によっては、単に異なる書き方が多くあり
過ぎるという理由で抽出がより困難なものがある。混乱
を引き起こしそうな部首及び多くの異なる方法で書くこ
とが可能な部首は、部首の抽出に使用される参照部首か
らは排除されることが最良である。図９は、漢字認識シ
ステムを実行する際に使用される本好適な部首を描いた
ものである。図示されている最初の参照部首４５個は、
普通に使用されている約２０００の漢字に最もよく現れ
るものである。これらの文字は、手書きの漢字において
必ずしも同じ頻度では現れないため、このセットは、デ
ータベース列における最も使用頻度の高い部首から選択
された追加の部首１２個で補足されている。実用的な実
施形態を設計する際には、これらの参照部首を使用して
初期の実施形態を構築することができる。その後は、シ
ステムの使用に伴なって、使用頻度統計に基づく幾つか
の追加部首を同定し、参照部首のデータセットに追加す
ることができる。

【００８０】以上の説明に鑑みて、上述の部首抽出技術
は、単独使用、または全体的な意味論的整合工程を向上
させる組合せ使用の何れも可能であることは理解される
であろう。本発明について現時点で好適な形態において
説明してきたが、添付の請求の範囲に記載された本発明
の精神から逸脱することなく所定の修正を行えることは
理解されるであろう。

【図面の簡単な説明】

【図１】部首識別過程の所定の態様の理解に役立つ、機
械印刷および手書き形状の典型的な漢字を示す図であ
る。

【図２】手書きの漢字の注釈用の意味的インク整合シス
テムの概略を示すブロック図である。

【図３】好ましい実施例の部首抽出過程を示すフローチ
ャート図である。

【図４】好ましい実施例の部首抽出過程を示すフローチ
ャート図である。

【図５】既存の形状類似性評価の欠点の一つを示す部首
整合図である。

【図６】好ましい実施例の接線ベクトル技術を示す部首
整合図である。

【図７】中心関係技術を示す部首整合図である。

【図８】始点終点評価を示す部首整合図である。

【図９】現時点での好ましい組の部首を示す図である。

【符号の説明】

（２２）データベースインク（２４）従来の伸縮整合（２６）分割（２８）分割（３０）部首抽出（弾力的整合）（３２）部首抽出（弾力的整合）（３４）参照部首（３６）部首コード評価ブロック（３８）部首コード評価ブロック（４０）字画データの入力（４２）文字の規格化（４４）枠の規格化（４７）画素の移動（５０）画の分割（５２）上下情報による画のグループ化（５４）ｘ最小、ｙ最小、ｙ最大のさらなる分割（５６）不明瞭な切れ目の除去（５８）除去する接続画の識別（６０）動的計画法（６２）点レベルのデータを用いた画の操作のコスト計
算（７０）接線ベクトル法（７２）センタ−関係査定（７４）開始ポイント−終了ポイント査定（７６）動的計画法の整合（７８）部首の分類（８０）動的計画法のコストの規格化（８２）参照部首の長さの使用（８４）非相似性除去（８６）動的計画法のコストのランクキング（８８）抽出した部首の出力

───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.⁷ 識別記号ＦＩテーマコート゛(参考）Ｇ０６Ｆ 17/22 ５０６Ｇ０６Ｆ 17/22 ５０６Ａ５０８５０８Ｅ // Ｇ０６Ｆ 17/30 １７０ 17/30 １７０Ｚ

Claims

【特許請求の範囲】

【請求項１】草書体の手書き注釈を検索する方法であっ
て、注釈の辞書を格納し、前記注釈の意味的に重要な部分に対応する複数の部首を
格納し、検索されるべき手書き注釈を入力し、まず前記入力した手書き注釈を規格化し、次に前記手書
き注釈の一部を識別して、抽出した部首を表現すること
によって、前記入力した手書き注釈から少なくとも一つ
の部首を抽出し、前記抽出した部首と前記格納した複数の部首の間で評価
操作を実行して、少なくとも一つの部首候補を識別し、前記部首候補を用いて、前記辞書の一部を選択し、前記入力した手書き注釈と前記一部の間で整合操作を実
行して、前記辞書から注釈を検索する方法。
【請求項２】前記規格化段階が、複数の点として前記手
書き注釈を表現し、入力した手書き注釈が所定の大きさ
に対応するように、前記点の間の間隔を伸縮することに
よって行われる請求項１記載の方法。
【請求項３】前記抽出段階が、前記入力した手書き注釈
内の複数の画を識別し、前記複数の画に関する上下情報
に基づいて、前記複数の画を編成することによって行わ
れる請求項１記載の方法。
【請求項４】前記抽出段階が、前記入力した手書き注釈
内の複数の画を識別し、前記複数の画内の局所的な最大
点と最小点に基づいて、前記複数の画を編成することに
よって行われる請求項１記載の方法。
【請求項５】さらに、選択した局所的な最大点と最小点
を選択的に取り除く請求項４記載の方法。
【請求項６】前記抽出段階が、前記入力した手書き注釈
内の接続している画を識別し、前記接続している画を取
り除くことによって行われる請求項１記載の方法。
【請求項７】前記評価段階が、前記抽出した部首と前記
格納した複数の部首の両方を、一連の接触した点として
表現し、前記各々の一連の接触した点上で、動的計画法
の整合を実行することによって行われる請求項１記載の
方法。
【請求項８】前記評価操作が、整合の接近度を示す少な
くとも一つの計画コストの距離を得る動的計画法の整合
操作を含む請求項１記載の方法。
【請求項９】さらに、参照部首の長さを決定し、前記参
照部首の長さに対して、前記計画コストの距離を規格化
する請求項８記載の方法。
【請求項１０】前記評価操作が、始点および終点に基づ
いて部首を分類する段階を有する、動的計画法の整合操
作を含む請求項１記載の方法。
【請求項１１】前記評価操作が、前記抽出した部首と、
前記格納した複数の部首に関する接線ベクトルを比較す
ることによって、置換コストを計算する段階を有する動
的計画法の整合操作を含む請求項１記載の方法。
【請求項１２】前記評価操作が、前記抽出した部首の中
心と前記格納した複数の部首の中心の間の関係を評価す
る段階を有する、動的計画法の整合操作を含む請求項１
記載の方法。
【請求項１３】前記評価操作が、前記抽出した部首と前
記格納した複数の部首の始点および終点を評価する段階
を有する、動的計画法の整合操作を含む請求項１記載の
方法。
【請求項１４】前記評価操作が、前記抽出した部首内の
画と前記複数の部首内の画を比較し、負の位置の類似性
を備えた前記部首候補を取り除く段階を有する請求項１
記載の方法。
【請求項１５】前記評価操作が、複数の抽出した部首候
補を生成し、動的計画法のコストに基づいて前記候補に
ランクを付ける段階を有する請求項１記載の方法。
【請求項１６】草書体の手書き注釈を検索する方法であ
って、注釈の辞書を格納し、前記注釈の意味的に重要な部分に対応する複数の部首を
格納し、検索されるべき手書き注釈を入力し、画の始点および終点情報を用いて、前記手書き注釈内の
各々の画を識別して、さらに局所的な最大点と最小点に
基づいて前記各々の画を分割し、前記分割した各々の画
を用いて前記抽出した部首を表現し、前記抽出した部首と前記格納した複数の部首の間で評価
操作を実行して、少なくとも一つの部首候補を選択し、前記部首候補を用いて、前記辞書の一部を選択し、前記入力した手書き注釈と前記一部の間で整合操作を実
行して、前記辞書から注釈を検索する方法。
【請求項１７】さらに、選択した局所的な最大点と最小
点を選択的に取り除く請求項１６記載の方法。
【請求項１８】前記抽出段階が、前記入力した手書き注
釈内の接続している画を識別し、前記接続している画を
取り除くことによって行われる請求項１６記載の方法。
【請求項１９】前記評価段階が、前記抽出した部首と前
記格納した複数の部首の両方を、一連の接触した点とし
て表現し、前記各々の一連の接触した点上で、動的計画
法の整合を実行することによって行われる請求項１６記
載の方法。
【請求項２０】前記評価操作が、整合の接近度を示す少
なくとも一つの計画コストの距離を得る動的計画法の整
合操作である請求項１６記載の方法。
【請求項２１】さらに、参照部首の長さを決定し、前記
参照部首の長さに対して、前記計画コストの距離を規格
化する請求項２０記載の方法。
【請求項２２】前記評価操作が、始点および終点に基づ
いて部首を分類する段階を有する、動的計画法の整合操
作である請求項１６記載の方法。
【請求項２３】前記評価操作が、前記抽出した部首と、
前記格納した複数の部首に関する接線ベクトルを比較す
ることによって、置換コストを計算する段階を有する動
的計画法の整合操作である請求項１６記載の方法。
【請求項２４】前記評価操作が、前記抽出した部首の中
心と前記格納した複数の部首の中心の間の関係を評価す
る段階を有する、動的計画法の整合操作である請求項１
６記載の方法。
【請求項２５】前記評価操作が、前記抽出した部首と前
記格納した複数の部首の始点および終点を評価する段階
を有する、動的計画法の整合操作である請求項１６記載
の方法。
【請求項２６】前記評価操作が、前記抽出した部首内の
画と前記複数の部首内の画を比較し、負の位置の類似性
を備えた前記部首候補を取り除く段階を有する請求項１
６記載の方法。
【請求項２７】前記評価操作が、複数の抽出した部首候
補を生成し、動的計画法のコストに基づいて前記候補に
ランクを付ける段階を有する請求項１６記載の方法。
【請求項２８】草書体の手書き注釈から部首を抽出する
方法であって、検索されるべき手書き注釈を入力し、まず前記入力した手書き注釈を規格化し、次に前記手書
き注釈の一部を識別して、抽出した部首を表現すること
によって、前記入力した手書き注釈から少なくとも一つ
の部首を抽出する方法。
【請求項２９】前記規格化段階が、複数の点として前記
手書き注釈を表現し、入力した手書き注釈が所定の大き
さに対応するように、前記点の間の間隔を伸縮すること
によって行われる請求項２８記載の方法。
【請求項３０】前記抽出段階が、前記入力した手書き注
釈内の複数の画を識別し、前記複数の画に関する上下情
報に基づいて、前記複数の画を編成することによって行
われる請求項２８記載の方法。
【請求項３１】前記抽出段階が、前記入力した手書き注
釈内の複数の画を識別し、前記複数の画内の局所的な最
大点と最小点に基づいて、前記複数の画を編成すること
によって行われる請求項２８記載の方法。
【請求項３２】さらに、選択した局所的な最大点と最小
点を選択的に取り除く請求項３１記載の方法。
【請求項３３】前記抽出段階が、前記入力した手書き注
釈内の接続している画を識別し、前記接続している画を
取り除くことによって行われる請求項２８記載の方法。
【請求項３４】草書体の手書き注釈から部首を抽出する
方法であって、検索されるべき手書き注釈を入力し、画の始点および終点情報を用いて、前記手書き注釈内の
各々の画を識別し、さらに局所的な最大点と最小点に基
づいて前記各々の画を分割し、前記分割した各々の画を
用いて、前記抽出した部首を表現することによって、前
記入力した手書き注釈から少なくとも一つの部首を抽出
する方法。
【請求項３５】さらに、選択した局所的な最大点と最小
点を選択的に取り除く請求項３４記載の方法。
【請求項３６】前記抽出段階が、前記入力した手書き注
釈内の接続している画を識別し、前記接続している画を
取り除くことによって行われる請求項３４記載の方法。
【請求項３７】手書き注釈を整合する動的計画法の手続
きにおいて、画の置換コストを決定する改良された方法
であって、比較されるべき複数の画を識別し、比較する各々の画に接線ベクトルを割り当て、置換コストを前記ベクトル間の関係に基づくものとする
方法。
【請求項３８】手書き注釈を整合する動的計画法の手続
きにおいて、画の置換コストを決定する改良された方法
であって、比較されるべき複数の画を識別し、比較する各々の画に関する重心を決定し、置換コストを前記重心間の関係に基づくものとする方
法。
【請求項３９】手書き注釈を整合する動的計画法の手続
きにおいて、画の置換コストを決定する改良された方法
であって、比較されるべき複数の画を識別し、整合操作を実行して一対の画を識別し、前記複数の画の始点および終点の関係を用いて、置換コ
ストを計算する方法。
【請求項４０】請求項３４記載の草書体の手書き注釈を
検索する方法であって、さらに、入力した注釈を使用者から受け取り、注釈の辞書を格納し、前記抽出した部首を用いて前記辞書の一部を選択し、前記入力した手書き注釈と前記一部の間で整合操作を実
行して、前記辞書から注釈を検索する方法。
【請求項４１】草書体の手書き注釈を検索する方法であ
って、注釈の辞書を格納し、前記注釈の意味的に重要な部分に対応する複数の部首を
抽出し、検索されるべき手書き注釈を入力し、前記入力した手書き注釈から少なくとも一つの部首を抽
出し、前記抽出した部首と前記格納した複数の部首の間で評価
操作を実行して、少なくとも一つの部首候補を識別し、前記部首候補を用いて前記辞書の一部を選択し、前記入力した手書き注釈と前記一部の間で整合操作を実
行して、前記辞書から注釈を検索する方法。
【請求項４２】草書体の手書き注釈を検索する方法であ
って、注釈の辞書を格納し、前記注釈の意味的に重要な部分に対応する複数の部首を
格納し、検索されるべき手書き注釈を入力し、前記手書き部首内の各々の画を識別し、前記各々の画と
前記格納した複数の部首の各々に接線ベクトルを割り当
て、置換コストの計算において前記接線ベクトル間の関
係を用い、前記各々の画と前記格納した複数の部首の間
で動的計画法を実行して、置換コストの計算において前
記割り当てた接線ベクトルを用いることによって、前記
入力した手書き注釈から少なくとも一つの部首を抽出
し、前記抽出した部首と前記格納した複数の部首の間で
評価操作を実行して、少なくとも一つの部首候補を識別
し、前記部首候補を用いて前記辞書の一部を選択し、前記入力した手書き注釈と前記一部の間で整合操作を実
行して、前記辞書から注釈を検索する方法。
【請求項４３】接線ベクトルの前記割り当てにおいて、少なくとも一対の点の第一点を前記各々の画から、前記
一対の点の第二点を前記格納した複数の部首から見出
し、前記各々の画の第一接線ベクトルを前記一対の点の前記
第一点で、前記格納した複数の部首の第二接線ベクトル
を前記一対の点の前記第二点で計算する請求項４２記載
の方法。
【請求項４４】前記関係が、前記第一接線ベクトルと前
記第二接線ベクトルの間の角度である請求項４２記載の
方法。
【請求項４５】草書体の手書き注釈を検索する方法であ
って、注釈の辞書を格納し、前記注釈の意味的に重要な部分に対応する複数の部首を
格納し、検索されるべき手書き注釈を入力し、前記手書き部首内の各々の画を識別し、前記各々の画と
前記格納した複数の部首に関する重心情報を決定し、そ
の重心情報内の関係を用いて、置換コストを計算し、前記抽出した部首と前記格納した複数の部首の間で評価
操作を実行して、少なくとも一つの部首候補を識別し、前記部首候補を用いて前記辞書の一部を選択し、前記入力した手書き注釈と前記一部の間で整合操作を実
行して、前記辞書から注釈を検索する方法。
【請求項４６】前記重心情報を決定する段階で、前記
各々の画から第一の対の画を識別し、前記格納した複数の部首から第二の対の画を識別し、第
一画が前記第一の対の画の第一画に対応し、第二画が前
記第一の対の画の第二画に対応し、前記第一の対の画の重心間で第一ベクトルを構成し、前記第二の対の画の重心間で第二ベクトルを構成する請
求項４５記載の方法。
【請求項４７】前記関係が、前記第一ベクトルと前記第
二ベクトルの間の角度である請求項４５記載の方法。
【請求項４８】草書体の手書き注釈を検索する方法であ
って、注釈の辞書を格納し、前記注釈の意味的に重要な部分に対応する複数の部首を
格納し、検索されるべき手書き注釈を入力し、前記手書き部首内の各々の画を識別し、前記各々の画と
前記格納した複数の部首に関する始点および終点情報を
決定し、その始点および終点情報内の関係を用いて、置
換コストを計算し、前記抽出した部首と前記格納した複数の部首の間で評価
操作を実行して、少なくとも一つの部首候補を識別し、前記部首候補を用いて前記辞書の一部を選択し、前記入力した手書き注釈と前記一部の間で整合操作を実
行して、前記辞書から注釈を検索する方法。
【請求項４９】前記始点および終点情報の決定におい
て、前記各々の画から第一の対の画を識別し、前記格納した複数の部首から第二の対の画を識別し、第
一画が前記第一の対の画の第一画に対応し、第二画が前
記第一の対の画の第二画に対応し、前記第一の対の画の第一画の終点と、前記第一の対の画
の第二画の始点の間で第一ベクトルを構成し、前記第二の対の画の第一画の終点と、前記第二の対の画
の第二画の始点の間で第二ベクトルを構成する請求項４
８記載の方法。
【請求項５０】前記関係が、前記第一ベクトルと前記第
二ベクトルの間の角度である請求項４８記載の方法。
【請求項５１】手書き注釈を整合する動的計画法の手続
きにおいて、前記注釈内に含まれる部首を評価する改良
された方法であって、入力した手書き注釈上で部首を抽出し、第一の動的計画
法の操作を用いて複数の抽出した部首候補を生成し、前
記操作が前記複数の抽出した部首候補の各々に関する一
組のコストを生成し、前記部首候補の各々を部首コードと関連付け、第二の動的計画法の操作を用いて前記部首コードを評価
し、前記操作において、前記第一の動的計画法の操作中
に決定した前記一組のコストを用いて、置換コストを決
定する方法。