JP2000250945A - 手書きノート用インデックス発生方法、インクワードの等価クラス識別方法、コンピュータリーダブル媒体及びコンピュータ - Google Patents

手書きノート用インデックス発生方法、インクワードの等価クラス識別方法、コンピュータリーダブル媒体及びコンピュータ

Info

Publication number
JP2000250945A
JP2000250945A JP2000042389A JP2000042389A JP2000250945A JP 2000250945 A JP2000250945 A JP 2000250945A JP 2000042389 A JP2000042389 A JP 2000042389A JP 2000042389 A JP2000042389 A JP 2000042389A JP 2000250945 A JP2000250945 A JP 2000250945A
Authority
JP
Japan
Prior art keywords
index
ink
generating
words
term
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2000042389A
Other languages
English (en)
Other versions
JP3931519B2 (ja
Inventor
Lynn D Wilcox
ディー.ウィルコックス リン
Patrick Chiu
チィーウ パトリック
Cass Todd
キャス トッド
Shingo Uchihashi
真吾 内橋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd filed Critical Fuji Xerox Co Ltd
Publication of JP2000250945A publication Critical patent/JP2000250945A/ja
Application granted granted Critical
Publication of JP3931519B2 publication Critical patent/JP3931519B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/31Indexing; Data structures therefor; Storage structures
    • G06F16/316Indexing structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • G06F16/355Class or cluster creation or modification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/231Hierarchical techniques, i.e. dividing or merging pattern sets so as to obtain a dendrogram
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting
    • G06F40/171Editing, e.g. inserting or deleting by use of digital ink
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/32Digital ink
    • G06V30/333Preprocessing; Feature extraction
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/32Digital ink
    • G06V30/36Matching; Classification
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • Y10S707/99933Query processing, i.e. searching
    • Y10S707/99936Pattern matching access

Abstract

(57)【要約】 【課題】 ディジタルインクのストロークに基づいて、
手書きノートに対するインデックスを自動的に発生する
システムを提供すること。 【解決手段】 手書きノート中のインクワークの複数の
ペアの発生回数とペアワイズ距離との関係を表す分布カ
ーブが発生される。分布カーブの急激な変化点τは、分
布カーブ上のペアワイズ距離全体に亘って、0からτま
での傾きの第1のライン710と急激な変化点τからの
一定の傾きより成る第2のライン720で近似される。
分布カーブτの急激な変化は、クラスタリングのための
閾値として選択される。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、ディジタルインク
を捕獲するコンピュータシステムの分野に関し、より詳
細には、手書きノートに対するインデックスの自動発生
に関する。
【0002】
【従来の技術】パーソナルディジタルアシスタント(P
DA)を含む幾つかのコンピュータシステムによって、
ユーザは、手書きのものをコンピュータに入力出来る。
本質的に、これらのコンピュータ及びPDAは、ユーザ
が手書きのものを表面に書き込むことが出来、手書きの
ものやノートは、連続的に”ディジタルインク”にサン
プリングされる。これらのコンピュータシステムの一用
途は、ユーザが電子ノート取りを出来ることである。
【0003】紙へのノート取りに比較して電子ノート取
りの一潜在的利点は、電子ノート取りにおいて、インデ
ックスを生成する能力である。一般に、インデックス
は、手書きノート内で特定の情報を検出する手段を提供
する。紙へのノート取りでは、このようなインデックス
は、手作業で作られなければならない。この手作業は困
難なために、紙へノートを取る者は、アンダーラインを
引いたり、円で囲んだり、重要なものへ続くアステリス
クを付けることによって重要な用語やキーワードをマー
クする傾向がある。このタイプのハイライティング(強
調)は、ユーザが、ノートをブラウジングしながら重要
な情報を検出するのを助けるが、インデックスを提供し
ない。
【0004】電子ドキュメントやテキストシステム(即
ち、テキストがそのシステムによって経験的事実認識に
基づいて認識される)において、自動”巻末”インデッ
クス生成する技術がある(1998年の会報COMPUTER
M,ACL ColingのH. Schutze氏の”The Hypertext C
oncordance: A Better Back-Of-The-Book Index”
を参照のこと)。これらの巻末インデックスによって、
ユーザは、インデックス中のキーワードリストを走査し
てそのテキスト中のインデックス用語の発生を検出出来
る。いかしながら、これらの電子テキストシステムは、
キーボードから等により、ユーザがテキストをそのシス
テムに直接入力することに基づく。
【0005】他の電子テキストシステムにおいて、情報
検索技術がテキストドキュメントのインデックス付けを
自動的に行うために使用される。例えば、一つのそのよ
うなシステムにおいて、インデックス用語は、用語発生
の相対頻度に基づいて、ウエブ(Web)ページに対して
選択される(1998年の会報COMPUTERM,ACL Coling
のH. Schutze氏の”The Hypertext Concordance: A
Better Back-Of-The-Book Index”を参照のこ
と)。しかしながら、これらの技術は、ディジタルイン
ク中のワードが経験的事実認識的に識別されないので、
直接的にはディジタルインクへ適用しない。理論的に
は、文字認識を使用してディジタルインクをテキストへ
変換する試みが行われてもよい。しかしながら、文字認
識は、手書きでデータに関しては正確ではない。従っ
て、文字認識を行うことなく、ディジタルインクとして
コンピュータへ入力された手書きデータから自動的にイ
ンデックスを発生することが望ましい。
【0006】ユーザの手作業によるインデックス付け
は、テキストよりもディジタルインクを使用する電子シ
ステムにおいて可能である。一例は、FX Palo Alto
Laboratory (ゼロックス社、パロアルト研究所)で開
発され、Dynomite System (ダイノマイトシステム)
によって提供されるような、及び Marquis (K. Web
er氏とA. Poon氏のCHIN 94の”Marquis: A Tool F
or Real-Time VideoLogging"を参照のこと)によって
提供されるような、電子ノートのセクションへのキーワ
ードの適用である。しかしながら、インデックスを発生
するためにユーザが手作業でキーワードを識別すること
が必要であることは、ノートを取っている間中ユーザの
その部分への認識努力を必要とする。
【0007】ユーザの手作業によるディジタルインクの
インデックス付けに対する他の適用は、ダイノマイトシ
ステムにおけるインク特性の発展に起因する。インク特
性は、選択されたディジタルインクへ適用されるデータ
タイプであり、そのインクが連続的にタイプによって検
索され得る。データタイプの例は、”名前(nam
e)”や”すべき(to do)”用語を含む。所与の
インク特性に対するインクインデックスページは、ユー
ザによってその特性を含む全てのノートのすばやい走査
を可能とするために生成される。更に、インデックスペ
ージ上のノートは、それらのノート内の元の位置へハイ
パーリンクされる。ディジタルインクシステムに対する
インデックスを発生するためのキーワードとインク特性
の両方の手作業によるアプローチに関連する一つの顕著
な問題は、それらのアプローチにはユーザの大きな認識
努力が必要である。その結果、これらの技術は、ユーザ
がそうするために一般に十分に訓練されていないため
に、実用的ではない。
【0008】歴史的手書きのドキュメント画像を手作業
によるインデックス付けのためのシステムは、1996
年ACM Digital LibrariesのR. Manmatha氏、Chengfe
ngHan氏、E.M. Riseman氏、W.B. Croft氏の”Indexin
g Handwriting Using Word Matching”に記述され
ている。この技術において、画像は、ワードにセグメン
ト化し、ワード等価クラスがワード同士間のマッチスコ
アを閾値化することによって検出される。この技術は、
ワード等価クラスを指定するためにユーザが手作業によ
るワード入力を必要とする。次に、インデックス用語
が、最も大きなワード等価クラスから選択される。更
に、ストップワードが手作業で削除される。手書きデー
タ上のストローク情報が利用されないので、マッチスコ
アがワード画像のみに基づいて演算される。従って、ユ
ーザの努力無しに、手書きディジタルインクに対するイ
ンデックスを自動的に生成することが望ましい。
【0009】スクリブル(scribble)マッチングと呼ば
れる技術が、CHI95のA. Poon氏、T. Cass氏の”Scr
ibbler: A Tool For Searching Digital Ink”に
記述されている。一般に、スクリブルマッチングは、手
書きドキュメントの所与のワードの発生回数を検出する
ことを含む。この技術は、そのドキュメント中の所与の
手書きワードとワード間のスコアを演算するためにダイ
ナミックプログラミングを使用することに基づく。ま
た、同様の方法は、1994年12月のFourthInternat
ional Workshop on Frontier of Handwriting Re
cognitionのD. Lopresti氏、A. Tomkins氏の”On Th
e Searchability Of ElectronicInk"に記述されてい
る。
【0010】
【発明が解決しようとする課題】以下に十分に記述され
るように、本発明は、ディジタルインクのストロークに
基づいて、手書きノートに対するインデックスを自動的
に発生するシステムを提供することをその課題とする。
【0011】
【課題を解決するための手段】システムは、コンピュー
タにおいてディジタルインクとして捕獲される手書きノ
ートに対するインデックスを自動的に発生する。このノ
ートのワードに大まかに対応するインクワードが識別さ
れる。それらのインクワードの特徴が演算され、二つの
インクワード間の特徴における距離を測定するペアワイ
ズ距離又はマッチスコアが計算される。このペアワイズ
距離に基づいて、インクワードの等価クラスがインクワ
ードをクラスタリングすることから決定される。手書き
ノートに対するインデックスに現れるインデックス用語
が、インクワードの等価クラスから選択される。このシ
ステムは、インデックス用語が現れる手書きノート中の
位置を識別するインデックス用語に対する位置情報を発
生する。インデックス用語のインデックスがこの位置情
報で表示される。一実施の形態において、ノートインデ
ックスは、インデックス用語に続いて表示されるページ
番号を含み、インデックス用語が現れる手書きノート中
のページを識別する。他の実施の形態において、インデ
ックスは、ハイパーリンクされたインデックス用語を含
む。
【0012】システムは、手書きノート中のインデック
ス用語の等価クラスを識別する技術を含む。閾値は、イ
ンクワードのクラスタリングに対する最大ペアワイズ距
離を識別するために発生される。具体的に、手書きノー
ト中のインクワークの複数のペアの発生回数とペアワイ
ズ距離との関係を表す分布カーブが発生される。分布カ
ーブの急激な変化点(knee)τは、分布カーブ上の
ペアワイズ距離全体に亘って、0からτの傾きの第1の
ラインと急激な変化点τからの一定の傾きより成る第2
のラインで近似される。分布カーブの急激な変化点τ
は、クラスタリングのための閾値として選択される。次
に、本発明の具体的態様を記述する。第1の態様は、コ
ンピュータにおいてディジタルインクとして捕獲される
手書きノートに対するインデックスを発生するための方
法であって、前記方法は、コンピュータにおいてディジ
タルインクとして捕獲された手書きノートに対する生の
データのストロークを処理して、少なくとも一つのイン
クワードを有するインテックス用語として識別するステ
ップと;前記インデックス用語を前記インデックス用語
が位置される前記手書きノートの位置へリンクすること
によって前記インデックス用語に対するインデックスを
発生するステップと、前記手書きノートに対する前記イ
ンデックスを出力ディスプレイ上にディスプレイするス
テップと、を備える。第2の態様は、第1の態様におい
て、インデックスを発生する前記ステップは、前記イン
デックス用語に対する前記手書きノートのページ番号を
発生するステップを有し、インデックスをディスプレイ
する前記ステップは、インテックス用語と共に前記ペー
ジ番号をディスプレイするステップを有する。第3の態
様は、第1の態様において、インデックスを発生する前
記ステップは、前記インデックス用語を前記手書きノー
トの位置へリンクするためにハイパーリンクされたイン
デックス用語を発生するステップを有し、インデックス
をディスプレイする前記ステップは、ハイパーリンクさ
れたテキストとしてインデックス用語をディスプレイす
るステップを有する。第4の態様は、コンピュータにお
いてディジタルインクとして捕獲される手書きノートに
対するインデックスを発生する方法であって、前記方法
は、前記手書きノートから複数のインクワードを識別す
るステップと、所定の閾値内でペアワイズ距離を有する
少なくとも二つのインクワードを有する前記インクワー
ドの少なくとも一つの等価クラスを発生するステップ
と、前記等価クラスのインデックスワードの少なくとも
一つを前記コンピュータ手書きノートに対するインデッ
クス用語として選択するステップと、前記インデックス
用語が位置される前記手書きノートの位置への等価クラ
スの前記インデックス用語からのリンクを発生するため
に、選択された前記インデックス用語に対するインデッ
クスを発生するステップと、を備える。第5の態様は、
第4の態様において、前記インクワードの少なくとも一
つの等価クラスを発生する前記ステップは、前記手書き
ノートの生データのストロークの時間距離と空間距離に
基づいて、複数の特徴シーケンスを発生するステップ
と、前記特徴シーケンスに基づいて、前記ペアのインク
ワードに対する前記ペアワイズ距離を発生するステップ
と、前記ペアワイズ距離に基づいて前記インクワードを
前記等価クラスにクラスタリングするステップと、を備
える。第6の態様は、第5の態様において、前記インク
ワードを前記等価クラスにクラスタリングする前記ステ
ップは、前記インクワードの各々を初期クラスタとして
識別するステップと、一つの単一のクラスタを発生する
ために、最も近接するペアワイズ距離よりなる二つのク
ラスタを選択するステップと、最大ペアワイズ距離を定
義するために閾値を選択するステップと、一つの単一の
クラスタを発生するために、前記最も近接するペアワイ
ズ距離が前記閾値を超えるまで、最も近接するペアワイ
ズ距離よりなる二つのクラスタを選択する前記ステップ
を繰り返すステップと、を備える。第7の態様は、第6
の態様において、閾値を選択する前記ステップは、ペア
ワイズ距離と前記インクワードの複数のペアの発生回数
との関係を表す分布カーブを発生するステップと、前記
分布カーブの急激な変化点τを識別するステップであっ
て、前記分布カーブ全体に亘って、0から前記急激な変
化点τまでの傾きの第1のラインと前記急激な変化点τ
から一定の傾きを有する第2のラインとに前記分布カー
ブを近似することによってなされるステップと、前記閾
値として、前記分布カーブの急激な変化点τによって近
似された前記ペアワイズ距離を選択するステップと、を
備える。第8の態様は、第4の態様において、インデッ
クス用語として前記等価クラスのインクワードの内の少
なくとも一つを選択する前記ステップは、前記手書きノ
ート全体に亘って、非均一に発生するインデックス用語
を選択するステップを備える。第9の態様は、コンピュ
ータに入力された手書きノートのインクワードの等価ク
ラスを識別する方法であって、前記方法は、手書きノー
トから複数のインクワードを識別するステップと、前記
インクワードの複数の特徴を識別するステップと、前記
特徴に基づいて、前記インクワード間のペアワイズ距離
を発生するステップと、ペアワイズ距離と手書きノート
の前記インクワードの複数のペアの発生回数との関係を
表す分布カーブを発生するステップと、前記分布カーブ
の急激な変化点τを識別するステップであって、前記分
布カーブ全体に亘って、0から前記急激な変化点τまで
の傾きの第1のラインと前記急激な変化点τから一定の
傾きを有する第2のラインとに前記分布カーブを近似す
ることによってなされるステップと、クラスタリングす
るための閾値として、前記分布カーブの急激な変化点τ
によって近似された前記ペアワイズ距離を選択するステ
ップと、前記閾値のペアワイズ距離内で前記インクワー
ドのクラスタを発生することによって前記インクワード
の少なくとも一つの等価クラスを識別するステップと、
を備える。第10の態様は、コンピュータによって実行
される時に、コンピュータにおいてディジタルインクと
して捕獲された手書きノートに対する生のデータのスト
ロークを処理して、少なくとも一つのインクワードを有
するインテックス用語を識別するステップと、前記イン
デックス用語を前記インデックス用語が位置される前記
手書きノートの位置へリンクすることによって前記イン
デックス用語に対するインデックスを発生するステップ
と、前記手書きノートに対する前記インデックスを出力
ディスプレイ上にディスプレイするステップと、を前記
コンピュータに実行させる複数の命令を備えるコンピュ
ータリーダブル媒体である。第11の態様は、第10の
態様において、インデックスを発生する前記ステップ
は、前記インデックス用語に対する前記手書きノートの
ページ番号を発生するステップを有し、インデックスを
ディスプレイする前記ステップは、インテックス用語と
共に前記ページ番号をディスプレイするステップを有す
る。第12の態様は、第10の態様において、インデッ
クスを発生する前記ステップは、前記インデックス用語
を前記手書きノートの位置へリンクするためにハイパー
リンクされたインデックス用語を発生するステップを有
し、インデックスをディスプレイする前記ステップは、
ハイパーリンクされたテキストとしてインデックス用語
をディスプレイするステップを有する。第13の態様
は、コンピュータによって実行される時に、手書きノー
トから複数のインクワードを識別するステップと、所定
の閾値内でペアワイズ距離を有する少なくとも二つのイ
ンクワードを有する前記インクワードの少なくとも一つ
の等価クラスを発生するステップと、インクワードの前
記等価クラスの内の少なくとも一つを前記コンピュータ
手書きノートに対するインデックス用語として選択する
ステップと、前記インデックス用語が位置される前記手
書きノートの位置への等価クラスの前記インデックス用
語からのリンクを発生するために、選択された前記イン
デックス用語に対するインデックスを発生するステップ
と、を前記コンピュータに実行させる複数の命令を備え
るコンピュータリーダブル媒体である。第14の態様
は、第13の態様において、前記インクワードの少なく
とも一つの等価クラスを発生する前記ステップは、前記
手書きノートの生データのストロークの時間距離と空間
距離に基づいて、複数の特徴シーケンスを発生するステ
ップと、前記特徴シーケンスに基づいて、前記ペアのイ
ンクワードに対する前記ペアワイズ距離を発生するステ
ップと、前記ペアワイズ距離に基づいて前記インクワー
ドを前記等価クラスにクラスタリングするステップと、
を備える。第15の態様は、第14の態様において、前
記インクワードを前記等価クラスにクラスタリングする
前記ステップは、前記インクワードの各々を初期クラス
タとして識別するステップと、単一のクラスタを発生す
るために、最も近接するペアワイズ距離よりなる二つの
クラスタを選択するステップと、最大ペアワイズ距離を
定義するために閾値を選択するステップと、単一のクラ
スタを発生するために、前記最も近接するペアワイズ距
離が前記閾値を超えるまで、最も近接するペアワイズ距
離よりなる二つのクラスタを選択する前記ステップを繰
り返すステップと、を備える。第16の態様は、第15
の態様において、閾値を選択する前記ステップは、ペア
ワイズ距離と前記インクワードの複数のペアの発生回数
との関係を表す分布カーブを発生するステップと、前記
分布カーブの急激な変化点τを識別するステップであっ
て、前記分布カーブ全体に亘って、0から前記急激な変
化点τまでの傾きの第1のラインと前記急激な変化点τ
から一定の傾きを有する第2のラインとに前記分布カー
ブを近似することによってなされるステップと、前記閾
値として、前記分布カーブの急激な変化点τによって近
似された前記ペアワイズ距離を選択するステップと、を
備える。第17の態様は、第13の態様において、イン
デックス用語として前記等価クラスのインデックスワー
ドの内の少なくとも一つを選択する前記ステップは、前
記手書きノート全体に亘って、非均一に発生するインデ
ックス用語を選択するステップを備える。第18の態様
は、コンピュータによって実行される時に、前記コンピ
ュータに、手書きノートから複数のインクワードを識別
するステップと、前記インクワードの複数の特徴を識別
するステップと、前記特徴に基づいて、前記インクワー
ド間のペアワイズ距離を発生するステップと、ペアワイ
ズ距離と手書きノートの前記インクワードの複数のペア
の発生回数との関係を表す分布カーブを発生するステッ
プと、前記分布カーブの急激な変化点τを識別するステ
ップであって、前記分布カーブ全体に亘って、0から前
記急激な変化点τまでの傾きの第1のラインと前記急激
な変化点τから一定の傾きを有する第2のラインとに前
記分布カーブを近似することによってなされるステップ
と、クラスタリングするための閾値として、前記分布カ
ーブの急激な変化点τによって近似された前記ペアワイ
ズ距離を選択するステップと、前記閾値のペアワイズ距
離内で前記インクワードのクラスタを発生することによ
って前記インクワードの少なくとも一つの等価クラスを
識別するステップと、を実行させる複数の命令を備える
コンピュータリーダブル媒体である。第19の態様は、
コンピュータであって、手書きノートから生のデータの
ストロークを受信するためのユーザ入力ペンベースデバ
イスと、前記ユーザ入力ペンベースデバイスに連結さ
れ、各々が少なくとも一つのインクワードを有する複数
のインデックス用語を識別するために、手書きノートに
対する生データの前記ストロークを処理し、且つ前記イ
ンデックス用語を前記インデックス用語が位置する前記
手書きノートの位置へリンクすることによって前記イン
デックス用語に対するインデックスを発生するためのプ
ロセッサユニットと、前記プロセッサユニットに連結さ
れ、前記手書きノートに対する前記インデックスをディ
スプレイするための出力ディスプレイと、を備える。
【0013】
【発明の実施の形態】システムの概略図1は、手書きイ
ンクノートシステムの自動インデックス発生のための一
実施の形態を示すブロック図である。好ましい実施の形
態において、自動インデックス付けシステム100は、
パーソナルディジタルアシスタント(PDA)のような
コンピュータで実施される。システム100は、PDA
/コンピュータペンベースのインターフェース110を
含む。PDA/コンピュータペンベースのインターフェ
ース110は、ユーザから手書きノートを受信し、ディ
ジタルインクノート120を発生する。あらゆるタイプ
のペンベースのインターフェースがディジタルインクノ
ート120を発生するために使用され得る。ディジタル
インクノート120は、ユーザによってペンベースのイ
ンターフェース110上に発生されるジェスチャー及び
ストロークのディジタルバージョンを含む。
【0014】一般に、システム100は、ディジタルイ
ンクノート110を処理してノートインデックス130
を発生する。ノートインデックス130は、ディジタル
インクノート120に対する、”インデックス用語”と
呼ばれる用語を含むインデックスである。ノートインデ
ックス130は、これらのインデックス用語が位置され
るディジタルインクノート120中の位置にインデック
ス用語をリンクするための情報を提供する。この実施の
形態において、ノートインデックス130を発生するた
めに、システムは、インクワード処理部140、距離処
理部170、階層クラスタ分析部180、閾値推定処理
部150、インデックス用語選択処理部190、及びイ
ンデックス発生部160を含む。
【0015】図2は、手書きノートに対するインデック
スを自動的に発生する一実施の形態を示すフロー図であ
る。この実施の形態において、システム110(図1)
は、ディジタルノート120に事前処理してノートイン
デックス130を発生する。具体的には、インクワード
が識別される(図2のブロック200及び図1のインク
ワード処理部140)。以下により詳細に記述されるよ
うに、ディジタルインクノート120中の実際のワード
に略対応するインクワードは、時間的及び空間的グルー
プ化に基づく。特徴がインクワードに対して演算される
(図2のブロック205と図1のインクワード処理部1
40)。以下に十分に記述されるように、特徴は、各イ
ンクワード毎の生のデータのインクストロークの特徴を
識別する。ダイナミックプログラミングは、インクワー
ドのペアに対するペアワイズ距離又はマッチスコアを演
算するために使用される(図2のブロック210と図1
の距離処理部170)。一般に、ペアワイズ距離は、二
つのインクワードワード間の特徴の距離を測定する。
【0016】図1と図2の実施の形態において、階層ク
ラスタ分析がインクワードの等価クラスを識別するため
に実行される(図2のブロック230と図1の階層クラ
スタ分析部180)。一般に、インクワードの等価クラ
スは、同様な特徴を有するディジタルインクノート12
0からこれらのインクワードを定義する。大部分の事例
では、同じ等価クラス中のインクワードは、同じワード
であってもよい。しかしながら、他の事例では、ワード
中に僅かな違いがあってもよい(例えば、”point
ing”と”painting”は、図9に示されるよ
うに、同じ等価クラスにあってもよい)。階層クラスタ
分析を効果的に適用して等価クラスを識別するために、
閾値が演算される(図2のブロック220と図1の閾値
推定処理部150)。閾値推定処理部150は、インク
ワードを等価クラスにクラスタリングするために使用さ
れる最大ペアワイズ距離を定義するために閾値を推定す
る。一般に、本発明の新規な閾値推定処理は、ディジタ
ルインクノート120に対する対応するペアワイズ距離
(即ち、マッチスコア)と発生回数との間の関係を描く
分布カーブを発生し(例えば、図7参照)、この分布カ
ーブの急激な変化点を閾値と推定する。この閾値を使用
して、階層クラスタリング技術がインクワードの等価ク
ラスを識別する(図2のブロック230と図1の階層ク
ラスタ分析部180)。
【0017】インデックス用語が、インクワードの等価
クラスから選択される(図2のブロック240と図1の
インデックス用語選択処理部190)。一般に、インデ
ックス用語処理部190は、ディジタルインクノート1
20におけるインクワードの分布が不均一である場合、
インクワードの等価クラスを選択する。このように、ド
キュメントの複数の場所に現れるがドキュメントの全体
に亘って均一には現れない(例えば、その用語が全ての
ページには現れない)インデックス用語は、用語をイン
デックス付けするための最良の選択を行う。
【0018】ディジタルインクノート120は、選択さ
れたインデックス用語を使用してインデックス付けされ
る(図2のブロック250と図1のインデックス発生部
160)。ノートインデックスを発生するために、イン
デックス用語は、そのインデックス用語が現れるディジ
タルインクノート120中の位置を指す。例えば、一実
施の形態において、各インデックス用語は、その用語が
現れるディジタルインクノートのページを識別するため
にラベル付けされる。また、インデックス用語は、その
用語が現れるディジタルインクノートのページにハイパ
ーリンクされる。他の実施の形態において、インデック
ス用語は、それらがノートページに現れると、肉太字体
にされる。従って、ノートインデックス130によっ
て、システムのユーザがディジタルインクノート120
内のインデックス用語を容易に検出可能となる。
【0019】インクワード事前処理 一般に、インクワード再処理は、ディジタルインクノー
トの再サンプリング、再サンプリングされたディジタル
インクノートのインクワードへの解析、インクワードに
対する特徴シーケンスの発生、及びインクワードのペア
に対するペアワイズ距離即ちマッチスコアの計算を含
む。インクワードは、最初に生のデータインクストロー
クを”インクワード”にグループ化することによって解
析される。インクワードは、ディジタルインクノート中
のワードに大まかに対応する。これらのグループ化
は、”インクワード”と呼ばれ、ノートの実際のワード
からそれらを区別する。当該技術のおいて公知であるよ
うに、ディジタルインクノート120中のインクワード
の各ストロークに対する生のデータは、時間に関して等
しく分割された軌線上の一連のサンプリングされた点で
ある。インクワード処理部140は、サンプル点が時間
と空間距離に基づくように、ディジタルインクノート1
20のストロークを再サンプリングする。本発明の一実
施の形態に従う再サンプリングの更なる説明は、参照に
より明白にここに組み込まれる、T. Tenev氏、L. Wil
cox氏、T. Cass氏の”A System And Method For
RecognizingUser Specified Pen-Based Gestures U
sing Hidden Markov Models"と題する米国特許出願
シリアル番号第09/128,255を参照のこと。こ
の再サンプリングは、距離処理部170の堅牢性を改良
する。
【0020】インクワードに対する特徴は、再サンプリ
ングされた点を使用して演算される。図3は、特徴シー
ケンスを識別するための座標を有する例示の再サンプリ
ングされたインクワード”word”を示す。この実施
の形態に対して、演算された特徴は、 1)タンジェント角θn 2)現在のタンジェント角δθnの導関数 3)現在のタンジェント角δ2θnの2次導関数 4)タンジェント角sinθnのsin 5)タンジェント角cosθnのcosin 再サンプリングされた点(Xn,Yn)に対するθnを測
定するための基準角が図3に示される。各ストローク
は、一つの特徴ベクトルシーケンスを生成する。一つの
インクワードから成る、ストロークのグループにおける
全ての特徴シーケンスは、共に結合されて各インクワー
ドに対する単一の特徴シーケンスを生成する。本発明
は、上述の特徴シーケンスを使用して記述されるが、イ
ンクワードの特徴を十分に記述するあらゆる特徴シーケ
ンスが、本発明の精神及び範囲を逸脱することが無い限
り、使用され得る。
【0021】インクワードに対するマッチスコア ダイナミックプログラミングがインクワードのペアに対
するマッチスコアを演算するために使用される。長さM
とNの二つの特徴シーケンスが与えれれると、それらの
間のスコアマッチングが、初期化ステップ、反復ステッ
プ、終了ステップ、及びスコアマッチングステップで、
以下のように演算される。 初期化 Φ(1,1)= |f1 1−f1 221 1は、シーケンス lのi番目の要素を示し、|f1 1
1 22は、word1(ワード1)のi番目の位置と
word2のj番目の位置の特徴ベクトル同士間のユー
クリッド距離である。反復
【数1】 ここで、kは、図4に示されるように、許容パスを示
す。(ακ,βκ)は、パスkに対する一対の座標増分
に対応する。οκは、パスkのオフセットコスト値であ
り、ωκは、パスkに対する重みである。 {α12345}={1,2,3,4,5} {β12345}={0,1,1,2,1} {ο1,ο2,ο3,ο4,ο5}={1,0,0,0,1} {ω12345}={1,2,1,2,1} j=1又はj=Nの時に、k=1が採用される。i=1
又はi=Mの時にk=5が採用される。不適切なパスは
削除される。例えば、i=2の時のk=2である。終了
【数2】 スコアマッチング マッチスコアは、長さによって正規化されたDPの最終
マッチから演算される。
【数3】
【0022】階層クラスタリング 閾値の推定の後、階層クラスタリングがインクワードに
実行される(図2のブロック220と230)。図5
は、ノートインデックスの自動発生に対する階層クラス
タリングのための一実施の形態を示すフロー図である。
一般に、閾値は、以下十分に議論されるように(図5の
ブロック500と510)、発生回数とペアワイズ距離
との間の関係に対する分布カーブの急激な変化点から推
定される。初めに、階層クラスタリングのために、各イ
ンクワードは、クラスタとして識別される(図5のブロ
ック520)。二つのクラスタ間の最短ペアワイズ距離
(即ち、スコアマッチング)が計算される。例えば、最
初に、クラスタは、最短ペアワイズ距離を有する二つの
インクワードを含むように識別される。このように、こ
の反復のために、これらの二つのインクワードが単一の
クラスタを形成する。二つを越えるインクワードを含む
二つのクラスタ間の距離を演算する時、ペアワイズ距離
を計算するために、各々が異なるクラスタからの二つの
インクワードの全ての組合せの平均距離が使用される。
【0023】識別された最短ペアワイズ距離が閾値と比
較される(図5のブロック540)。最短ペアワイズ距
離が閾値未満の場合、識別された最短ペアワイズ距離を
有する二つのクラスタが新たなクラスタを発生するため
に組み合わされる(図5のブロック550)。クラスタ
を最短ペアワイズ距離と組合せる処理は、識別され得る
最短ペアワイズ距離が閾値よりも大きくなるまで続けら
れる(図5のブロック530、540及び550)。識
別された最短ペアワイズ距離が閾値よりも大きいと、ク
ラスタ組合せ処理が停止し、インクワードの等価クラス
がクラスタから識別される(図5のブロック560)。
【0024】図6は、階層クラスタリングの簡単化され
た例を示す図である。この例に対して、図6の”クラス
タ(cluster)2”とラベル付けされたクラスタ
は、最初、インクワード4と5を含む。次に、インクワ
ード3は、”クラスタ2”を発生するために、インクワ
ード4と5のクラスタと組み合わされる。インクワード
1、7、8及び9より成るクラスタ3がクラスタアルゴ
リズムの3回の繰り返しで発生された。最初に、インク
ワード7と9は、一つのクラスタを形成するために組み
合わされ、次に、インクワード8がインクワード7と9
のクラスタと組み合わされて一つの新たなクラスタを形
成した。最後に、インクワード1がインクワード7,8
及び9のクラスタと組み合わされて”クラスタ3”を形
成した。図6の例において、インクワード2とインクワ
ード6に対応するクラスタ1とクラスタ4は夫々他の一
つのインクワークと組み合わされなかった。一つの単一
のインクワードのみを含むクラスタは、インクワードの
等価クラスからインデックス用語を選択するために使用
されない。
【0025】閾値推定 一実施の形態において、階層クラスタリングをストップ
するための閾値は、以下のように推定される。全てのイ
ンクワード間のペアワイズ距離が演算され、その距離が
γによって量子化され、分布カーブが発生される。次
に、カーブの急激な変化点τは、このカーブを、0から
τの傾きの第1のラインとτ以降の一定の傾きの第2の
ラインとに近似することによって検出される。この近似
は、ラインセグメントの各々に対して二乗誤差の和を最
小にすることによってなされる。上述の手順は、二つの
ステップを有する。第1に、制約条件S=S1+S2(0
<S1,0<S2)下で、連続するS2を有する分布シーケ
ンスD’の第1のS1値を使用してシーケンスDを作
る。 D={d1,d2,...dS1} D’={d’1,d’2,...d’S2} 第2に、カーブの急激な変化点、τ、は、以下の等式を
最小化することによって検出される。
【数4】
【数5】
【数6】
【数7】
【0026】図7は、階層クラスタリングのための閾値
を推定するための例示の分布カーブを示す。図7に示す
ように、垂直軸は、ディジタルインクノート中での発生
回数を示し、水平軸は、インクワードのペア同士間のペ
アワイズ距離を示す。図7に示されるように、距離が増
加すると(水平軸上を左から右に移動すると)、発生回
数が実質的に増加し始める距離がある。二つのラインセ
グメントによって推定されるこの点は、閾値に対する推
定を提供する。図7の例では、図7上の710と720
とラベル付けされた二つのラインから成る。ライン71
0は、0からτまでの傾きの第1のラインを表し、ライ
ン720は、τからτよりも大きな距離までの一定の傾
きの第2のラインを表す。図7でτとラベル付けされた
カーブの急激な変化点は、閾値の推定である。従って、
閾値は、インクワードが同じ等価クラスに対して割り当
てられる特徴シーケンス中の最大差や距離を表す。インデックス用語選択
【0027】インクワードのクラスタが識別されると、
インデックス用語が選択される。一つよりも多くの単一
のインクワードを含むクラスタのみが潜在的なインデッ
クス用語と考えられる。一般に、インデックス用語は、
インデックスノート全体に亘って、不均一な分布を有す
る用語である。分布の不均一性の一つの尺度は、カイ二
乗統計である。一実施の形態において、カイ二乗統計
は、インデックス付けのために有用なインデックス用語
を選択するために使用される。また、短いインクワード
を含むクラスタは、それらの用語が”ストップワード
(stop word)”である傾向があるので、削除
される。
【0028】Lをノートページのトータル数とし、fi
を用語がi番目のノートページに発生する回数とする。
その用語の発生のトータル数は、fであり、そこで
【数8】
【0029】その用語がノートページを介して均一に分
布された場合、その用語が各ノートページで発生すると
期待された回数は、f/Lである。カイ二乗(CHI−
square)統計は、以下のように平均からの偏差を
測定する。
【数9】
【0030】インデックス用語を選択するために、ペー
ジ当りの用語数が指定される。一実施の形態において、
ページ当り略3個の用語が適切である。次に、インデッ
クス用語は、最大のカイ二乗値を有する3L用語として
選択される。或いは、インデックス用語は、各ページ毎
にピックアップされてもよい。この場合、ページ当りの
用語数が指定され、そのカイ二乗は、上述と同じである
(即ち、二つのノートページがあると仮定すると、当該
ページと他の全てのページである)。この方法は、ペー
ジ当り一定数の用語を生成する利点がある。
【0031】ノートインデックス 図8は、太字でハイライトされたインデックス用語を有
するノートページを示す。ノートページ中のハイライト
化(強調)や太字化により、ユーザがノートページをブ
ラウジングするのが容易となる。図8の例示のノートペ
ージに対するインデックス用語は、”Copie
r”、”Human”、”Lab”、”Surfac
e”、及び”Mailto”である。図9は、太字でハ
イライトされたインデックス用語を有する第2のノート
ページを示す。この例では、インデックス用語は、”A
pple”、”Lisa”、及び”Drag”である。
【0032】図10は、本発明の一実施の形態に従って
構成された手書きノートに対するインデックスを示す。
この実施の形態では、各インデックス用語は、対応する
インデックス用語が現れるページの識別番号(ID)で
ラベル付けされる。例えば、ページ番号4は、第1の等
価クラスの第1の三つの事例”3−D”と関連付けられ
る。更に、インデックス用語は、元のノートページへハ
イパーリンクされる。これを達成するために、各インク
ワード毎に参照されてそのインクワードが現れた手書き
ノートのページ上のそのインクワードを識別する。ま
た、これらの参照は、インデックス用語からノートペー
ジ上の対応する位置へのハイパーリンクを発生するため
に使用される。
【0033】この実施の形態に対して、インデックスの
各ラインは、一つの等価クラスに対応する。例えば、省
略形”3−D”は、そのノートの4個所で識別され
た。”3−D”の4つの事例は、一つの単一の等価クラ
スを構成する。図9は、本発明のインデックスをディス
プレイするための一例を示しているが、本発明の精神と
範囲から逸脱しない限り、あらゆるフォーマットが使用
できる。
【0034】インクワードの等価クラスへの割り当ての
用途 インクワードの等価クラスへの割り当ては、種々のディ
ジタルインクベースのシステムへの用途を有する。例え
ば、インクワードの等価クラスへの識別は、概略化、抄
録(抜粋)化、及び要旨化する用途を有する。また、手
書きノートに対する自動インデックス発生は、注釈のた
めに使用されるシンボルとワードの両方が解析されてイ
ンデックス形態で提示される注釈システムでの用途があ
る。また、インクワードを等価クラスへ割り当てる技術
は、文字認識や画像コンテンツのデコーディングを行う
ことなくドキュメントの顕著な態様(アスペクト)を検
出するための用途を有する。例えば、この技術は、意味
的に顕著な画像を選択するためにワードとフレーズの頻
度を決定して、ドキュメントについてのサマリーを発生
するために使用され得る。
【0035】コンピュータ−パーソナルディジタルアシ
スタント 図11は、本発明の手書きノートシステムの自動生成が
実施され得る汎用コンピュータやパーソナルディジタル
アシスタントの高レベルブロック図を示す。コンピュー
タシステム1000は、プロセッサユニット1005、
主メモリ1010、及び相互接続バス1025を含む。
プロセッサユニット1005は、単一のマイクロプロセ
ッサを含んでもよいし、マルチプロセッサシステムのよ
うなコンピュータシステム1000を構成するための複
数のマイクロプロセッサを含んでもよい。主メモリ10
10は、プロセッサユニット1005によって実行する
ための命令とデータを部分的に格納する。主メモリ10
10は、動作時に手書きノートシステムの自動生成のた
めの実行可能コードを格納する。主メモリ1010は、
高速キャッシュメモリと共にダイナミックランダムアク
セスメモリ(DRAM)のバンクを含んでもよい。
【0036】更に、コンピュータシステム1000は、
マス(大容量)記憶デバイス(単数又は複数)102
0、周辺デバイス(単数又は複数)1030、ポータブ
ル記憶媒体ドライブ(単数又は複数)1040、入力制
御デバイス(単数又は複数)1070、グラフィックサ
ブシステム1050、及び出力ディスプレイ1060を
含む。簡略化のため、コンピュータシステム1000の
全ての構成要素がバス1025を介して接続されている
ものとして図11に示されている。しかしながら、コン
ピュータシステム1000は、一つ又は複数のデータ搬
送手段を介して接続されてもよい。例えば、プロセッサ
ユニット1005と主メモリ1010は、ローカルマイ
クロプロセッサバスを介して接続されてもよく、またマ
ス記憶デバイス1020、周辺デバイス(単数又は複
数)1030、ポータブル記憶媒体ドライブ(単数又は
複数)1040及びグラフィックサブシステム1050
は、一つ又は複数の入/出力(I/O)バスを介して接
続されてもよい。磁気ディスクドライブや光学ディスク
ドライブで実施され得るマス記憶デバイス1020は、
プロセッサユニット1005による使用のためのデータ
と命令を格納するための不揮発性記憶デバイスである。
ソフトウエアの実施の形態では、マス記憶デバイス10
20は、主メモリ1010へロードするための手書きノ
ートシステムソフトウエアの自動生成を格納する。
【0037】ポータブル記憶媒体ドライブ1040は、
フロピーディスクやコンパクトディスク読出し専用メモ
リ(CD−ROM)のようなポータブル不揮発性記憶媒
体と共に動作し、データとコードをコンピュータへの入
力及びそれからの出力を行う。一実施の形態において、
手書きノートシステムソフトウエアの自動生成がそのよ
うなポータブル媒体に格納され、ポータブル記憶媒体ド
ライブ1040を介してコンピュータシステム1000
へ入力される。周辺デバイス(単数又は複数)1030
は、追加の機能性をコンピュータシステム1000へ追
加するために、入/出力(I/O)インターフェースの
ようなあらゆるタイプのコンピュータ支援デバイスを含
んでもよい。例えば、周辺デバイス(単数又は複数)1
030は、コンピュータシステム1000をネットワー
クへインターフェースするためにネットワークインター
フェースカードを含んでもよい。手書きノート(即ち、
ディジタルインク)は、コンピュータシステムによる処
理のためにポータブル記憶媒体やネットワークを介して
コンピュータシステム1000へ入力され得る。
【0038】入力制御デバイス(単数又は複数)107
0は、コンピュータシステム1000のユーザに対して
ユーザインターフェースの一部を提供する。入力制御デ
バイス(単数又は複数)1070は、英数字と他のキー
情報を入力するための英数字キーパッド、マウス、トラ
ックボール、スタイラスやカーソル方向キーのようなカ
ーソル制御デバイスを含んでもよい。上述のように、コ
ンピュータやPDAは、ユーザから手書きノートを受け
取るためのペンベースの入力デバイスを含む。テキスト
及びグラフィック情報をディスプレイするために、コン
ピュータシステム1000は、グラフィックスサブシス
テム1050と出力ディスプレイ1060を含む。出力
ディスプレイ1060は、陰極線管(CRT)や液晶デ
ィスプレイ(LCD)を含んでもよい。グラフィックス
サブシステム1050は、テキストとグラフィック情報
を受け取り、出力ディスプレイ1060への出力のため
にその情報を処理する。コンピュータシステム1000
に含まれる構成要素は、汎用コンピュータシステムで一
般的に見られる物であり、実際、これらの構成要素は、
当該技術で公知であるそのようなコンピュータ構成要素
の広いカテゴリーを表すことが意図される。
【0039】手書きノートシステムの自動生成は、ソフ
トウエアやハードウエアで実施され得る。ソフトウエア
実施の場合、手書きノートシステムの自動生成は、汎用
コンピュータシステムで実行されるための複数のコンピ
ュータ実行可能命令を含むソフトウエアである。汎用コ
ンピュータシステムへのローディングに先立って、手書
きノートシステムソフトウエアの自動生成は、符号化さ
れた情報として、磁気フロピーディスク、磁気テープ及
びコンパクトディスク読出し専用メモリ(CD−RO
M)のようなコンピュータ読出し可能媒体上に常駐して
もよい。一つのハードウエア実施の場合、手書きノート
システムの自動生成は、ここで記述された機能を実施す
るためのプロセッサ命令を含む専用プロセッサを備えて
もよい。また、回路が、ここで記述される機能を実施す
るために開発されてもよい。
【0040】本発明は、特定の例示の実施の形態に関し
て記述されたが、本発明の精神と範囲から逸脱しない限
り、当業者は、種々の変更や代替えを提供できる。
【図面の簡単な説明】
【図1】手書きインクノートシステムの自動インデック
ス発生のための一実施の形態を示すブロック図である。
【図2】手書きノートに対するインデックスを自動的に
発生するための一実施の形態を示すフロー図である。
【図3】特徴シーケンスを識別するための座標を有する
例示の再サンプリングされたインクワード”ワード(w
ord)”を示す。
【図4】ダイナミックプログラミングのための許容パス
を示す図である。
【図5】ノートインデックスの自動発生のための階層ク
ラスタリングの一実施の形態を示すフロー図である。
【図6】階層クラスタリングの一例を示す図である。
【図7】階層クラスタリングのための閾値を推定するた
めの例示の分散カーブである。
【図8】ボールド(太字)でハイライトされたインデッ
クス用語を有するノートページを示す。
【図9】ボールドでハイライトされたインデックス用語
を有する第2のノートページを示す。
【図10】本発明の一実施の形態に従って構成された手
書きノートに対するインデックスを示す。
【図11】汎用コンピュータ又はパーソナルディジタル
アシスタント(PDA)のハイレベルブロック図であ
る。
───────────────────────────────────────────────────── フロントページの続き (72)発明者 トッド キャス アメリカ合衆国 94131 カリフォルニア 州 サンフランシスコ ディグビイ スト リート 4 (72)発明者 内橋 真吾 アメリカ合衆国 95014 カリフォルニア 州 クパーティノ セレスト サークル 20716

Claims (19)

    【特許請求の範囲】
  1. 【請求項1】コンピュータにおいてディジタルインクと
    して捕獲される手書きノートに対するインデックスを発
    生するための方法であって、前記方法は、 コンピュータにおいてディジタルインクとして捕獲され
    た手書きノートに対する生のデータのストロークを処理
    して、少なくとも一つのインクワードを有するインテッ
    クス用語として識別するステップと;前記インデックス
    用語を前記インデックス用語が位置される前記手書きノ
    ートの位置へリンクすることによって前記インデックス
    用語に対するインデックスを発生するステップと、 前記手書きノートに対する前記インデックスを出力ディ
    スプレイ上にディスプレイするステップと、 を備える手書きノート用インデックス発生方法。
  2. 【請求項2】インデックスを発生する前記ステップは、
    前記インデックス用語に対する前記手書きノートのペー
    ジ番号を発生するステップを有し、 インデックスをディスプレイする前記ステップは、イン
    テックス用語と共に前記ページ番号をディスプレイする
    ステップを有する、 請求項1に記載の方法。
  3. 【請求項3】インデックスを発生する前記ステップは、
    前記インデックス用語を前記手書きノートの位置へリン
    クするためにハイパーリンクされたインデックス用語を
    発生するステップを有し、 インデックスをディスプレイする前記ステップは、ハイ
    パーリンクされたテキストとしてインデックス用語をデ
    ィスプレイするステップを有する、 請求項1に記載の方法。
  4. 【請求項4】コンピュータにおいてディジタルインクと
    して捕獲される手書きノートに対するインデックスを発
    生する方法であって、前記方法は、 前記手書きノートから複数のインクワードを識別するス
    テップと、 所定の閾値内でペアワイズ距離を有する少なくとも二つ
    のインクワードを有する前記インクワードの少なくとも
    一つの等価クラスを発生するステップと、 前記等価クラスのインデックスワードの少なくとも一つ
    を前記コンピュータ手書きノートに対するインデックス
    用語として選択するステップと、 前記インデックス用語が位置される前記手書きノートの
    位置への等価クラスの前記インデックス用語からのリン
    クを発生するために、選択された前記インデックス用語
    に対するインデックスを発生するステップと、 を備える手書きノート用インデックス発生方法。
  5. 【請求項5】前記インクワードの少なくとも一つの等価
    クラスを発生する前記ステップは、 前記手書きノートの生データのストロークの時間距離と
    空間距離に基づいて、複数の特徴シーケンスを発生する
    ステップと、 前記特徴シーケンスに基づいて、前記ペアのインクワー
    ドに対する前記ペアワイズ距離を発生するステップと、 前記ペアワイズ距離に基づいて前記インクワードを前記
    等価クラスにクラスタリングするステップと、 を備える請求項4に記載の方法。
  6. 【請求項6】前記インクワードを前記等価クラスにクラ
    スタリングする前記ステップは、 前記インクワードの各々を初期クラスタとして識別する
    ステップと、 一つの単一のクラスタを発生するために、最も近接する
    ペアワイズ距離よりなる二つのクラスタを選択するステ
    ップと、 最大ペアワイズ距離を定義するために閾値を選択するス
    テップと、 一つの単一のクラスタを発生するために、前記最も近接
    するペアワイズ距離が前記閾値を超えるまで、最も近接
    するペアワイズ距離よりなる二つのクラスタを選択する
    前記ステップを繰り返すステップと、 を備える請求項5に記載の方法。
  7. 【請求項7】閾値を選択する前記ステップは、 ペアワイズ距離と前記インクワードの複数のペアの発生
    回数との関係を表す分布カーブを発生するステップと、 前記分布カーブの急激な変化点τを識別するステップで
    あって、前記分布カーブ全体に亘って、0から前記急激
    な変化点τまでの傾きの第1のラインと前記急激な変化
    点τから一定の傾きを有する第2のラインとに前記分布
    カーブを近似することによってなされるステップと、 前記閾値として、前記分布カーブの急激な変化点τによ
    って近似された前記ペアワイズ距離を選択するステップ
    と、 を備える請求項6に記載の方法。
  8. 【請求項8】インデックス用語として前記等価クラスの
    インクワードの内の少なくとも一つを選択する前記ステ
    ップは、前記手書きノート全体に亘って、非均一に発生
    するインデックス用語を選択するステップを備える、請
    求項4に記載の方法。
  9. 【請求項9】コンピュータに入力された手書きノートの
    インクワードの等価クラスを識別する方法であって、前
    記方法は、 手書きノートから複数のインクワードを識別するステッ
    プと、 前記インクワードの複数の特徴を識別するステップと、 前記特徴に基づいて、前記インクワード間のペアワイズ
    距離を発生するステップと、 ペアワイズ距離と手書きノートの前記インクワードの複
    数のペアの発生回数との関係を表す分布カーブを発生す
    るステップと、 前記分布カーブの急激な変化点τを識別するステップで
    あって、前記分布カーブ全体に亘って、0から前記急激
    な変化点τまでの傾きの第1のラインと前記急激な変化
    点τから一定の傾きを有する第2のラインとに前記分布
    カーブを近似することによってなされるステップと、 クラスタリングするための閾値として、前記分布カーブ
    の急激な変化点τによって近似された前記ペアワイズ距
    離を選択するステップと、 前記閾値のペアワイズ距離内で前記インクワードのクラ
    スタを発生することによって前記インクワードの少なく
    とも一つの等価クラスを識別するステップと、 を備えるインクワードの等価クラス識別方法。
  10. 【請求項10】コンピュータによって実行される時に、 コンピュータにおいてディジタルインクとして捕獲され
    た手書きノートに対する生のデータのストロークを処理
    して、少なくとも一つのインクワードを有するインテッ
    クス用語を識別するステップと、 前記インデックス用語を前記インデックス用語が位置さ
    れる前記手書きノートの位置へリンクすることによって
    前記インデックス用語に対するインデックスを発生する
    ステップと、 前記手書きノートに対する前記インデックスを出力ディ
    スプレイ上にディスプレイするステップと、 を前記コンピュータに実行させる複数の命令を備えるコ
    ンピュータリーダブル媒体。
  11. 【請求項11】インデックスを発生する前記ステップ
    は、前記インデックス用語に対する前記手書きノートの
    ページ番号を発生するステップを有し、 インデックスをディスプレイする前記ステップは、イン
    テックス用語と共に前記ページ番号をディスプレイする
    ステップを有する、 請求項10に記載のコンピュータリーダブル媒体。
  12. 【請求項12】インデックスを発生する前記ステップ
    は、前記インデックス用語を前記手書きノートの位置へ
    リンクするためにハイパーリンクされたインデックス用
    語を発生するステップを有し、 インデックスをディスプレイする前記ステップは、ハイ
    パーリンクされたテキストとしてインデックス用語をデ
    ィスプレイするステップを有する、 請求項10に記載のコンピュータリーダブル媒体。
  13. 【請求項13】コンピュータによって実行される時に、 手書きノートから複数のインクワードを識別するステッ
    プと、 所定の閾値内でペアワイズ距離を有する少なくとも二つ
    のインクワードを有する前記インクワードの少なくとも
    一つの等価クラスを発生するステップと、 インクワードの前記等価クラスの内の少なくとも一つを
    前記コンピュータ手書きノートに対するインデックス用
    語として選択するステップと、 前記インデックス用語が位置される前記手書きノートの
    位置への等価クラスの前記インデックス用語からのリン
    クを発生するために、選択された前記インデックス用語
    に対するインデックスを発生するステップと、 を前記コンピュータに実行させる複数の命令を備えるコ
    ンピュータリーダブル媒体。
  14. 【請求項14】前記インクワードの少なくとも一つの等
    価クラスを発生する前記ステップは、 前記手書きノートの生データのストロークの時間距離と
    空間距離に基づいて、複数の特徴シーケンスを発生する
    ステップと、 前記特徴シーケンスに基づいて、前記ペアのインクワー
    ドに対する前記ペアワイズ距離を発生するステップと、 前記ペアワイズ距離に基づいて前記インクワードを前記
    等価クラスにクラスタリングするステップと、 を備える請求項13に記載のコンピュータリーダブル媒
    体。
  15. 【請求項15】前記インクワードを前記等価クラスにク
    ラスタリングする前記ステップは、 前記インクワードの各々を初期クラスタとして識別する
    ステップと、 単一のクラスタを発生するために、最も近接するペアワ
    イズ距離よりなる二つのクラスタを選択するステップ
    と、 最大ペアワイズ距離を定義するために閾値を選択するス
    テップと、 単一のクラスタを発生するために、前記最も近接するペ
    アワイズ距離が前記閾値を超えるまで、最も近接するペ
    アワイズ距離よりなる二つのクラスタを選択する前記ス
    テップを繰り返すステップと、 を備える請求項14に記載のコンピュータリーダブル媒
    体。
  16. 【請求項16】閾値を選択する前記ステップは、 ペアワイズ距離と前記インクワードの複数のペアの発生
    回数との関係を表す分布カーブを発生するステップと、 前記分布カーブの急激な変化点τを識別するステップで
    あって、前記分布カーブ全体に亘って、0から前記急激
    な変化点τまでの傾きの第1のラインと前記急激な変化
    点τから一定の傾きを有する第2のラインとに前記分布
    カーブを近似することによってなされるステップと、 前記閾値として、前記分布カーブの急激な変化点τによ
    って近似された前記ペアワイズ距離を選択するステップ
    と、 を備える請求項15に記載のコンピュータリーダブル媒
    体。
  17. 【請求項17】インデックス用語として前記等価クラス
    のインデックスワードの内の少なくとも一つを選択する
    前記ステップは、前記手書きノート全体に亘って、非均
    一に発生するインデックス用語を選択するステップを備
    える、請求項13に記載のコンピュータリーダブル媒
    体。
  18. 【請求項18】コンピュータによって実行される時に、
    前記コンピュータに、 手書きノートから複数のインクワードを識別するステッ
    プと、 前記インクワードの複数の特徴を識別するステップと、 前記特徴に基づいて、前記インクワード間のペアワイズ
    距離を発生するステップと、 ペアワイズ距離と手書きノートの前記インクワードの複
    数のペアの発生回数との関係を表す分布カーブを発生す
    るステップと、 前記分布カーブの急激な変化点τを識別するステップで
    あって、前記分布カーブ全体に亘って、0から前記急激
    な変化点τまでの傾きの第1のラインと前記急激な変化
    点τから一定の傾きを有する第2のラインとに前記分布
    カーブを近似することによってなされるステップと、 クラスタリングするための閾値として、前記分布カーブ
    の急激な変化点τによって近似された前記ペアワイズ距
    離を選択するステップと、 前記閾値のペアワイズ距離内で前記インクワードのクラ
    スタを発生することによって前記インクワードの少なく
    とも一つの等価クラスを識別するステップと、 を実行させる複数の命令を備えるコンピュータリーダブ
    ル媒体。
  19. 【請求項19】手書きノートから生のデータのストロー
    クを受信するためのユーザ入力ペンベースデバイスと、 前記ユーザ入力ペンベースデバイスに連結され、各々が
    少なくとも一つのインクワードを有する複数のインデッ
    クス用語を識別するために、手書きノートに対する生デ
    ータの前記ストロークを処理し、且つ前記インデックス
    用語を前記インデックス用語が位置する前記手書きノー
    トの位置へリンクすることによって前記インデックス用
    語に対するインデックスを発生するためのプロセッサユ
    ニットと、 前記プロセッサユニットに連結され、前記手書きノート
    に対する前記インデックスをディスプレイするための出
    力ディスプレイと、 を備えるコンピュータ。
JP2000042389A 1999-02-26 2000-02-21 手書きノート用インデックス発生方法、及びコンピュータリーダブル媒体 Expired - Lifetime JP3931519B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US09/258,464 US6565611B1 (en) 1999-02-26 1999-02-26 Automatic index creation for handwritten digital ink notes
US258464 1999-02-26

Publications (2)

Publication Number Publication Date
JP2000250945A true JP2000250945A (ja) 2000-09-14
JP3931519B2 JP3931519B2 (ja) 2007-06-20

Family

ID=22980657

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000042389A Expired - Lifetime JP3931519B2 (ja) 1999-02-26 2000-02-21 手書きノート用インデックス発生方法、及びコンピュータリーダブル媒体

Country Status (2)

Country Link
US (1) US6565611B1 (ja)
JP (1) JP3931519B2 (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002352244A (ja) * 2001-05-30 2002-12-06 Hitachi Systems & Services Ltd データ分類装置およびデータ分類方法
JP2009540451A (ja) * 2006-06-16 2009-11-19 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 臨床医駆動の例示ベースのコンピュータ支援診断
US7778464B2 (en) 2004-02-14 2010-08-17 Samsung Electronics Co., Ltd. Apparatus and method for searching for digital ink query
JP2013506216A (ja) * 2009-09-29 2013-02-21 モベア エス.アー ジェスチャを認識するためのシステムおよび方法
CN108665010A (zh) * 2018-05-12 2018-10-16 新疆大学 一种联机手写维吾尔文单词数据增强方法

Families Citing this family (57)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6822639B1 (en) * 1999-05-25 2004-11-23 Silverbrook Research Pty Ltd System for data transfer
AUPQ439299A0 (en) * 1999-12-01 1999-12-23 Silverbrook Research Pty Ltd Interface system
US6907562B1 (en) * 1999-07-26 2005-06-14 Xerox Corporation Hypertext concordance
US7536561B2 (en) 1999-10-15 2009-05-19 Ebrary, Inc. Method and apparatus for improved information transactions
US8311946B1 (en) 1999-10-15 2012-11-13 Ebrary Method and apparatus for improved information transactions
US7068381B1 (en) * 2000-02-02 2006-06-27 Raja Tuli Portable high speed internet access device
US20020115477A1 (en) * 2001-02-13 2002-08-22 Raja Singh Portable high speed internet access device with scrolling
US20020030843A1 (en) * 2000-02-02 2002-03-14 Tuli Raja Singh Portable high speed internet access device
US7023572B2 (en) * 2000-02-02 2006-04-04 Raja Singh Tuli Portable high speed internet access device
US6633314B1 (en) * 2000-02-02 2003-10-14 Raja Tuli Portable high speed internet device integrating cellular telephone and palm top computer
US6859909B1 (en) * 2000-03-07 2005-02-22 Microsoft Corporation System and method for annotating web-based documents
US7155061B2 (en) * 2000-08-22 2006-12-26 Microsoft Corporation Method and system for searching for words and phrases in active and stored ink word documents
US7191211B2 (en) * 2000-10-03 2007-03-13 Raja Tuli Portable high speed internet access device priority protocol
US6741749B2 (en) * 2001-01-24 2004-05-25 Advanced Digital Systems, Inc. System, device, computer program product, and method for representing a plurality of electronic ink data points
US8928577B1 (en) * 2001-01-29 2015-01-06 Qualcomm Incorporated Method and apparatus for single-step user generated notes on a personal digital assistant
US7298903B2 (en) * 2001-06-28 2007-11-20 Microsoft Corporation Method and system for separating text and drawings in digital ink
US20030214553A1 (en) * 2002-05-14 2003-11-20 Microsoft Corporation Ink regions in an overlay control
US7925987B2 (en) * 2002-05-14 2011-04-12 Microsoft Corporation Entry and editing of electronic ink
US8166388B2 (en) 2002-05-14 2012-04-24 Microsoft Corporation Overlaying electronic ink
US7158675B2 (en) * 2002-05-14 2007-01-02 Microsoft Corporation Interfacing with ink
US7079713B2 (en) * 2002-06-28 2006-07-18 Microsoft Corporation Method and system for displaying and linking ink objects with recognized text and objects
US7185278B1 (en) 2002-06-28 2007-02-27 Microsoft Corporation Separating and moving document objects using the movement of a wiper bar
US7188309B2 (en) 2002-06-28 2007-03-06 Microsoft Corporation Resolving document object collisions
US7174042B1 (en) 2002-06-28 2007-02-06 Microsoft Corporation System and method for automatically recognizing electronic handwriting in an electronic document and converting to text
US7259752B1 (en) 2002-06-28 2007-08-21 Microsoft Corporation Method and system for editing electronic ink
US7353453B1 (en) * 2002-06-28 2008-04-01 Microsoft Corporation Method and system for categorizing data objects with designation tools
US7137077B2 (en) * 2002-07-30 2006-11-14 Microsoft Corporation Freeform encounter selection tool
US7634729B2 (en) * 2002-11-10 2009-12-15 Microsoft Corporation Handwritten file names
US7284200B2 (en) * 2002-11-10 2007-10-16 Microsoft Corporation Organization of handwritten notes using handwritten titles
US8176428B2 (en) * 2002-12-03 2012-05-08 Datawind Net Access Corporation Portable internet access device back page cache
US20040196306A1 (en) * 2003-04-04 2004-10-07 Microsoft Corporation Method and system for flagging digital ink note content
US20050166149A1 (en) * 2004-01-23 2005-07-28 Microsoft Corporation Table of contents display
US9229540B2 (en) 2004-01-30 2016-01-05 Electronic Scripting Products, Inc. Deriving input from six degrees of freedom interfaces
US8542219B2 (en) * 2004-01-30 2013-09-24 Electronic Scripting Products, Inc. Processing pose data derived from the pose of an elongate object
US7961909B2 (en) 2006-03-08 2011-06-14 Electronic Scripting Products, Inc. Computer interface employing a manipulated object with absolute pose detection component and a display
US7826641B2 (en) * 2004-01-30 2010-11-02 Electronic Scripting Products, Inc. Apparatus and method for determining an absolute pose of a manipulated object in a real three-dimensional environment with invariant features
US7962846B2 (en) 2004-02-13 2011-06-14 Microsoft Corporation Organization of annotated clipping views
US7721226B2 (en) 2004-02-18 2010-05-18 Microsoft Corporation Glom widget
US20050179647A1 (en) * 2004-02-18 2005-08-18 Microsoft Corporation Automatic detection and switching between input modes
US7358965B2 (en) * 2004-02-18 2008-04-15 Microsoft Corporation Tapping to create writing
US7659890B2 (en) 2004-03-19 2010-02-09 Microsoft Corporation Automatic height adjustment for electronic highlighter pens and mousing devices
US20060085740A1 (en) * 2004-10-20 2006-04-20 Microsoft Corporation Parsing hierarchical lists and outlines
US7472341B2 (en) * 2004-11-08 2008-12-30 International Business Machines Corporation Multi-user, multi-timed collaborative annotation
US7840564B2 (en) 2005-02-16 2010-11-23 Ebrary System and method for automatic anthology creation using document aspects
US7546524B1 (en) * 2005-03-30 2009-06-09 Amazon Technologies, Inc. Electronic input device, system, and method using human-comprehensible content to automatically correlate an annotation of a paper document with a digital version of the document
US20060287983A1 (en) * 2005-06-16 2006-12-21 Microsoft Corporation Avoiding slow sections in an information search
US7433869B2 (en) * 2005-07-01 2008-10-07 Ebrary, Inc. Method and apparatus for document clustering and document sketching
JP2007080076A (ja) * 2005-09-15 2007-03-29 Fuji Xerox Co Ltd 筆記内容記録システム及び筆記内容記録方法
US7526737B2 (en) * 2005-11-14 2009-04-28 Microsoft Corporation Free form wiper
CN102754059A (zh) * 2009-12-24 2012-10-24 三星电子株式会社 显示web页面的显示装置及其显示方法
US10089404B2 (en) 2010-09-08 2018-10-02 Evernote Corporation Site memory processing
CN107526776A (zh) * 2010-09-08 2017-12-29 印象笔记公司 呈现搜索结果的计算机化方法及系统
US9218321B2 (en) * 2013-01-29 2015-12-22 International Business Machines Corporation Creating tag clouds based on user specified arbitrary shape tags
US9558400B2 (en) * 2013-03-07 2017-01-31 Ricoh Company, Ltd. Search by stroke
KR102143997B1 (ko) * 2013-10-17 2020-08-12 삼성전자 주식회사 단말장치의 정보 리스트 처리장치 및 방법
US10228775B2 (en) * 2016-01-22 2019-03-12 Microsoft Technology Licensing, Llc Cross application digital ink repository
US11577159B2 (en) 2016-05-26 2023-02-14 Electronic Scripting Products Inc. Realistic virtual/augmented/mixed reality viewing and interactions

Family Cites Families (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4580218A (en) * 1983-09-08 1986-04-01 At&T Bell Laboratories Indexing subject-locating method
US5404295A (en) * 1990-08-16 1995-04-04 Katz; Boris Method and apparatus for utilizing annotations to facilitate computer retrieval of database material
US5428777A (en) * 1991-11-18 1995-06-27 Taylor Publishing Company Automatic index for yearbooks with spell checking capabilities
CA2078423C (en) * 1991-11-19 1997-01-14 Per-Kristian Halvorsen Method and apparatus for supplementing significant portions of a document selected without document image decoding with retrieved information
US5596700A (en) * 1993-02-17 1997-01-21 International Business Machines Corporation System for annotating software windows
US5537491A (en) * 1993-11-24 1996-07-16 Xerox Corporation Analyzing an image or other data to obtain a stable number of groups
JP3445394B2 (ja) * 1993-12-17 2003-09-08 ゼロックス・コーポレーション 少なくとも二つのイメージセクションの比較方法
JPH10501905A (ja) * 1994-01-27 1998-02-17 ミネソタ マイニング アンド マニュファクチャリング カンパニー ソフトウェアメモ
US5513305A (en) * 1994-03-01 1996-04-30 Apple Computer, Inc. System and method for documenting and displaying computer program code
US5524240A (en) * 1994-05-24 1996-06-04 Panasonic Technologies, Inc. Method and apparatus for storage and retrieval of handwritten information
US5963205A (en) * 1995-05-26 1999-10-05 Iconovex Corporation Automatic index creation for a word processor
US5822539A (en) * 1995-12-08 1998-10-13 Sun Microsystems, Inc. System for adding requested document cross references to a document by annotation proxy configured to merge and a directory generator and annotation server
US5845288A (en) * 1995-12-11 1998-12-01 Xerox Corporation Automated system for indexing graphical documents having associated text labels
US5873107A (en) * 1996-03-29 1999-02-16 Apple Computer, Inc. System for automatically retrieving information relevant to text being authored
JPH1040247A (ja) * 1996-07-26 1998-02-13 Sharp Corp データ処理装置
US6356922B1 (en) * 1997-09-15 2002-03-12 Fuji Xerox Co., Ltd. Method and system for suggesting related documents
US6173287B1 (en) * 1998-03-11 2001-01-09 Digital Equipment Corporation Technique for ranking multimedia annotations of interest
US6389435B1 (en) * 1999-02-05 2002-05-14 Fuji Xerox, Co, Ltd. Method and system for copying a freeform digital ink mark on an object to a related object

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002352244A (ja) * 2001-05-30 2002-12-06 Hitachi Systems & Services Ltd データ分類装置およびデータ分類方法
JP4682339B2 (ja) * 2001-05-30 2011-05-11 株式会社日立ソリューションズ データ分類装置およびデータ分類方法
US7778464B2 (en) 2004-02-14 2010-08-17 Samsung Electronics Co., Ltd. Apparatus and method for searching for digital ink query
JP2009540451A (ja) * 2006-06-16 2009-11-19 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 臨床医駆動の例示ベースのコンピュータ支援診断
JP2013506216A (ja) * 2009-09-29 2013-02-21 モベア エス.アー ジェスチャを認識するためのシステムおよび方法
CN108665010A (zh) * 2018-05-12 2018-10-16 新疆大学 一种联机手写维吾尔文单词数据增强方法
CN108665010B (zh) * 2018-05-12 2022-01-04 新疆大学 一种联机手写维吾尔文单词数据增强方法

Also Published As

Publication number Publication date
JP3931519B2 (ja) 2007-06-20
US6565611B1 (en) 2003-05-20

Similar Documents

Publication Publication Date Title
JP3931519B2 (ja) 手書きノート用インデックス発生方法、及びコンピュータリーダブル媒体
US10489439B2 (en) System and method for entity extraction from semi-structured text documents
JP5424001B2 (ja) 学習データ生成装置、固有表現抽出システム、学習データ生成方法、及びプログラム
US9317492B2 (en) Grouping writing regions of digital ink
Li Protractor: a fast and accurate gesture recognizer
CN100385454C (zh) 用于缩放为手写识别而输入的手写字符的方法和设备
JP3483982B2 (ja) システム動作方法及びプロセッサ制御システム
US20110208744A1 (en) Methods for detecting and removing duplicates in video search results
US20100185691A1 (en) Scalable semi-structured named entity detection
CN110569335B (zh) 基于人工智能的三元组校验方法、装置及存储介质
CN110232112B (zh) 文章中关键词提取方法及装置
US8316032B1 (en) Book content item search
US8843493B1 (en) Document fingerprint
CN109408829B (zh) 文章可读性确定方法、装置、设备和介质
CN111930929A (zh) 一种文章标题生成方法、装置及计算设备
CN116450883A (zh) 基于视频内容细粒度信息的视频时刻检索方法
US9195706B1 (en) Processing of document metadata for use as query suggestions
Aref et al. On handling electronic ink
US7756337B2 (en) Method and apparatus for reducing reference character dictionary comparisons during handwriting recognition
Slavin et al. Analyzing the content of business documents recognized with a large number of errors using modified Levenshtein distance
CN112883218A (zh) 一种图文联合表征的搜索方法、系统、服务器和存储介质
JP2009053743A (ja) 文書類似性導出装置、文書類似性導出方法、及び、文書類似性導出プログラム
CN116225956A (zh) 自动化测试方法、装置、计算机设备和存储介质
Bartoli et al. Semisupervised wrapper choice and generation for print-oriented documents
US8180784B2 (en) Method and system for improving performance of counting hits in a search

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20040126

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20061219

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070125

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20070220

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20070305

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

Ref document number: 3931519

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110323

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120323

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130323

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130323

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140323

Year of fee payment: 7

EXPY Cancellation because of completion of term