JP4820382B2 - ノードリンクダイアグラムに構造認識を提供する方法 - Google Patents
ノードリンクダイアグラムに構造認識を提供する方法 Download PDFInfo
- Publication number
- JP4820382B2 JP4820382B2 JP2008071456A JP2008071456A JP4820382B2 JP 4820382 B2 JP4820382 B2 JP 4820382B2 JP 2008071456 A JP2008071456 A JP 2008071456A JP 2008071456 A JP2008071456 A JP 2008071456A JP 4820382 B2 JP4820382 B2 JP 4820382B2
- Authority
- JP
- Japan
- Prior art keywords
- node
- stroke
- hypothesis
- hypotheses
- strokes
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/32—Digital ink
- G06V30/333—Preprocessing; Feature extraction
- G06V30/347—Sampling; Contour coding; Stroke extraction
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/142—Image acquisition using hand-held instruments; Constructional details of the instruments
- G06V30/1423—Image acquisition using hand-held instruments; Constructional details of the instruments the instrument generating sequences of position coordinates corresponding to handwriting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/414—Extracting the geometrical structure, e.g. layout tree; Block segmentation, e.g. bounding boxes for graphics or text
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Computer Graphics (AREA)
- Geometry (AREA)
- Artificial Intelligence (AREA)
- Character Discrimination (AREA)
- User Interface Of Digital Computer (AREA)
- Position Input By Displaying (AREA)
Description
本発明の一態様の方法において、(i)前記ノードリンクダイアグラムにデジタルインクストロークを追加するステップと、(ii)前記ノードリンクダイアグラムからデジタルインクストロークを削除するステップと、(iii)前記ノードリンクダイアグラムから文字項目のオブジェクト表現を削除するステップと、(iv)前記ノードリンクダイアグラムから図形項目のオブジェクト表現を削除するステップと、(v)前記ノードリンクダイアグラムのデジタルインクストロークを選択するユーザの入力を受け付けるステップと、(vi)前記ノードリンクダイアグラムの文字項目のオブジェクト表現を選択するユーザの入力を受け付けるステップと、(vii)前記ノードリンクダイアグラムの図形項目のオブジェクト表現を選択するユーザの入力を受け付けるステップと、のうち少なくとも1つのステップと、前記ノードリンクダイアグラムの漸増的構造認識を実行するステップと、を更に含んでいてよい。
また、本発明の一態様の方法において、前記漸増的構造認識が、追加、削除、およびユーザの入力の受付のうち少なくとも一つに起因して新たな構造仮説を生成するステップと、(i)前記新たな構造仮説を既存の構造仮説グループとグループ化するステップ、及び、(ii)新たな構造仮説グループを形成するステップ、のうちの1つのステップと、影響を受けたグループを認識するステップと、前記受理された仮説から形成された階層束を更新するステップと、を含んでいてよい。
また、本発明の一態様の方法において、前記適用された制約下で、集合的に高いスコアを割り当てられた仮説を探索するステップが、探索アルゴリズムを使用して前記仮説の仮説束を探索するステップを更に含み、前記探索アルゴリズムは、前記複数の仮説の部分集合であって当該部分集合に含まれる仮説の前記信頼度スコアの合計が最大である部分集合を最適な仮説束として、最適な、ほぼ最適な、あるいは最良に達成可能な、仮説束を探索するアルゴリズムであってよい。
なお、本段落の次の文から段落[0011]までの記載は、本願の出願当初の[特許請求の範囲]に記載の請求項1〜6の記載に対応する。
本発明の1つの態様の方法は、入力装置により電子装置のキャンバスに描画された複数のデジタルインクストロークにより形成されたノードリンクダイアグラムに構造認識を提供する方法であって、関係するストロークを、グループ内のストロークの構造化された解釈を反映する複数の仮説にグループ分けするステップと、前記ストロークグループのストロークおよび囲みストロークに関する局所的証拠に基づいて複数の仮説の信頼度スコアを計算するステップと、前記仮説間に制約を適用するステップと、前記適用された制約下で仮説への受理/棄却値の集合的に高いスコア割り当てを探索するステップと、前記ノードリンクダイアグラムのストロークに構造情報を提供して前記ノードリンクダイアグラムを電子的に編集可能にすべく、前記ノードリンクダイアグラムの表現として前記集合的に高いスコア割り当てを有する仮説を受理するステップと、を含む。
GUIモジュールがペンからのデジタルインクを総合するに従い、GUI側で「未加工ストローク」として表現される。これらは、未加工ストローク列に入れられる。
認識モジュールは、preInterpretStrokesInInputStrokeQueue()と呼ばれるメッセージ受け渡しメソッドを実行する。これは、GUIにより意図的に呼ぶことも、あるいは、スケジューラにより自動的に起動することもできる。認識モジュールの事前解釈プロセスは、未処理ストローク列からストロークを除去して、処理済(終了)ストローク列にストロークを入れる。終了ストロークは、未処理ストローク列から得られた未処理ストロークと同一であっても、あるいは未処理ストロークのフラグメントである新規ストロークであってもよい。通常、フラグメントは元の未処理ストロークを角で分解することで生じる。
構造認識の認識モジュールでの実装実行は、ユーザーには感知できない。唯一の視覚的効果は、オブジェクトが選択されて正式化される際に反映される。
selectTapメソッドはGUIにより呼ばれて、点pのx−y位置で示すキャンバス上の特定の位置でユーザーがペンタップしたことを認識モジュールに教える。GUIが次いで、ユーザーが何のストロークを選択しようと意図したかを判定して、これらのストロークのIDを含む配列(例:int[]配列)を返す。推論モードプロトコルの下で、当該判定は、点pの下方または近傍にある任意のストローク、および当該ストロークが属すると認識されたグループに基づいている。認識モジュールが知的であるほど、ユーザーがキャンバス上の様々な位置でタッピングした際に選択しようと意図するストロークの適切な集合を識別することに関してより知的になる。
selectPathメソッドは、ストロークの周囲に閉経路を描画することにより選択を可能にする。他のストロークを囲みにより閉経路ストロークが曖昧であり、従って推論モードプロトコルの下で「選択?」メディエーターを要求するか否かに関する判定はGUIに委ねられる。selectPathメソッドは、囲まれたストロークがGUIおよび認識モジュールの両方により選択されたものと見なす場合にのみ用いる。GUIは通常、選択されたストロークを何らかの方法で強調表示されるように加工する。
deleteStrokesはGUIにより呼ばれて、特定のストロークをキャンバスから除去させる。認識モジュールは、これらのストロークが関与する認識済み構造は全て分解することに対処する必要がある。返されるint[]はキャンバスから削除されたストロークのIDであって、渡されたint[]stroke-idsと同一でなければならない。
scratchOutメソッドは、ユーザーが取消しジェスチャ(通常はジグザグ)と意図されたストロークを描画した場合にGUIにより呼ばれる。次いで認識モジュールは、取消しジェスチャの経路および認識アルゴリズムが構築した構造グループにより判定されたのと同様に、ユーザーがどのストロークの削除を意図しているかを正確に判定することを求められる。引数PenPath scratchout-pathは、ジェスチャの時点(そのタイムスタンプを含む)のリストである。認識モジュールが知的であるほど、たとえ曖昧な取消しジェスチャを行なった場合であっても、ユーザーの意図をより的確に認識することができる。
formalizeObjectsコマンドはまた、beautifyObjectsとも呼ばれる場合がある。これにより、int[]stroke-ids引数として渡された選択された非正式な終了ストロークが、円、楕円、長方形、多角形、矢印、弧および形式化された文字等の正式化図形オブジェクトで置き換えられる。渡されたstroke-idsにどのような認識可能オブジェクトが含まれていて、それらをどのように正式なオブジェクトで置換するかについては認識モジュールに委ねられている。
roughenObjectsコマンドは、formalizeObjectsコマンドの逆である。選択されたオブジェクトのオブジェクトIDは、int[]object_ids引数を介して渡される。これらは、正式なオブジェクトまたは未処理ストロークであってよい。認識モジュールはroughenObjectsコマンドを受信したならば、どの正式なオブジェクトをキャンバスから除去すべきか、あるいはどのストロークを追加すべきかを判定する。
affineTransformコマンドを用いて、キャンバス上の選択されたオブジェクトの移動、スケーリング、伸長および回転変換を認識モジュールへ伝達する。認識モジュールが関与するのは、ダイアグラムのノードリンク構造に関する知識を有しており、従って、ノードが移動または別途変換されるのに伴ない、紐付けられているノードに追随してリンクグラフィックをどのように更新すべきかを指示すべく配置されているためである。
(i)必要に応じてストロークが分解される
(ii)関連するストロークがグループ分けされて、ストロークの構造化された解釈を反映する複数の仮説を形成する(ストロークは、形状の類似度および位置の近さを含むがこれに限定されない、多くの類似度特徴の任意のもの基づいて関連していると判定される)
(iii)仮説に対し、局所的証拠(例:固有のスコア)に基づいて信頼度スコアが適用されている
(iv)仮説に対し、囲みストローク(例:支持コンテキストスコア)等の相互に作用する支持オブジェクトに応じて信頼度スコアが適用されている
(v)仮説は支持関係に応じて束を形成する
(vi)競合する仮説同士に制約が適用される
(vii)適用された制約の下で、集合的に高いスコアが割当てられた仮説(例:受理/棄却値問合せ、すなわち他の競合する仮説よりも高い受理値を有する仮説に基づいて)の探索が行なわれる
(viii)集合的に高いスコアが割当てられている受理仮説が、ノードリンクダイアグラムの解釈を表わす仮説束の部分集合を形成する。
くさび(284):角で交わるほぼ一対の同じ長さのペンストローク。
矢印(286):角で交わるくさびとペンストロークであって、当該ペンストロークはくさびの辺の間に来なければならない。
曲線オブジェクト(290):自身とは交差しない開経路を形成する一連のペンストローク。
曲線コネクタ(292):開経路、単一ペンストローク、または端と端がつながった複数ペンストロークは、終端子図形(TerminatorGraphic)、すなわち矢印等のコネクタの終端子として機能できるオブジェクトのオプション的役割を含んでいる。他の形状または項目は終端子として機能することができる。
閉経路オブジェクト(288):自身とは交わらない閉経路またはほぼ閉じた経路を形成する一連のペンストローク。閉経路は通常、閉経路オブジェクトと見なすことができるためには比較的単純且つ小さい形状でなければならない。蛇行する長い閉経路はこれに該当しない。
文字オブジェクト(294):手書きの単語に概ね対応する、まとまりのある細長い塊を形成するペンストロークおよびペンドットの集合。
文字ライン(296):通常は水平線に沿って端から端まで並んだ文字オブジェクトのグループ。
文字カラム(298):文字オブジェクトおよび/または文字ラインを垂直にならべたもの。
グラフノード(300):ノードグラフィックおよびノードラベルの二つの主な役割を有する。グラフノードを支持すべく、役割の少なくとも一つ、オプション的には両方を果たす。一実施形態において、閉経路オブジェクトによりノードグラフィックの役割を果たし、文字オブジェクト、文字ラインまたは文字カラムによりノードラベルの役割を果たすことができる。同じ実施形態において、グラフノードに対して両方の役割が果たされ、次いで閉経路オブジェクトにより文字が囲まれる。また、グラフノードは、自身に関連付けられたグラフリンクへのポインタを保持する。他の実施形態では異なる構成であってよい。
グラフリンク(302):リンクグラフィックおよびリンクラベルの二つの役割を有している。リンクグラフィック役割は、曲線コネクタが果たさなければなければならない。リンクラベル役割はオプション的に、文字オブジェクト、文字ライン、または文字カラムにより果たすことができる。また、グラフリンクはいずれかの終端に関連付けられた(指示される)グラフノードのリストを保持する。
1.全てのペンストロークの近位端にリンクを形成する。リンクされたペンストローク終端の各対が並び(alignment)または角を形成する程度を表すスコアを数値的に与える。
2.くさび仮説を形成する。
本システムは、図16のノードリンクダイアグラム360を解釈して、潜在的にくさびと考えられるストロークを識別する。くさび仮説362aのあるものは真であるが、他のものは偽362bである。仮説の同様の例を図17〜21に示す。仮説束を修正する認識モジュールの動作を示す図30のブロック512における最適化プロセスの一部としてT/Fの判定がなされる。
3.矢印仮説を形成する(図17、364a真、364b偽を参照)。
4.閉経路オブジェクト仮説を形成する(図18、365a真を参照)。
5.曲線コネクタ仮説を形成する(図19、366a真を参照)。
6.閉経路オブジェクトにより囲まれるストロークの集合を見出す。
7.閉経路オブジェクトによる囲い込みに基づいて文字オブジェクト仮説を破る。
8.共通の支持オブジェクトを有することに基づいて、互いに冗長である文字オブジェクト仮説または他のいずれかの図形オブジェクトと冗長である文字オブジェクト仮説を除去する。
9.スコアが与えられていない全ての文字オブジェクト仮説に対して手書き文字認識を実行する。
10.文字オブジェクトから文字ラインおよび文字カラム仮説を形成する。
11.文字オブジェクト、文字ライン、または文字カラム(図21、368a真を参照)を囲む閉経路オブジェクトからグラフノード仮説を形成する(図20、367a真を参照)。
12.文字オブジェクト、文字ライン、または文字カラムを指す曲線オブジェクトからグラフノードおよびグラフリンク仮説を形成する。
1.図23の階層的束構造380に示すように、各原子ノード(A1〜A6)382に支持コンテキストスコアとして1が割当てられる。スコアは原子ノードから上方へ伝播されることにより、各グループノード(M1〜M8)384は、自身の固有スコア388と、自身の支持ノード群の最小支持コンテキストスコアからイプシロン値を減算した値と、のうちの小さい方である支持コンテキストスコア386を有している。支持コンテキストスコアは、底部の原子ノードから伝播させて、固有のスコアを支持ノードの支持コンテキストと組み合わせることによりノードの階層に割当てられる。
2.全てのグループノードの支持コンテキストスコアを一覧表示するスコアベクトルが生成される。スコアベクトルにおいて固有スコアを用いることは可能であるが、これにより探索木の剪定が大幅に減り、従って探索時間が増える恐れがある。
3.スコアベクトルおよび付随するグループノードが、最大支持コンテキストスコアから最小なものへ並べ替えられる。ステップ1でのスコア割当てのため、束内でより高いノードがそれらの支持ノードの後に厳密に来るよう、ノードは順序付けられる。
4.図24の表390のような支持表が階層束(例えば図23の)に基づいて構築される。図24に、支持表390が、階層グループ束380の支持構造を符号化する様子を示す。表の水平方向の次元(行添え字)は、全てのグループノードを、支持コンテキストスコアの順に一覧表示する。支持表の垂直方向の次元(列添え字)は、原子ノードに加え、束内でより上位にある少なくとも1個の他のグループノードを支持する全てのグループノードからなる。支持表の項目はブール値であり、行添え字付き原子または支持グループノードが束内で列添え字付きグループノードを支持するか否かを示す。
5.重複しない支持制約の下で最適化探索が実行される。探索の目的は、各グループ(または仮説)ノードにT/F値を割当てることである。これは2進木の探索により達成され、ここで、木の各ノードにおいて左分岐がノードに真値を割当てることに対応し、右分岐が偽値を割当てることに対応する。木の深さは、グループノードの個数である(図26参照)。
A1.ノード変数を初期化する。
A2.主ループ:...となるまで現在ノードを処理する。
A3.終了:最適なノードT/F値割当てを出力する。
I1.変数best-score(最高スコア)を0に初期化する。
I2.変数cumulative-score(累積スコア)を0に初期化する。
I3.各ノードの変数veto-count(否認回数)を0に初期化する。
I4.各ノードの変数current-state(現在の状態)の値を「状態A」に初期化する。
I5.ポインタtree-pointer(木ポインタ)を第1ノードに初期化する。ポインタtree-pointerにより指示されるノードを「current-node(現在ノード)」と呼ぶ。
I.ストローク毎の処理段階
1.原子オブジェクト(ストローク、ノード)の形成
1a.ストローク解釈列から次の利用可能ストロークを除去する。
1b.ストロークが筆記体であるか否かの指標を計算する。
これはストロークの二乗和曲率、長さ、速度、およびオプションとして他の特性に基づいている。
1c.筆記体と判定されたストロークを「文字」型の原子とみなして、ストローク解釈列の先頭に戻す。
1d.筆記体と判定されなかったストロークを公知の手段に従い角で分解する。結果的に生じる各々のストロークフラグメントを原子ストロークとみなす。生成された原子ストロークフラグメントの集合をストローク解釈列の先頭に入れる。
2.原子ストークスのグループ分けに基づく分子文字オブジェクト仮説の形成
原子ストロークをストローク解釈列から除去し、仮説束内の文字オブジェクト型分子オブジェクト仮説の現在の集合に関して考察する。(最初、仮説束に分子オブジェクトは存在しない。)、各文字型分子仮説について、ストロークの位置、長さ、形状および他の特性を評価し、行なうべき動作を以下のように決定する。
−ストロークが文字オブジェクト分子オブジェクト仮説と完全に整合性を有する場合、ストロークを当該分子オブジェクトの支持オブジェクトに加える。
−ストロークが分子オブジェクト仮説と部分的に整合性を有する場合、二つの新たな分子オブジェクト仮説を形成する。一つはストローク単独からなり、もう一つは当該ストロークに当該分子の支持原子ストロークを加えたものからなる。
−ストロークがどの既存の文字型分子オブジェクト仮説とも部分的に整合性を有しないと判定された場合、当該ストロークをその唯一の支持オブジェクトとして新たな文字型分子オブジェクト仮説を形成する。
II.後続処理段階
3.終端リンク
3a.筆記体と判定されなかった全てのストローク(ストロークフラグメント)について、各ストロークの終端点の位置と向きを表わすストローク終端オブジェクトを生成する。
3b.閾値に従い互いに十分近くにある一対のストローク終端を表わす終端リンクデータ構造を形成する。そのような各々の終端対が角を形成する度合い、およびそのような各々の終端対が滑らかな曲線形状をなす度合いを計算して終端リンクデータ構造に加える。
3c.当分野で公知のアルゴリズムに従い、原子ストロークにより形成される知覚的に閉じた経路の探索を行なう。結果的に生じた各々の閉経路図形オブジェクトを仮説束に加える。
3d.くさびまたは矢印を形成する3重のストロークを発見すべく、閉経路図形オブジェクトに関与していない全てのストロークを更に処理する。矢印ストロークの対を仮説束の矢印図形オブジェクトとして登録される。
3e.終端同士がリンクされたストロークの連鎖を発見すべく、閉経路図形オブジェクトに関与していない全てのストロークを更に処理する。仮説束の開経路図形オブジェクトとして連鎖を登録する。
4.グラフまたはノードリンク構造ノードの生成。
4a.上で定義したグラフノードおよびグラフリンクオブジェクトの要件を満たす仮説束における分子オブジェクトの集合を、適切な型であって、互いに空間的に適切な近さにある分子オブジェクトの対を網羅的に探索することにより発見する。例えば、閉経路オブジェクトと文字型分子オブジェクトを比較して、閉経路オブジェクトが文字オブジェクトを囲んでいることが分かった場合、グラフノードオブジェクトが生成される。
同様に、開経路オブジェクトが、文字型分子オブジェクトまたは閉経路オブジェクトを「指す」関係があることが分かった場合、グラフリンクおよびグラフノードオブジェクトが生成される。
5.信頼度スコアの割当て
5a.自身の原子支持オブジェクトが当該分子オブジェクトの型の理想的なモデルにどれほど良く当てはまるかに基づいて、仮説グラフ内の各分子オブジェクトに信頼度スコアを付与する。
5b.自身の寄与するノードリンク分子オブジェクトのスコア、および当該ノードリンク構造オブジェクト型について定義された部品の理想的な構成を満たす空間構成に応じて、仮説グラフ内の各ノードリンク構造オブジェクトにスコアを割当てる。
6.グラフ構造信頼度スコアの補強
6a.グラフ構造オブジェクト度の信頼度スコアは、互いを補強する程度に応じて調整される。信頼度は、グラフ構造ノードオブジェクトがグラフ構造リンクオブジェクトにより指示される程度から、グラフ構造リンクオブジェクトがグラフ構造ノードオブジェクトを指示する程度まで上がる。
7.仮説の選択
7a.勝ち残る仮説は、最適探索により仮説グラフから選択される。最高スコアを得たグラフ構造ノードが「受理された」として選択され、これを支持する全ての分子オブジェクトがこれに割当てられる。
7b.このような支持分子オブジェクトの各々について、当該分子オブジェクトを支持する全ての原子ストロークがこれに割当てられる。
7c.次の層のオブジェクトに割当てられた全ての分子オブジェクトおよび原子ストロークの支持オブジェクトが、仮説グラフ内の他の全ての仮説から除去される。
7d.影響を受けた全てのグラフ構造および分子オブジェクトが、自身の信頼度スコアを再計算する。
7e.信頼度スコアが閾値を超える状態で、未受理グラフ構造仮説ノードがなくなるまで制御は7aへ戻る。
7f.受理されたグラフ構造ノードおよびこれらの支持分子オブジェクト並びに原子ストロークを、抽象オブジェクトおよびそれらの支持ストロークにおけるノードリンクとその支持オブジェクトの論理的関係を記録するデータ構造に登録する。このデータ構造は、上述のユーザー選択および編集動作に対応している。
Claims (4)
- 入力装置により電子装置のキャンバスに描画された複数のデジタルインクストロークにより形成されたノードリンクダイアグラムに構造認識を提供する方法であって、
関係するデジタルインクストロークを、グループ内のデジタルインクストロークの構造化された解釈を反映する複数の仮説にグループ分けするステップと、
前記複数の仮説の信頼度スコアを計算するステップと、
前記仮説間に制約を適用するステップと、
前記適用された制約下で、集合的に高いスコアを割り当てられた仮説を探索するステップと、
前記ノードリンクダイアグラムの表現として前記集合的に高いスコア割り当てを有する仮説を受理するステップであって、構造情報が前記ノードリンクダイアグラムのデジタルインクストロークに提供され、前記ノードリンクダイアグラムを電子的に編集可能にするステップと、
を含み、
前記グループ分けするステップにおけるインクストロークの構造化された解釈は、当該インクストロークの特徴の類似度に基づいて、関係したインクストロークを決定することを含み、
前記複数の仮説のそれぞれは、予め定義された複数のオブジェクトタイプのうちの1つを表し、各仮説が表すオブジェクトタイプは、当該仮説に係るデジタルインクストロークグループが表し得ると解釈されるオブジェクトの種類であり、
前記複数の仮説の信頼度スコアを計算するステップにおいて、各仮説が固有のスコアと支持コンテキストスコアとを有し、
前記固有のスコアは、デジタルインクストロークグループのデジタルインクストロークどうしの類似度と、前記仮説によって表されるオブジェクトタイプに対する、定められた基準とに基づき、
前記支持コンテキストスコアは、囲みデジタルインクストロークの信頼度スコアに基づく、
方法。 - (i)前記ノードリンクダイアグラムにデジタルインクストロークを追加するステップと、
(ii)前記ノードリンクダイアグラムからデジタルインクストロークを削除するステップと、
(iii)前記ノードリンクダイアグラムから文字項目のオブジェクト表現を削除するステップと、
(iv)前記ノードリンクダイアグラムから図形項目のオブジェクト表現を削除するステップと、
(v)前記ノードリンクダイアグラムのデジタルインクストロークを選択するユーザの入力を受け付けるステップと、
(vi)前記ノードリンクダイアグラムの文字項目のオブジェクト表現を選択するユーザの入力を受け付けるステップと、
(vii)前記ノードリンクダイアグラムの図形項目のオブジェクト表現を選択するユーザの入力を受け付けるステップと、
のうち少なくとも1つのステップと、
前記ノードリンクダイアグラムの漸増的構造認識を実行するステップと、
を更に含む、請求項1に記載の方法。 - 前記漸増的構造認識が、
追加、削除、およびユーザの入力の受付のうち少なくとも一つに起因して新たな構造仮説を生成するステップと、
(i)前記新たな構造仮説を既存の構造仮説グループとグループ化するステップ、及び、(ii)新たな構造仮説グループを形成するステップ、のうちの1つのステップと、
影響を受けたグループを認識するステップと、
前記受理された仮説から形成された階層束を更新するステップと、
を含む、請求項2に記載の方法。 - 前記適用された制約下で、集合的に高いスコアを割り当てられた仮説を探索するステップが、探索アルゴリズムを使用して前記仮説の仮説束を探索するステップを更に含み、
前記探索アルゴリズムは、前記複数の仮説の部分集合であって当該部分集合に含まれる仮説の前記信頼度スコアの合計が最大である部分集合を最適な仮説束として、最適な、ほぼ最適な、あるいは最良に達成可能な、仮説束を探索するアルゴリズムである、
請求項1に記載の方法。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US11/726,796 US7907141B2 (en) | 2007-03-23 | 2007-03-23 | Methods and processes for recognition of electronic ink strokes |
US11/726,796 | 2007-03-23 |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2008243204A JP2008243204A (ja) | 2008-10-09 |
JP2008243204A5 JP2008243204A5 (ja) | 2011-05-06 |
JP4820382B2 true JP4820382B2 (ja) | 2011-11-24 |
Family
ID=39364046
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008071456A Expired - Fee Related JP4820382B2 (ja) | 2007-03-23 | 2008-03-19 | ノードリンクダイアグラムに構造認識を提供する方法 |
Country Status (3)
Country | Link |
---|---|
US (1) | US7907141B2 (ja) |
EP (1) | EP1973062B1 (ja) |
JP (1) | JP4820382B2 (ja) |
Families Citing this family (49)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20070177804A1 (en) * | 2006-01-30 | 2007-08-02 | Apple Computer, Inc. | Multi-touch gesture dictionary |
TW200813806A (en) * | 2006-06-27 | 2008-03-16 | Ibm | Method, program, and data processing system for modifying shape of display object |
US9311528B2 (en) * | 2007-01-03 | 2016-04-12 | Apple Inc. | Gesture learning |
US8413075B2 (en) * | 2008-01-04 | 2013-04-02 | Apple Inc. | Gesture movies |
US8166119B2 (en) * | 2008-04-25 | 2012-04-24 | T-Mobile Usa, Inc. | Messaging device for delivering messages to recipients based on availability and preferences of recipients |
US9508059B2 (en) | 2008-04-25 | 2016-11-29 | T-Mobile Usa, Inc. | Messaging device having a graphical user interface for initiating communication to recipients |
WO2010009072A1 (en) * | 2008-07-14 | 2010-01-21 | Medtronic, Inc. | Improved interface for implantable medical device programming |
US8464167B2 (en) * | 2008-12-01 | 2013-06-11 | Palo Alto Research Center Incorporated | System and method for synchronized authoring and access of chat and graphics |
US20100163316A1 (en) * | 2008-12-30 | 2010-07-01 | Microsoft Corporation | Handwriting Recognition System Using Multiple Path Recognition Framework |
US8648878B2 (en) | 2009-03-16 | 2014-02-11 | Microsoft Corporation | Inferring diagram structure through implicit shape relationships |
JP5620113B2 (ja) * | 2010-01-26 | 2014-11-05 | シャープ株式会社 | 構造化データ処理装置、構造化データ処理方法、その方法を実現するためのプログラムおよび記録媒体 |
US8261213B2 (en) | 2010-01-28 | 2012-09-04 | Microsoft Corporation | Brush, carbon-copy, and fill gestures |
US9519356B2 (en) * | 2010-02-04 | 2016-12-13 | Microsoft Technology Licensing, Llc | Link gestures |
US9454304B2 (en) | 2010-02-25 | 2016-09-27 | Microsoft Technology Licensing, Llc | Multi-screen dual tap gesture |
US20110307840A1 (en) * | 2010-06-10 | 2011-12-15 | Microsoft Corporation | Erase, circle, prioritize and application tray gestures |
US9400592B2 (en) | 2012-03-26 | 2016-07-26 | Sharp Laboratories Of America, Inc. | Methods, systems and apparatus for digital-marking-surface space and display management |
JP2014032632A (ja) * | 2012-08-06 | 2014-02-20 | Toshiba Corp | 電子機器、方法、およびプログラム |
KR101413987B1 (ko) * | 2012-10-02 | 2014-07-01 | (주)이스트소프트 | 마인드맵 사용자 인터페이스를 포함하는 전자기기, 및 이를 이용한 마인드맵 작성방법 |
US9519414B2 (en) * | 2012-12-11 | 2016-12-13 | Microsoft Technology Licensing Llc | Smart whiteboard interactions |
US9727535B2 (en) * | 2013-06-11 | 2017-08-08 | Microsoft Technology Licensing, Llc | Authoring presentations with ink |
JP2015049618A (ja) * | 2013-08-30 | 2015-03-16 | 株式会社東芝 | 手書き文書処理装置、手書き文書処理方法及び手書き文書処理プログラム |
US9317937B2 (en) | 2013-12-30 | 2016-04-19 | Skribb.it Inc. | Recognition of user drawn graphical objects based on detected regions within a coordinate-plane |
US9384403B2 (en) | 2014-04-04 | 2016-07-05 | Myscript | System and method for superimposed handwriting recognition technology |
US9524440B2 (en) | 2014-04-04 | 2016-12-20 | Myscript | System and method for superimposed handwriting recognition technology |
JP6408273B2 (ja) * | 2014-07-17 | 2018-10-17 | シャープ株式会社 | 情報処理装置、情報処理プログラムおよび情報処理方法 |
US20160048318A1 (en) * | 2014-08-15 | 2016-02-18 | Microsoft Technology Licensing, Llc | Detecting selection of digital ink |
KR20160062565A (ko) | 2014-11-25 | 2016-06-02 | 삼성전자주식회사 | 디바이스 및 디바이스의 필기 컨텐트 제공 방법 |
US9864479B2 (en) | 2014-12-19 | 2018-01-09 | Xerox Corporation | System and method for managing and reviewing document integration and updates |
US9639183B2 (en) * | 2015-04-20 | 2017-05-02 | Wacom Co., Ltd. | System and method for bidirectional communication between stylus and stylus sensor controller |
US20180101724A1 (en) * | 2015-06-04 | 2018-04-12 | Mowdo | System and method for capturing and interpreting images into triple diagrams |
US9898841B2 (en) | 2015-06-29 | 2018-02-20 | Microsoft Technology Licensing, Llc | Synchronizing digital ink stroke rendering |
US10387034B2 (en) * | 2015-09-03 | 2019-08-20 | Microsoft Technology Licensing, Llc | Modifying captured stroke information into an actionable form |
US10210383B2 (en) | 2015-09-03 | 2019-02-19 | Microsoft Technology Licensing, Llc | Interacting with an assistant component based on captured stroke information |
US10324618B1 (en) * | 2016-01-05 | 2019-06-18 | Quirklogic, Inc. | System and method for formatting and manipulating digital ink |
US10067731B2 (en) | 2016-01-05 | 2018-09-04 | Quirklogic, Inc. | Method and system for representing a shared digital virtual “absolute” canvas |
US10755029B1 (en) | 2016-01-05 | 2020-08-25 | Quirklogic, Inc. | Evaluating and formatting handwritten input in a cell of a virtual canvas |
US10129335B2 (en) | 2016-01-05 | 2018-11-13 | Quirklogic, Inc. | Method and system for dynamic group creation in a collaboration framework |
US9904447B2 (en) | 2016-01-08 | 2018-02-27 | Microsoft Technology Licensing, Llc | Universal inking support |
US10228775B2 (en) * | 2016-01-22 | 2019-03-12 | Microsoft Technology Licensing, Llc | Cross application digital ink repository |
US10713304B2 (en) * | 2016-01-26 | 2020-07-14 | International Business Machines Corporation | Entity arrangement by shape input |
US9940513B2 (en) | 2016-03-11 | 2018-04-10 | Microsoft Technology Licensing, Llc | Intuitive selection of a digital stroke grouping |
US10817169B2 (en) * | 2016-10-14 | 2020-10-27 | Microsoft Technology Licensing, Llc | Time-correlated ink |
WO2018085929A1 (en) * | 2016-11-09 | 2018-05-17 | Quirklogic, Inc. | Method and system for erasing an enclosed area on an interactive display |
US10895954B2 (en) * | 2017-06-02 | 2021-01-19 | Apple Inc. | Providing a graphical canvas for handwritten input |
US10761719B2 (en) * | 2017-11-09 | 2020-09-01 | Microsoft Technology Licensing, Llc | User interface code generation based on free-hand input |
US10866997B2 (en) * | 2018-03-26 | 2020-12-15 | Kapow Technologies, Inc. | Determining functional and descriptive elements of application images for intelligent screen automation |
JP2019023888A (ja) * | 2018-09-20 | 2019-02-14 | シャープ株式会社 | 情報処理装置、情報処理プログラムおよび情報処理方法 |
KR20210073196A (ko) * | 2019-12-10 | 2021-06-18 | 삼성전자주식회사 | 필기 입력을 처리하는 방법 및 그 장치 |
CN115202553B (zh) * | 2021-04-14 | 2024-05-28 | 广州视源电子科技股份有限公司 | 白板应用的控制方法、装置和电子设备 |
Family Cites Families (32)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5252951A (en) * | 1989-04-28 | 1993-10-12 | International Business Machines Corporation | Graphical user interface with gesture recognition in a multiapplication environment |
US5953735A (en) * | 1991-03-20 | 1999-09-14 | Forcier; Mitchell D. | Script character processing method and system with bit-mapped document editing |
US5539427A (en) * | 1992-02-10 | 1996-07-23 | Compaq Computer Corporation | Graphic indexing system |
US5485565A (en) * | 1993-08-04 | 1996-01-16 | Xerox Corporation | Gestural indicators for selecting graphic objects |
US5553224A (en) * | 1993-08-04 | 1996-09-03 | Xerox Corporation | Method for dynamically maintaining multiple structural interpretations in graphics system |
US5522022A (en) | 1993-11-24 | 1996-05-28 | Xerox Corporation | Analyzing an image showing a node-link structure |
US5528290A (en) * | 1994-09-09 | 1996-06-18 | Xerox Corporation | Device for transcribing images on a board using a camera based board scanner |
DE69533074T2 (de) * | 1994-09-09 | 2004-09-16 | Xerox Corp. | Verfahren zum Interpretieren handgeschriebener schematischer Benutzerschittstellenbefehle |
US5687364A (en) * | 1994-09-16 | 1997-11-11 | Xerox Corporation | Method for learning to infer the topical content of documents based upon their lexical content |
US5659766A (en) * | 1994-09-16 | 1997-08-19 | Xerox Corporation | Method and apparatus for inferring the topical content of a document based upon its lexical content without supervision |
US5798769A (en) * | 1996-08-15 | 1998-08-25 | Xerox Corporation | Method and apparatus for maintaining links between graphic objects in a free-form graphics display system |
JPH10187185A (ja) * | 1996-12-25 | 1998-07-14 | Fuji Xerox Co Ltd | 言語処理装置および方法 |
US6380954B1 (en) * | 1998-02-09 | 2002-04-30 | Reuters, Ltd. | Method and system for layout of objects within a perimeter using constrained interactive search |
US6766494B1 (en) * | 1998-06-15 | 2004-07-20 | Fuji Xerox Co., Ltd. | Method and system for creating ad-hoc links from free-form ink |
US6377710B1 (en) * | 1998-11-25 | 2002-04-23 | Xerox Corporation | Method and apparatus for extracting the skeleton of a binary figure by contour-based erosion |
US6411733B1 (en) * | 1998-11-25 | 2002-06-25 | Xerox Corporation | Method and apparatus for separating document image object types |
US6459442B1 (en) | 1999-09-10 | 2002-10-01 | Xerox Corporation | System for applying application behaviors to freeform data |
US6651048B1 (en) * | 1999-10-22 | 2003-11-18 | International Business Machines Corporation | Interactive mining of most interesting rules with population constraints |
EP1277104A1 (en) | 2000-03-30 | 2003-01-22 | Ideogramic APS | Method for gesture based modeling |
US7139004B2 (en) | 2002-01-25 | 2006-11-21 | Xerox Corporation | Method and apparatus to convert bitmapped images for use in a structured text/graphics editor |
US7136082B2 (en) * | 2002-01-25 | 2006-11-14 | Xerox Corporation | Method and apparatus to convert digital ink images for use in a structured text/graphics editor |
US6903751B2 (en) * | 2002-03-22 | 2005-06-07 | Xerox Corporation | System and method for editing electronic images |
US7036077B2 (en) | 2002-03-22 | 2006-04-25 | Xerox Corporation | Method for gestural interpretation in a system for selecting and arranging visible material in document images |
US7123770B2 (en) | 2002-05-14 | 2006-10-17 | Microsoft Corporation | Incremental system for real time digital ink analysis |
US20040090439A1 (en) | 2002-11-07 | 2004-05-13 | Holger Dillner | Recognition and interpretation of graphical and diagrammatic representations |
CA2470930A1 (en) * | 2003-08-21 | 2005-02-21 | Microsoft Corporation | Electronic ink processing |
CN1669047A (zh) * | 2003-08-21 | 2005-09-14 | 微软公司 | 电子墨水处理 |
US8074184B2 (en) * | 2003-11-07 | 2011-12-06 | Mocrosoft Corporation | Modifying electronic documents with recognized content or other associated data |
US7729538B2 (en) | 2004-08-26 | 2010-06-01 | Microsoft Corporation | Spatial recognition and grouping of text and graphics |
US7400771B2 (en) | 2004-09-21 | 2008-07-15 | Microsoft Corporation | System and method for connected container recognition of a hand-drawn chart in ink input |
US7581052B1 (en) | 2005-08-22 | 2009-08-25 | Sun Microsystems, Inc. | Approach for distributing multiple interrupts among multiple processors |
US7725493B2 (en) * | 2007-03-23 | 2010-05-25 | Palo Alto Research Center Incorporated | Optimization method and process using tree searching operation and non-overlapping support constraint requirements |
-
2007
- 2007-03-23 US US11/726,796 patent/US7907141B2/en not_active Expired - Fee Related
-
2008
- 2008-02-25 EP EP08151894A patent/EP1973062B1/en not_active Ceased
- 2008-03-19 JP JP2008071456A patent/JP4820382B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
US7907141B2 (en) | 2011-03-15 |
EP1973062A1 (en) | 2008-09-24 |
US20080231635A1 (en) | 2008-09-25 |
JP2008243204A (ja) | 2008-10-09 |
EP1973062B1 (en) | 2011-10-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4820382B2 (ja) | ノードリンクダイアグラムに構造認識を提供する方法 | |
JP5284662B2 (ja) | ペンコンピュータシステム内にノードリンクダイアグラムを生成および編集する方法および装置 | |
US7725493B2 (en) | Optimization method and process using tree searching operation and non-overlapping support constraint requirements | |
US11709992B2 (en) | System and method for collaborative ink management | |
RU2702270C2 (ru) | Обнаружение выбора рукописного фрагмента | |
KR102473543B1 (ko) | 디지털 잉크 상호작용을 위한 시스템 및 방법 | |
KR102677199B1 (ko) | 그래픽 객체를 선택하기 위한 방법 및 대응하는 디바이스 | |
KR102470522B1 (ko) | 핸드라이팅된 다이어그램 커넥터들의 관리를 위한 시스템 및 방법 | |
US11880648B2 (en) | Automatic semantic labeling of form fields with limited annotations | |
JP2020140450A (ja) | 構造化データ生成方法および構造化データ生成装置 | |
Schwarz et al. | An architecture for generating interactive feedback in probabilistic user interfaces | |
Malik et al. | Reimagining application user interface (UI) design using deep learning methods: Challenges and opportunities | |
Carcangiu et al. | Gesture modelling and recognition by integrating declarative models and pattern recognition algorithms | |
Sun et al. | Informal user interface for graphical computing | |
JP2024084393A (ja) | 情報処理装置、情報処理装置の制御方法、及びプログラム | |
WO2017118609A1 (en) | System and method for digital ink interactivity |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110316 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20110316 |
|
A871 | Explanation of circumstances concerning accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A871 Effective date: 20110316 |
|
A975 | Report on accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A971005 Effective date: 20110401 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110426 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110722 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20110809 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20110902 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140909 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |