JP2005228328A - デジタルインク質疑検索装置及びその方法 - Google Patents

デジタルインク質疑検索装置及びその方法 Download PDF

Info

Publication number
JP2005228328A
JP2005228328A JP2005033675A JP2005033675A JP2005228328A JP 2005228328 A JP2005228328 A JP 2005228328A JP 2005033675 A JP2005033675 A JP 2005033675A JP 2005033675 A JP2005033675 A JP 2005033675A JP 2005228328 A JP2005228328 A JP 2005228328A
Authority
JP
Japan
Prior art keywords
segment
search
question
memo
digital ink
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2005033675A
Other languages
English (en)
Other versions
JP4308785B2 (ja
Inventor
Chung-Shik Lee
忠植 李
Hee-Seon Park
朴 喜仙
Ho-Chul Shin
申 昊▲チュル▼
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Samsung Electronics Co Ltd
Original Assignee
Samsung Electronics Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Samsung Electronics Co Ltd filed Critical Samsung Electronics Co Ltd
Publication of JP2005228328A publication Critical patent/JP2005228328A/ja
Application granted granted Critical
Publication of JP4308785B2 publication Critical patent/JP4308785B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/142Image acquisition using hand-held instruments; Constructional details of the instruments
    • G06V30/1423Image acquisition using hand-held instruments; Constructional details of the instruments the instrument generating sequences of position coordinates corresponding to handwriting
    • GPHYSICS
    • G07CHECKING-DEVICES
    • G07FCOIN-FREED OR LIKE APPARATUS
    • G07F9/00Details other than those peculiar to special kinds or types of apparatus
    • G07F9/10Casings or parts thereof, e.g. with means for heating or cooling
    • GPHYSICS
    • G07CHECKING-DEVICES
    • G07FCOIN-FREED OR LIKE APPARATUS
    • G07F13/00Coin-freed apparatus for controlling dispensing or fluids, semiliquids or granular material from reservoirs
    • G07F13/10Coin-freed apparatus for controlling dispensing or fluids, semiliquids or granular material from reservoirs with associated dispensing of containers, e.g. cups or other articles

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Multimedia (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Image Analysis (AREA)

Abstract

【課題】 ユーザがデジタルペンインターフェースを用いて手書き入力したメモからユーザの質疑語に該当する単語を検索する装置及びその方法を提供する。
【解決手段】 入力された質疑語またはメモに関するデジタルインクデータから各種の不要な部分を除去して情報量を減少させる前処理部と、情報量が減少したデータから特徴ベクトルを抽出する特徴抽出部と、質疑語がメモのうちマッチングされる部分があるかどうかをセグメント単位で検索する質疑語検索部とよりなる装置。本発明によれば、デジタルペンで質疑語を入力して既に作成されたメモあるいは文書内で所望の内容を検索する方法において、正確性と迅速性とを期することができる。
【選択図】 図3

Description

本発明は文字入力装置に係り、より詳細にはユーザがデジタルペンインターフェース(digital pen interface)を用いて手書き入力したメモからユーザの質疑語に該当する単語を検索する装置及びその方法に関する。ここで、デジタルペンインターフェースとは、タッチスクリーンのようにペン形態のデバイスを画面に接触することで、その圧力あるいは電子的信号を感知して該当デバイスの移動軌跡を電子的形態に検出できる装置を用いて、紙上にペンで筆記する伝統的方式をデジタル形態に具現したインターフェースを意味する。
最近デジタル技術の発展につれて、デジタルデバイスの普及が急速に進行しつつ、小型化及び軽量化など多様な発展趨勢を示している。特に、最近の数十年間デジタルデバイスのインターフェースとして確固たる位置づけを揃えているキーボード、マウスインターフェースはデジタルデバイスの小型化趨勢につれて、携帯性に関する問題が指摘されている。このような問題を解決するための代案インターフェース(substitute interface)の必要性は数十年前から指摘されており、音声(voice)、ペン(pen)、ジェスチャ(gesture)、映像(video)などを用いた代案インターフェースを開発するための研究が進行されてきた。その中でも、数千年間人間社会でのコミュニケーションの手段として使われてきたペンと音声インターフェースとはその自然さと表現力の膨大さによって注目されている。
デジタルペンインターフェースは、紙上にペンを用いて文字、図、記号などを記録するコミュニケーションの習慣をデジタルデバイスに適用しようとする試みである。このようなペンインターフェースをデジタル化するための方案として文字認識技術が研究されつつある。文字認識技術とは、パターン認識技術を用いてデジタルペンで入力された文字情報(以下、‘インク’と表現する)を認識(Recognize)してコンピュータで文字を表現する方式であるアスキー(ASCII)コード形態に変換する技術を意味する。
しかし、文字認識技術は、研究の成果に比べてユーザに広く普及されていない実情であるが、その普及の障壁としては、大きく2つの原因を指摘しうる。第1に、文字認識速度が遅いという点である。ユーザが自然に筆記するためには連続的に筆記する過程中に時間の遅延なしに認識、処理されねばならないが、実際には0.5秒程度の時間遅延が発生して、ユーザの連続的な筆記に心理的に退屈さを感じさせる問題を誘発する。
第2に、文字認識のエラーによる障壁を原因と指摘しうる。現在の文字認識技術のレベルでは、実際状況で90%程度の正確度で文字を認識処理しているが、これも文字と文字との区分を容易にするための色々なインターフェース的なサポート装置が提供される環境での性能であると言える。ユーザの筆記を連続的に認識処理する過程でエラーが発生する場合には、ユーザはエラーを修正するための行動を取るようになるが、これも連続性を妨害する要素として作用する。
ペンインターフェース分野でかかる文字認識技術の弱点を克服するための代案として、デジタルインク、すなわちデジタルペンの軌跡を利用するが、文字認識過程(入力されたデジタルインクがASCIIコードのうち何れに該当するかを決定する過程)を経ない技術が提示されている。図1のように、検出したペンの軌跡を検出した状態でデジタル化して保存し、その内容をそのまま見せることによって、ユーザが記録した情報を入手可能にする方式が提示されている。この方式は、文字認識過程を経ないために筆記しているユーザの手の自然な動きを妨害しないために、文字認識技術の短所を克服しうる。
しかし、前記インターフェースは、コンピュータが認識できるコード化された文字形態で保存をしないために、今後にユーザが所望の情報を検索しようとする時、記録されたあらゆる情報をユーザが直接確認する過程を経ねばならない短所を有している。このような短所を克服するためには、デジタルインクで記録された媒体に対する検索技術が開発されねばならない。これと関連して、図1のようにデジタルインクで記録されたメモ(以下、‘メモ’と称する)が複数存在する状況で、図2のようにデジタルインク形態の検索質疑語(以下、‘質疑語’と称する)を入力した時、質疑語の内容である‘結婚式’という部分を含んでいるメモを検索結果として示す技術(以下、‘デジタルインク検索技術’と称する)がある。
デジタルインク検索に関する従来の方式は、検索しようとする単位が単語単位で分割されている場合であるか、あるいは単語間の間隔を十分に広げて筆記して、単語単位で分割するのに問題のない場合を前提としている。
質疑語とメモとが何れも単語単位で分割されたならば、既存の多様な文献で提示しているElastic Matchingなどの方法を使用して質疑語とメモとの類似度を比較する方式で簡単に処理しうる。このような状況では比較検索しようとする対象が明確なために単語単位への分割には問題がなく、速度も大きい問題にはならない。前記Elastic Matching方法は、非特許文献1に開示されている。この方法は、確定された2つの対象を比較し、その結果、前記二対象間の類似度を数値で示す。
しかし、実際にはデジタルデバイスのほとんどが入力画面が小型であり、このようなデバイスでは空間の制約によって文字間、単語間の間隔がないか、分割が容易なだけ十分に広くないために、ユーザが単語間に空白なしに入力する場合が多い。また入力する空間が十分な場合にも、ユーザの特性によって厳格な別ち書きをしない場合もある。このように検索対象の分割が容易ではない状況下では、質疑語をメモ内のどの部分と比較すれば良いかも分からなくなるので、根本的な問題に逢着するようになる。
C.C.Tappertの論文"Cursive Script Recognition by Elastic Matching(IBM J.Research Development,V.26,No.6,pp.765−771,1982)"
従って、本発明は前記問題点を考慮して創案されたものであって、ユーザがデジタルペンを用いてメモを複数生成し、今後ユーザにより入力された質疑語に対する検索機能を具現するための方法を提供することをその目的とする。
また、本発明の他の目的は、前記検索機能を具現するために、質疑語の特定部分だけを用いてスポッティングする方法を提供することである。
また、本発明のさらに他の目的は、前記検索機能を具現するために、付加的なメタ情報を利用する方法を提供することである。
前記目的を達成するための本発明に係るデジタルインク検索装置は、入力された質疑語またはメモに関するデジタルインクデータから各種の不要な部分を除去して情報量を減少させる前処理部と、前記情報量が減少したデータから特徴ベクトルを抽出する特徴抽出部と、前記質疑語が前記メモのうちからマッチングされる部分があるかどうかをセグメント単位で検索する質疑語検索部と、を含む。
前記デジタルインク検索装置は、ユーザのストロークを入力され、これを前記デジタルインクデータと認識して前処理部に伝達するデジタイザーをさらに含むことが望ましい。
前記デジタルインク検索装置は、前記検索結果マッチングされた部分を強調して前記マッチングされた部分を含むメモをユーザにディスプレイし、全体メモ中にマッチングされる部分が存在しなければ、その結果をメッセージにてユーザに知らせるディスプレイ部をさらに含むことが望ましい。
前記デジタルインク検索装置は、前記入力ストロークがメモである場合には、そのメモデータを前記特徴抽出部から抽出された特徴ベクトルの形に保存し、質疑語検索時に質疑語検索部に前記保存されたメモを提供するメモDBをさらに含むことが望ましい。
前記質疑語検索部は、前記特徴ベクトルで表現される文字を時間的に入力された順序情報または空間的分離情報を用いてセグメントに分割するセグメント分割部と、前記分割されたセグメントに対して検索する順位を決定し、これをスポッティング部に提供する検索順位決定部と、スポッティングテーブルを用いて前記決定された検索順位のうち最高の順位を有する質疑語のセグメントをメモのセグメントと比較して類似度が所定の臨界値(a)を超えるセルを検索するスポッティング部と、前記検索されたセルから前記セルの周辺を検索して質疑語全体に対して該当メモとの一致部分があるかどうかを検査する周辺検索部と、を含むことが望ましい。
前記検索順位は、各セグメントの情報量で決定することが望ましい。
前記スポッティングテーブルは、列と行とに区分された多段階の明暗程度を有するセルより構成されるが、i番目の列とj番目の行とが合うセルは、質疑語のi番目のセグメントと検索対象メモのj番目のセグメントとの類似度を比較した結果を記録することが望ましい。
前記類似度は、Elastic Matching方法によって求められることが望ましい。
前記セル周辺の検索は、前記セルの対角線方向に検索するが、前記スポッティングテーブルの上端及び下端に至るまで検索することが望ましい。
前記セル周辺の検索は、前記セルの対角線方向に検索するが、横拡張及び縦拡張を通じて次に選択されるノードの候補群を選定し、Best First Search方式によって現在までの検索結果のうち最も類似度の高い部分から連続拡張して行きつつ、スポッティングテーブルの上端及び下端に至るまで検索することが望ましい。
前記一致部分は、前記上端及び下端に至るまで検索した結果に対する累積類似度を決定し、前記累積類似度が所定の臨界値(b)を超える場合にメモで該当部分を意味することが望ましい。
前記候補群のうち拡張なしに対角線方向のセルを次のノードに選択する場合に、累積類似度は、式(1)で表されるが、liは現在ノードで使用する質疑語セグメントの長さを、li+1は次のノードで拡張された質疑語セグメントの長さを、式(2)は質疑語のi番目のセグメントと検索対象メモのji番目のセグメントの類似度を、式(3)は質疑語のi+1番目のセグメントと検索対象メモのji+1番目のセグメントの類似度を意味することが望ましい。
Figure 2005228328
前記候補群のうち縦拡張を行う場合に、累積類似度は、式(4)で表されるが、liは現在ノードで使用する質疑語セグメントの長さを、li+1は次のノードから拡張された質疑語セグメントの長さを、li+2は次の次のノードから拡張された質疑語セグメントの長さを、式(5)は質疑語のi番目のセグメントと検索対象メモのji番目のセグメントの類似度を、式(6)は質疑語のi+1番目のセグメントとi+2番目のセグメントとの和と検索対象メモのji+1番目のセグメントの類似度を意味することが望ましい。
Figure 2005228328
前記候補群のうち縦拡張を行う場合に、累積類似度は、式(7)で表されるが、liは現在ノードで使用する質疑語セグメントの長さを、li+1は次のノードから拡張された質疑語セグメントの長さを、式(8)は質疑語のi番目のセグメントと検索対象メモのji番目のセグメントとの類似度を、式(9)は質疑語のi+1番目のセグメントと、検索対象メモのji+1番目のセグメントとji+1+1番目のセグメントとの和との類似度を意味することが望ましい。
Figure 2005228328
前記検索順位の決定は、前記質疑語及び前記メモを文字単位で分割し、前記質疑語のセグメントのうち文字の開始部分または終了部分に該当するセグメントに対してだけ検索順位を決定することが望ましい。
前記質疑語のセグメントとメモのセグメントとの比較は、前記検索順位のうち最優先順位と決定されたセグメントを前記決定されたセグメントが開始部分であるか、終了部分であるかによって、検索対象メモで文字の開始部分または終了部分に該当するセグメントとだけ比較することが望ましい。
前記目的を達成するために本発明に係るデジタルインク検索方法は、入力されたメモに関するデジタルインクデータから各種の不要な部分を除去して情報量を減少させる段階と、前記情報量が減少したメモデータから特徴ベクトルを抽出してメモDBに保存する段階と、入力された質疑語に対するデジタルインクデータから各種の不要な部分を除去して情報量を減少させる段階と、前記情報量が減少した質疑語データから特徴ベクトルを抽出する段階と、前記質疑語が前記メモのうちからマッチングされる部分があるかどうかをセグメント単位で検索する段階と、を含む。
前記セグメント単位で検索する段階は、前記特徴ベクトルで表現される文字を時間的に入力された順序情報または空間的分離情報を用いてセグメントに分割する段階と、前記分割されたセグメントに対して検索する順位を決定する段階と、スポッティングテーブルを用いて前記決定された検索順位のうち最高の順位を有する質疑語のセグメントをメモのセグメントと比較して類似度が所定の臨界値(a)を超えるセルを検索する段階と、前記検索されたセルから前記セルの周辺を検索して質疑語全体に対して該当メモとの一致部分の有無を検査する段階と、を含むことが望ましい。
本発明によれば、デジタルペンで質疑語を入力して既に作成されたメモあるいは文書内で所望の内容を検索する方法において、正確性と迅速性とを期することができる。
また、本発明によれば、文字認識過程で発生する入力遅延なしにユーザが速かに入力できて製品の親密度を向上させうる。
以下、添付した図面に基づき本発明を詳しく説明する。 本発明の利点及び特徴、そしてこれを達成する方法は添付された図面に基づいて詳細に後述されている実施例を参照すれば明確になる。しかし、本発明は以下で開示される実施例に限定されるものではなく、この実施例から外れて多様な形に具現でき、本明細書で説明する実施例は本発明の開示を完全にし、本発明が属する技術分野で当業者に発明の範疇を完全に報せるために提供されるものであり、本発明は請求項及び発明の詳細な説明により定義されるだけである。一方、明細書全体に亙って同一な参照符号は同一な構成要素を示す。
本発明の一実施例に係るデジタルインク検索装置は、図3のように構成される。デジタルインク検索装置100は、デジタイザー10、前処理部20、特徴抽出部30、メモDB40、質疑語検索部50、及びディスプレイ部60を含んで構成されうる。
デジタイザー10は、ユーザのストロークを入力され、これをピクセル別2進データ、すなわちデジタルインクデータと認識して前処理部20に伝達する。デジタイザー10の解像度は、例えば、インチ当り150ポイント程度にして入力されることができ、秒当たり50ポイントの速度でプロセッサーに伝達しうる。
前処理部20は、入力されたデジタルインクデータの各種の不要な部分を除去して情報量を減少させる。前記不要な部分は、ユーザストローク入力の不完全性、文字サイズの多様性、筆記速度の多様性などによって発生する。このような、前処理過程にはDe−Hooking、Resamplingなどの処理を含みうる。De−Hookingは、ペン入力過程でストローク(ペンを離さずに一度に筆記する単位)の開始と終了部分で現れるフック(Hook)を除去する過程である。Resamplingは、情報の歪曲を最小化しつつ、情報量を減らすための処理過程であって、変化の大きい部分の点(Point)を除いた残り部分の点を削除する過程である。
特徴抽出部(feature extraction)30は、前処理を通じてフィルタリングされたデータから特徴ベクトルを抽出する。前記特徴ベクトルには点と点とが連結されたラインの角度、その長さなどが情報として含まれ、その他の多様な情報を特徴情報として使用しうる。このような特徴抽出過程に関して色々な従来の方法が存在するが、本発明ではこれらのうちから1つの方法を利用しうる。例えば、B.K.Shin、J.Y.Ha、S.C.Oh、KimJ.H.の共著論文、“Network−based approach to online cursive script recognition”(IEEE Trans.on Systems,Manand Cybernetics,PartB,V.29,Issue2,1999)に開示された特徴抽出方法を用いられる。
ユーザが入力したストロークは、単純な‘メモデータ’であるか、前記メモデータでマッチングされる部分を探すための‘質疑語’であり得る。メモDB40は、前記入力ストロークが単純なメモデータである場合には、そのメモデータを特徴抽出部30で抽出された特徴ベクトルの形に保存する。
一方、前記入力ストロークが質疑語である場合には、メモDB40を経ずに質疑語検索部50に入力される。
質疑語検索部50は、本発明の核心部分であって、質疑語がメモDBに保存されたメモデータでマッチングされる部分があるかどうかを所定のマッチングアルゴリズムを用いてセグメント単位で検索し、その検索結果をディスプレイ部に伝達する。
ディスプレイ部60は、質疑語検索結果、マッチングされる部分が存在するメモをそのマッチングされた部分を強調してユーザにディスプレイし、全体メモにマッチングされる部分が存在しなければ、その事実をユーザにメッセージにて知らせる。図4では、ユーザにディスプレイされるメモの例を示した。
図5は、質疑語検索部50の構成を示すブロック図である。質疑語検索部50は、セグメント分割部51、検索順位決定部52、スポッティング部53、周辺検索部54を含んで構成されうる。
セグメント分割部51は、前記特徴ベクトルで表現される文字を時間的情報(temporal information;時間的に入力された順序情報)または空間的情報(spatial information;空間的に分離された情報)を用いて分割単位、すなわち、セグメントに分割する。セグメントとは、ユーザが入力した文字のうちから他の部分と連結性なしに、別途に分離された部分であると定義しうる。したがって、ハングルの場合に1つの子音、母音などの音素などになり、英文の場合には1つのアルファベット文字になりうる。しかし、ユーザの筆記方式によっては、2つの音素が1つのセグメントに認識されることもあり、1つの音素が2つのセグメントに認識されることもあって、前記セグメント分割はユーザの入力が実際には同じ文字を示すとしても、ユーザの筆記方式によって可変的になりうる。
ここで。‘別途に分離’されたと表現したのは、ほとんど空間的に分離されたものだけでなく、経時的に分離されたことも含まれるという点に注目せねばならない。例えば、図2の例で‘数4’の‘数5’は‘数6’の‘数7’と空間的に連結されているが、時間的には連結されていない。デジタイザーを通じてユーザがメモや質疑語を入力する時、デジタイザーは入力された最終形態だけでなく、ストロークの順序情報も分かるので、これを利用するならば、‘数5’の次に‘数8’が記録されるために‘数5’と‘数7’とを合わせて1つのセグメントには認識しない。
Figure 2005228328
Figure 2005228328
Figure 2005228328
Figure 2005228328
Figure 2005228328
セグメント別分割を決定する基準は、色々あり得る。例えば、デジタイザーの表面でペンデバイスの接触が落ちる瞬間を基準に、1つのセグメントが完成され、次のセグメントが始まると認識しうる。英文の場合には、局部的最大点、最小点を基準に分割してもよく、連結画分析を通じて連結画(Ligature)地点を基準に分割する方法を使用しても良い。以外にも、セグメントを認識する従来の方法には、多様にあり、本発明ではこれらうち1つの方法を選択して使用しうる。
図2の質疑語をセグメント別に分離した例を図6に示した。各セグメントは、ユーザがデジタイザーに入力した時間的順序によって配列され、i値はその配列順序を示す。これは、入力された時間的順序に過ぎず、検索順序ではないという点に留意せねばならない。
一方、本発明でセグメントは、望ましくは上記の通りに定義したが、これに限定されず、1つのストローク(字画)をセグメントと定義しても良い。但し、一般的にストロークをセグメントとして選択すれば、文字の分割が多すぎて検索性能が低下する場合が多いが、別ち書きの少ない筆記方式(例えば、英語の筆記体)を使用する場合には、かえってストローク単位で分割することがさらに有利である。
検索順位決定部52は、セグメント分割部51で分割されたセグメントに対して検索する順位を決定する。スポッティング部53で行われるスポッティング過程が意味ある結果を出すためには、次の2つの基本条件を満足せねばならない。第1に、複雑度を十分に減らせねばならない。第2に、スポッティングの結果が十分な意味を有さねばならない。このような条件を充足させるために、セグメント分割部51で分割した各セグメントに対して前記2つの条件を満足させうるセグメントを優先順位として、それらの適用順序を定める。前記第1の条件を満足させるためには、分割された部分が全体質疑語に比べて十分に小さい単位でなければならない。そして、前記第2の条件を満足させるためには、分割された部分があまりにも単純なパターンであってはならず、一般的によく発生しないパターンであるほど良い。
図7のスポッティングテーブルを参照すれば(図7の詳細な説明は後述する)、1)部分でスポッティングを進める場合、総3箇所がスポッティングされる一方、2)部分でスポッティングを進めれば、総8箇所のスポッティングが進められることが分かる。すなわち、2)部分でスポッティングを進める場合には、誤ったスポッティング(False Alarm)が頻繁に発生する一方、1)部分で進める場合には誤ったスポッティングの回数が少ない。しかし、1)部分でスポッティングを進める場合、誤った拒絶(False Rejection)の可能性が高まるために、以上の2つの条件を折衝できる方式で質疑語を分割してスポッティング順序を決定せねばならない。
図8を参照して、各セグメントの情報量によってセグメントの優先順位を決定する方式の例を説明する。各セグメントの情報量を決定する方式では、前処理部20で前処理を行った後、現れる点の数を使用する。すなわち、セグメントを構成する点の数が多ければ、セグメントの情報量が多いと判断し、情報量の多いセグメントに検索の優先順位をあたえる方式である。
図8において質疑語の各部分のうち5個の点で構成された部分が総4つで優先順位が同じである。これらのうち、任意選択(random selection)を通じてスポッティングに使用する順序を決定しうる。
スポッティング部53は、スポッティングテーブルを用いて前記決定された検索順位のうち最高の順位を有する質疑語セグメントをメモセグメントと比較して臨界値を超えるセルを検索する。
スポッティングとは、全体を比較する複雑度を避けるための方法であって、検索しようとする質疑語のセグメント単位で検索対象をスキャンする方法である。
デジタルインク検索上の最も大きい問題点の1つは、検索対象であるメモを検索のための特定単位で分割するのが容易ではないという点である。例えば、図2の‘結婚式’という質疑語が、図1のようなメモ内に存在しているか否かを検索しようとするならば、メモ内のあらゆる可能な字画の順序的な組合わせを抽出して質疑語との類似度を比較せねばならない。すなわち、‘数9’との類似度を比較するか、あるいは‘数10’、あるいは‘数11’、‘数12’、はなはだしくは字画の一部である‘数13’などの部分とも類似度を比較せねばならない場合が発生する。これは文字と文字との境界を正確に把握し難いという事実に起因する。
Figure 2005228328
Figure 2005228328
Figure 2005228328
Figure 2005228328
Figure 2005228328
このような方式では、検索の複雑度が高すぎて実際の使用は不可能であり、いかなる方式でもメモ内で質疑語に該当する部分が実際に存在しているか、存在するならばどの部分であるかをできるだけ少ない回数の類似度比較だけで処理できる方法が必要である。
本発明では、高速検索を実現するための方法として、あらゆる可能性ある候補を検索せず、検索語の特定部分だけを抽出してこれを検索し、該当部分に対して高い類似度として検索結果が出る場合にのみ、さらに詳細な検索を進める方式で高速化を実現する方法を説明する。
本発明では、図7に示したように、スポッティングという方法を通じて質疑語の一部分だけで検索を進めることによって、類似度検索の単位を大きく減らして、検索所要時間を大幅に短縮すると共に、実際に全体質疑語に対する類似度比較回数を減らす方法を使用する。
例えば、図9に示したように、質疑語の特定セグメント(例えば、終声‘数14’部分)とメモの全体領域に対して類似度を比較する。類似度の比較結果、終声‘数14’と類似した部分としては、‘数15’、‘数16’、‘数17’、‘数18’の終声部分が検出されうることを示している。このようにスポッティングされた地点から各々残りの部分に対する検索(Candidate Expansion)を進めることによって、質疑語の全体領域との類似度を比較しうる。
Figure 2005228328
Figure 2005228328
Figure 2005228328
Figure 2005228328
Figure 2005228328
スポッティング過程を分かりやすく行うためのスポッティングテーブルの一例を図7に示した。スポッティングテーブルは、列(row)と行(column)とに区分された多段階の明暗程度を有する四角形より構成されている。列は質疑語をセグメント単位で分割した後、それぞれの単位別に分離されたことを意味し、行は検索対象メモを検索の単位で分割した後、それぞれの単位別に広げたことを意味する。すなわち、i番目の列とj番目の行とが合うセルは質疑語のi番目のセグメントと検索対象メモのj番目のセグメントとの類似度を比較した結果である。
各四角形の明暗は、各セルの類似度比較結果を意味する。明暗の濃いセル(図7の701〜708)であるほど、比較された両セグメントが類似しているということを意味し、特に赤い色(705〜708)で表示されたセルはスポッティング臨界値を超えるということ、すなわち、質疑語のセグメントとメモのセグメントとがマッチングされるということを示す。
スポッティング過程をさらに詳細に説明すれば、質疑語セグメントのうち質疑語検索部50の検索順序によって最優先検索順位を有する質疑語セグメントに対して水平方向(jを増加させる方向)に進めつつ、メモでマッチングされるセグメントの有無を探す。もし、マッチングされるセグメントが存在しないならば、前記最優先検索順位の次の順位を有する質疑語セグメントに対して同じ方法でマッチングされるセグメントの有無を探す。
マッチング如何を判断することは、現在スポッティングに使用している質疑語の特定セグメントとメモの特定セグメントとの類似度を比較し、これを[Min、Max]値で正規化された形に出力し、計算された値を臨界値と比較して設定された臨界値を超える場合には、これをマッチングされたと判断し、このようにマッチングされたセルを‘スポッティングされたセル’であると定義する。
もし、計算された類似度値が臨界値より小さな場合には、メモの次のセグメントを選択し、同じ過程を反復する。類似度比較方法は、前述したElastic Matching方法などを使用して比較結果を正規化された数値で表現可能な色々な方法を使用しうる。スポッティング過程で計算される類似度比較結果は、類似度テーブルを作成して保管することによって必要な場合に限って計算し、重複された計算をしない。
周辺検索部54は、前記検索された(スポッティングされた)セルから前記セルの周辺を検索して質疑語全体に対して該当メモとの一致部分の有無を検査する。スポッティング部53でのスポッティング過程を通じて現在質疑語のセグメントとマッチングされるメモのセグメントが存在すれば、その該当するセルで対角線方向にスポッティングテーブルの上端及び下端に至るまで移動しつつ、次のセルでの類似度を計算し、これを該当セルに記録(色相(図7の白黒部分701〜708)で表示)する。このような過程は、対角線方向のあらゆるセルに対して処理されるまで反復される。
ここで、対角線方向とは、左上または右上方向を意味するが、左上方向への移動とは、現在セル座標が(i、j)とする時、(i−1、j−1)座標を有するセルに移動することであって、これは質疑語の以前セグメントをメモの以前セグメントと比較するものとなる。そして、右下方向への移動とは、現在セル座標が(i、j)とする時、(i+1、j+1)座標を有するセルに移動することであって、質疑語の以後セグメントをメモの以後セグメントと比較することである。このような過程を‘周辺検索’と名付ける。
例えば、図10Aに示されたように、マッチングされたセル(A)を基準として左上方向に移動しつつ、その方向のあらゆるセルでの類似度を計算して記録する。その後、またセルAから右下方向に移動しつつ、その方向のあらゆるセルでの類似度を計算して記録するようになる。
このように、対角線方向に類似度を比較する過程は、質疑語セグメントとメモセグメントとが相互一対一対応ということを前提とすることであるが、実際の筆記方式によっては、1つのセグメントに複数の音素が含まれることもあり、1つの音素が複数のセグメントと認識されることもある。
このような問題点を解決するために各部分単位でマッチングされた類似度情報及び各部分の長さ情報などを用いてスポッティングされた地点から拡張していきつつ検索を進めることが望ましい。
図10Bは、スポッティングされたセルから拡張検索を進める方式を図式化している。ここで、緑色枠で描いた部分(図10Bの101〜108)は、実際質疑語のセグメントとメモのセグメントとが対応する正答をマーキングしておいたものである。スポッティングされたセルBから矢印(a)方向に向かうこと、すなわち、拡張のない場合は、1つの質疑語セグメントと1つのメモセグメントとを比較することを示す。そして、矢印(b)方向に拡張すること、すなわち横拡張は1つの質疑語セグメントと2つのメモセグメントを合わせたものとを比較することを示す。また、矢印(c)方向に拡張すること、すなわち縦拡張は2つの質疑語セグメントを合わせたものと1つのメモセグメントとを比較することを示す。
横拡張は、質疑語で2つの音素が1つのセグメントと認識され、メモでは、1つの音素が1つのセグメントと認識された場合に備える方法である。そして、縦拡張は、質疑語で1つの音素が1つのセグメントと認識され、メモでは、2つの音素が1つのセグメントと認識された場合に備える方法である。
このような音素を併合して筆記する問題を克服するために、1段階を拡張する過程で色々な音素が併合された可能性を同時にテストし、拡張可能な部分結果をBest First Searchアルゴリズムを使用して現在までの検索結果のうち最も類似度の高い部分から連続拡張して行く方式を使用する。このような過程を‘拡張周辺検索’と名付ける。
もし、図10Bのように2段階拡張(横方向2、縦方向2の拡張)を使用する場合には、3つのノード候補群が存在し、このうち類似度の最も高い側を選択すればよい。もし、3段階拡張を使用するならば、5種のノード候補群が存在しうる。
図10Bに示したアルゴリズムは、図11のようにツリー(Tree)形態で表現されうる。このような検索過程を類似度テーブル上で左上端、右下端に境界点に至るまで検索し続ける。図11では、1つのスポッティングされたセルから右下方向に検索して行く過程を例として挙げたが、ここで、赤色(図11の110)の四角形1つはElastic Matching1回に該当し、これをノードと定義する。1つのノードは、1つのセルまたは1つ以上のセルより構成されうる。
このような拡張周辺検索を行うに当って、類似度の計算方式の実施例は次の通りである。図11のノード(C)での類似度を式(10)とする時、(1)の形態のように質疑語の1セグメントを拡張する場合、下記の式(11)のように累積類似度を各セグメントの長さに比例して正規化された形に計算しうる。
Figure 2005228328
ここで、li,li+1は各々現在ノードで使用する質疑語セグメントの長さ、次のノードで拡張された質疑語セグメントの長さを意味し、式(12)は質疑語のi番目のセグメントと検索対象メモのji番目のセグメントとの類似度を意味し、式(13)は質疑語のi+1番目のセグメントと検索対象メモのji+1番目のセグメントとの類似度を意味する。
Figure 2005228328
同様に、(2)の形態のように質疑語の2つのセグメントを使用しつつ拡張した場合には次の式(14)のように累積類似度を計算する。ここで、li+2は次の次のノードで拡張された質疑語セグメントの長さを、式(15)は質疑語のi+1番目のセグメントとi+2番目のセグメントとを合わせたものと検索対象メモのji+1番目のセグメントとの類似度を意味する。
Figure 2005228328
同様に、(3)の形態のように質疑語の2つのセグメントを使用しつつ拡張した場合には、次の式(16)のように累積類似度を計算する。ここで、式(17)は質疑語のi+1番目のセグメントと、検索対象メモのji+1番目のセグメントとji+1+1番目のセグメントとを合わせたものとの類似度を意味する。
Figure 2005228328
このように、拡張可能な部分の結果をBest First Searchアルゴリズムを使用して、現在までの検索結果のうち類似度の最も高い部分から連続拡張して行く。例えば、図11で、(1)方向検索と(2)方向検索、(3)方向検索を行い、その結果、(1)方向検索の累積類似度が現在までの検索結果のうち最も高いと現れたならば、(1)方向結果で再び1段階拡張検索を進める。(3)方向検索のように累積類似度が所定の臨界値以上である場合には、これ以上の検索を進めず、検索パスを刈り込む(Pruning)。
以上の拡張検索過程で検索方向の端部(上端及び下端)に至るまで拡張検索され、その累積類似度が臨界値以上である結果が発見されたならば、そこで検索を中止し、メモでそのパスに該当する部分を最適にマッチングされた部分と選択する。
以上のスポッティング過程及び周辺検索過程を経たが、臨界値を超えるパスが存在しない場合には、メモ内に質疑語と類似している部分がないと判断することもあり、計算された各パスに対する累積類似度のうち最大値を有するパスを候補として提示することもある。
前記スポッティング方法を適用すれば、スポッティングに使われる質疑語の一部分と検索対象メモの全部分とに対して順次的な検索を進めることになる。しかし、実際の筆記情報から導出されうる追加的な情報(以下、メタ情報)を得られるならば、検索対象メモのあらゆる部分と類似度とを比較せず、特性が一致する部分に対してのみ選択的に比較することによって、さらに速い速度が得られる。
文字分割情報をメタ情報として使用する場合を例として挙げられる。入力されたデジタルインクを文字単位で分割することは、100%正確には分割できないが、多様な情報を活用して高い正確度で文字単位の分割結果を得られる。正確な情報ではないために、このような情報を信頼して次の段階で利用することはできないが、本発明ではスポッティング過程での無意味な比較の試みを避ける用途として使用できる。
図12は、文字分割メタ情報を活用したスポッティング方法を図式化している。図12の各列と行とは前述したように、各々質疑語とメモとの各部分の類似度を意味する。文字分割メタ情報が与えられれば、青線(図12の太実線)のように各文字間の警戒地点を表示しうる。
このように文字分割されたメタ情報が与えられた状況では、セグメント分割部51での動作過程(セグメント分割過程)と、検索順位決定部52での動作過程(検索順位決定過程)と、スポッティング部53での動作過程(スポッティング過程)とが変わる。
まず、セグメント分割過程では、メタ情報で与えられた文字の開始部分あるいは終了部分に該当するセグメントに対してのみスポッティングに使用する。例えば、図12では質疑語が2つの文字に区分されており、文字の開始セグメントと終了セグメントとは総4つ存在する。したがって、この場合には4つのセグメントに対して情報量を基準に検索順位を定める。
次いで、メタ情報として与えられた文字分割情報を用いて選択的な検索を行う。例えば、現在スポッティングに使用するセグメントが質疑語の文字開始部分に該当するセグメントである場合、検索対象メモでも文字の開始部分に該当するセグメントに対してのみ選択的に比較を行う。同様に、文字の終了部分に該当するセグメントである場合、メモでも文字の終了部分に該当するセグメントに対してのみ比較を進める。このように比較する過程は図12で矢印で示されている。
以上のメタ情報利用の実施例以外に前記実施例を応用して、文字を仮分割した後、特徴セグメントが文字内に占める位置(topology)情報を用いて文字のうち該当位置近傍に存在する部分のセグメント間にのみ比較する方法も使用できるであろう。また、英文の場合には、単語単位で仮分割し、これをメタ情報を用いる方法も使用しうる。
このような方法を適用すれば検索性能では若干の損失が発生する可能性があるが、一般的なユーザの筆記パターンに適用すれば、その損失の幅が少なく、一方、速度改善の効果は非常に大きく現れることが分かった。
以上、添付図を参照して本発明の実施例を説明したが、本発明が属する技術分野で当業者ならば本発明がその技術的思想や必須特徴を変更せずとも他の具体的な形に実施されうるということが理解できるであろう。したがって、前述した実施例は全ての面で例示的なものであって、限定的なものではないと理解せねばならない。
本発明は、ユーザがデジタルペンインターフェースを用いて手書き入力したメモからユーザの質疑語に該当する単語を検索する装置及びその方法に関するものであって、文字認識技術分野で好適に適用されうる。
デジタルインクメモの例を示す図面である。 デジタルインク質疑語の例を示す図面である。 本発明の一実施例に係るデジタルインク検索装置の構成を示すブロック図である。 ユーザにディスプレイされるメモの例を示す図面である。 質疑語検索部50の構成を示すブロック図である。 質疑語をセグメント別に分離した例を示す図面である。 スポッティングテーブルの例を示す図面である。 各セグメントの情報量によってセグメントの優先順位を決定する方式の例を示す図面である。 質疑語の特定セグメントとメモとの全体領域に対して類似度を比較する例を示す図面である。 ‘周辺検索’及び‘拡張周辺検索’過程の例を示す図面である。 ‘周辺検索’及び‘拡張周辺検索’過程の例を示す図面である。 ‘拡張周辺検索’過程の例をツリー形態に表現した図面である。 文字分割メタ情報を活用したスポッティング方法を示す図面である。
符号の説明
10 デジタイザー
20 前処理部
30 特徴抽出部
40 メモDB
50 質疑語検索部
60 ディスプレイ部
100 デジタルインク検索装置

Claims (23)

  1. 入力された質疑語またはメモに関するデジタルインクデータから各種不要な部分を除去して情報量を減少させる前処理部と、
    前記情報量が減少したデータから特徴ベクトルを抽出する特徴抽出部と、
    前記質疑語が、前記メモのうちマッチング部分があるかどうかをセグメント単位で検索する質疑語検索部と、を含むデジタルインク質疑検索装置。
  2. ユーザのストロークを入力され、それを前記デジタルインクデータと認識して前処理部に伝達するデジタイザーをさらに含む請求項1に記載のデジタルインク質疑検索装置。
  3. 前記検索結果マッチングされた部分を強調して前記マッチングされた部分を含むメモをユーザにディスプレイし、全体メモのうちマッチングされる部分が存在しなければ、その結果をメッセージにてユーザに知らせるディスプレイ部をさらに含む請求項1に記載のデジタルインク質疑検索装置。
  4. 前記入力ストロークがメモである場合には、そのメモデータを前記特徴抽出部から抽出された特徴ベクトル形に保存し、質疑語検索時に質疑語検索部に前記保存されたメモを提供するメモDBをさらに含む請求項1に記載のデジタルインク質疑検索装置。
  5. 前記質疑語検索部は、
    前記特徴ベクトルで表現される文字を時間的に入力された順序情報または空間的分離情報を用いてセグメントに分割するセグメント分割部と、
    前記分割されたセグメントに対して検索する順位を決定し、それをスポッティング部に提供する検索順位決定部と、
    スポッティングテーブルを用いて前記決定された検索順位のうち最高の順位を有する質疑語のセグメントをメモのセグメントと比較して類似度が所定の臨界値(a)を超えるセルを検索するスポッティング部と、
    前記検索されたセルから前記セルの周辺を検索して質疑語全体に対して当該メモとの一致部分の有無を検査する周辺検索部と、を含むことを特徴とする請求項1に記載のデジタルインク質疑検索装置。
  6. 前記検索順位は、各セグメントの情報量を基準に決定することを特徴とする請求項5に記載のデジタルインク質疑検索装置。
  7. 前記スポッティングテーブルは、列と行とに区分された多段階の明暗程度を有するセルより構成されるが、i番目の列とj番目の行とが合うセルは質疑語のi番目のセグメントと検索対象メモのj番目のセグメントとの類似度を比較した結果を記録することを特徴とする請求項5に記載のデジタルインク質疑検索装置。
  8. 前記類似度は、Elastic Matching方法を用いて用いることを特徴とする請求項5に記載のデジタルインク質疑検索装置。
  9. 前記セル周辺の検索は、前記セルの対角線方向に検索するが、前記スポッティングテーブルの上端及び下端に至るまで検索することを特徴とする請求項5に記載のデジタルインク質疑検索装置。
  10. 前記セル周辺の検索は、前記セルの対角線方向に検索するが、横拡張及び縦拡張を通じて次に選択されるノードの候補群を選定し、Best First Search方式によって現在までの検索結果のうち最も類似度の高い部分から連続拡張して行きつつ、スポッティングテーブルの上端及び下端に至るまで検索することを特徴とする請求項5に記載のデジタルインク質疑検索装置。
  11. 前記一致部分は、前記上端及び下端に至るまで検索した結果に対する累積類似度を決定し、前記累積類似度が所定の臨界値(b)を超える場合にメモで該当部分を意味することを特徴とする請求項10に記載のデジタルインク質疑検索装置。
  12. 前記候補群のうち拡張なしに対角線方向のセルを次のノードに選択する場合に、累積類似度は、
    式(1)で表されるが、liは現在ノードで使用する質疑語セグメントの長さを、li+1は次のノードで拡張された質疑語セグメントの長さを、式(2)は質疑語のi番目のセグメントと検索対象メモji番目のセグメントの類似度を、式(3)は質疑語のi+1番目のセグメントと検索対象メモのji+1番目のセグメントの類似度を意味することを特徴とする請求項11に記載のデジタルインク質疑検索装置。
    Figure 2005228328
  13. 前記候補群のうち縦拡張を行う場合に、累積類似度は、
    式(4)で表されるが、liは現在ノードで使用する質疑語セグメントの長さを、li+1は次のノードで拡張された質疑語セグメントの長さを、li+2は次の次のノードで拡張された質疑語セグメントの長さを、式(5)は質疑語のi番目のセグメントと検索対象メモのji番目のセグメントとの類似度を、式(6)は質疑語のi+1番目のセグメントとi+2番目のセグメントとの和と検索対象メモのji+1番目のセグメントとの類似度を意味することを特徴とする請求項11に記載のデジタルインク質疑検索装置。
    Figure 2005228328
  14. 前記候補群のうち縦拡張を行う場合に、累積類似度は、
    式(7)で表されるが、liは現在ノードで使用する質疑語セグメントの長さを、li+1は次のノードで拡張された質疑語セグメントの長さを、式(8)は質疑語のi番目のセグメントと検索対象メモのji番目のセグメントとの類似度を、式(9)は質疑語のi+1番目のセグメントと、検索対象メモのji+1番目のセグメントとji+1+1番目のセグメントとの和との類似度を意味することを特徴とする請求項11に記載のデジタルインク質疑検索装置。
    Figure 2005228328
  15. 前記検索順位の決定は、前記質疑語及び前記メモを文字単位で分割し、前記質疑語のセグメントのうち文字の開始部分または終了部分に該当するセグメントに対してのみ検索順位を決定することを特徴とする請求項5に記載のデジタルインク質疑検索装置。
  16. 前記質疑語のセグメントとメモのセグメントとの比較は、前記検索順位のうち最優先順位に決定されたセグメントを、前記決定されたセグメントが開始部分であるか、終了部分であるかによって、検索対象メモで文字の開始部分または終了部分に該当するセグメントだけと比較することを特徴とする請求項15に記載のデジタルインク質疑検索装置。
  17. 入力されたメモに関するデジタルインクデータから各種の不要な部分を除去して情報量を減少させる段階と、
    前記情報量が減少したメモデータから特徴ベクトルを抽出してメモDBに保存する段階と、
    入力された質疑語に関するデジタルインクデータから各種の不要な部分を除去して情報量を減少させる段階と、
    前記情報量が減少した質疑語データから特徴ベクトルを抽出する段階と、
    前記質疑語が、前記メモのうちからマッチングされる部分があるかどうかをセグメント単位で検索する段階と、を含むデジタルインク質疑検索方法。
  18. 前記セグメント単位で検索する段階は、
    前記特徴ベクトルで表現される文字を時間的に入力された順序情報または空間的分離情報を用いてセグメントに分割する段階と、
    前記分割されたセグメントに対して検索する順位を決定する段階と、
    スポッティングテーブルを用いて前記決定された検索順位のうち最高の順位を有する質疑語のセグメントをメモのセグメントと比較して類似度が所定の臨界値(a)を超えるセルを検索する段階と、
    前記検索されたセルから前記セルの周辺を検索して質疑語全体に対して該当メモとの一致部分の有無を検査する段階と、を含むことを特徴とするデジタルインク質疑検索方法。
  19. 前記検索順位は、各セグメントの情報量を基準に決定することを特徴とする請求項18に記載のデジタルインク質疑検索方法。
  20. 前記スポッティングテーブルは、列と行とに区分された多段階の明暗程度を有するセルより構成されるが、i番目の列とj番目の行とが合うセルは、質疑語のi番目のセグメントと検索対象メモのj番目のセグメントとの類似度を比較した結果を記録することを特徴とする請求項18に記載のデジタルインク質疑検索方法。
  21. 前記セル周辺の検索は、前記セルの対角線方向に検索するが、前記スポッティングテーブルの上端及び下端に至るまで検索することを特徴とする請求項18に記載のデジタルインク質疑検索方法。
  22. 前記セル周辺の検索は、前記セルの対角線方向に検索するが、横拡張及び縦拡張を通じて次に選択されるノードの候補群を選定し、Best First Search方式によって現在までの検索結果のうち最も類似度の高い部分から連続拡張して行きつつ、スポッティングテーブルの上端及び下端に至るまで検索することを特徴とする請求項18に記載のデジタルインク質疑検索方法。
  23. 前記一致部分は、前記上端及び下端に至るまで検索した結果に対する累積類似度を決定し、前記累積類似度が所定の臨界値(b)を超える場合に、メモで該当部分を意味することを特徴とする請求項22に記載のデジタルインク質疑検索方法。
JP2005033675A 2004-02-14 2005-02-09 デジタルインク質疑検索装置及びその方法 Expired - Fee Related JP4308785B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020040009862A KR100587540B1 (ko) 2004-02-14 2004-02-14 디지털 잉크 질의 검색 장치 및 방법

Publications (2)

Publication Number Publication Date
JP2005228328A true JP2005228328A (ja) 2005-08-25
JP4308785B2 JP4308785B2 (ja) 2009-08-05

Family

ID=34698989

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005033675A Expired - Fee Related JP4308785B2 (ja) 2004-02-14 2005-02-09 デジタルインク質疑検索装置及びその方法

Country Status (6)

Country Link
US (1) US7778464B2 (ja)
EP (1) EP1564675B1 (ja)
JP (1) JP4308785B2 (ja)
KR (1) KR100587540B1 (ja)
CN (1) CN100412861C (ja)
DE (1) DE602005008121D1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010113610A (ja) * 2008-11-07 2010-05-20 Nec Corp 会議支援システム、関連情報登録方法、関連情報検索方法、サーバおよびプログラム

Families Citing this family (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7546524B1 (en) * 2005-03-30 2009-06-09 Amazon Technologies, Inc. Electronic input device, system, and method using human-comprehensible content to automatically correlate an annotation of a paper document with a digital version of the document
US7970763B2 (en) * 2006-02-21 2011-06-28 Microsoft Corporation Searching and indexing of photos based on ink annotations
US7646940B2 (en) * 2006-04-04 2010-01-12 Microsoft Corporation Robust indexing and retrieval of electronic ink
US8098939B2 (en) * 2006-12-04 2012-01-17 Trend Micro Incorporated Adversarial approach for identifying inappropriate text content in images
US7693842B2 (en) * 2007-04-09 2010-04-06 Microsoft Corporation In situ search for active note taking
US8064696B2 (en) * 2007-04-10 2011-11-22 Microsoft Corporation Geometric parsing of mathematical expressions
US20090058820A1 (en) * 2007-09-04 2009-03-05 Microsoft Corporation Flick-based in situ search from ink, text, or an empty selection region
US8346091B2 (en) 2009-04-29 2013-01-01 Andrew Llc Distributed antenna system for wireless network systems
CN102033928B (zh) * 2010-12-15 2013-01-23 北京壹人壹本信息科技有限公司 手写原笔迹记录及查询系统、电子装置
CN102157078B (zh) * 2011-03-04 2013-03-20 博视联(苏州)信息科技有限公司 双屏电子书包的笔迹保存系统及其保存方法
KR101830787B1 (ko) * 2011-07-12 2018-02-21 삼성전자 주식회사 수기로 작성된 메모 데이터 검색 방법 및 장치
US8640046B1 (en) * 2012-10-23 2014-01-28 Google Inc. Jump scrolling
US8943092B2 (en) * 2013-03-04 2015-01-27 Microsoft Corporation Digital ink based contextual search
KR101434963B1 (ko) * 2013-05-30 2014-08-28 주식회사 디오텍 디지털 잉크 데이터 매칭방법 및 매칭장치
KR20150007577A (ko) * 2013-07-11 2015-01-21 삼성전자주식회사 데이터 병합을 제어하는 휴대 단말 및 방법
US9418281B2 (en) * 2013-12-30 2016-08-16 Google Inc. Segmentation of overwritten online handwriting input
KR101488670B1 (ko) * 2014-01-29 2015-02-04 주식회사 디오텍 텍스트와 디지털 잉크를 포함하는 대용량 문서의 교차 검색 시스템 및 방법
US9569692B2 (en) * 2014-10-31 2017-02-14 The Nielsen Company (Us), Llc Context-based image recognition for consumer market research
US20160154555A1 (en) * 2014-12-02 2016-06-02 Lenovo (Singapore) Pte. Ltd. Initiating application and performing function based on input
US10387034B2 (en) 2015-09-03 2019-08-20 Microsoft Technology Licensing, Llc Modifying captured stroke information into an actionable form
US10210383B2 (en) 2015-09-03 2019-02-19 Microsoft Technology Licensing, Llc Interacting with an assistant component based on captured stroke information
US10417229B2 (en) * 2017-06-27 2019-09-17 Sap Se Dynamic diagonal search in databases

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5380428A (en) * 1992-04-22 1995-01-10 Product Research & Development Pump for reverse osmosis system
CN1096110A (zh) 1993-06-04 1994-12-07 珠海巨人高科技集团公司 微机汉字手写输入设备
US5687254A (en) * 1994-06-06 1997-11-11 Xerox Corporation Searching and Matching unrecognized handwriting
DE69428527T2 (de) * 1994-07-04 2002-05-08 Hewlett Packard Co Kritzlervergleich
US5757959A (en) 1995-04-05 1998-05-26 Panasonic Technologies, Inc. System and method for handwriting matching using edit distance computation in a systolic array processor
US6041137A (en) * 1995-08-25 2000-03-21 Microsoft Corporation Radical definition and dictionary creation for a handwriting recognition system
US5832474A (en) * 1996-02-26 1998-11-03 Matsushita Electric Industrial Co., Ltd. Document search and retrieval system with partial match searching of user-drawn annotations
US6275611B1 (en) * 1996-10-17 2001-08-14 Motorola, Inc. Handwriting recognition device, method and alphabet, with strokes grouped into stroke sub-structures
JPH10214267A (ja) 1997-01-29 1998-08-11 Sharp Corp 手書き文字記号処理装置および手書き文字記号処理装置の制御プログラムを記録した媒体
US6560360B1 (en) * 1999-01-28 2003-05-06 Nestor, Inc. Feed forward feed back multiple neural network with context driven recognition
US6565611B1 (en) 1999-02-26 2003-05-20 Xerox Corporation Automatic index creation for handwritten digital ink notes
US6549675B2 (en) 2000-12-20 2003-04-15 Motorola, Inc. Compression of digital ink
KR20030003787A (ko) 2001-07-02 2003-01-14 조미경 전자잉크데이터의 부분매칭을 이용한 개인정보검색시스템
KR20030043806A (ko) 2003-02-24 2003-06-02 김진일 태블릿 pc를 이용한 필기 문서관리시스템 및필기글자,사전 동기화 기술방법

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010113610A (ja) * 2008-11-07 2010-05-20 Nec Corp 会議支援システム、関連情報登録方法、関連情報検索方法、サーバおよびプログラム

Also Published As

Publication number Publication date
CN100412861C (zh) 2008-08-20
KR100587540B1 (ko) 2006-06-08
EP1564675B1 (en) 2008-07-16
US7778464B2 (en) 2010-08-17
US20050182760A1 (en) 2005-08-18
CN1655147A (zh) 2005-08-17
DE602005008121D1 (de) 2008-08-28
KR20050081555A (ko) 2005-08-19
EP1564675A1 (en) 2005-08-17
JP4308785B2 (ja) 2009-08-05

Similar Documents

Publication Publication Date Title
JP4308785B2 (ja) デジタルインク質疑検索装置及びその方法
JP2700130B2 (ja) 手書き文字の認識システム及び認識方法
Ma et al. Joint layout analysis, character detection and recognition for historical document digitization
EP1971957B1 (en) Methods and apparatuses for extending dynamic handwriting recognition to recognize static handwritten and machine generated text
CN100416593C (zh) 用于手写识别的装置和方法
KR102293538B1 (ko) 음악 심볼들을 인식하기 위한 방법 및 장치
Stern et al. Most discriminating segment–Longest common subsequence (MDSLCS) algorithm for dynamic hand gesture classification
JPH11120293A (ja) 文字認識/修正方式
CN104541288A (zh) 手写文档处理设备和方法
Zhu et al. DocBed: A multi-stage OCR solution for documents with complex layouts
Rehman et al. A scale and rotation invariant urdu nastalique ligature recognition using cascade forward backpropagation neural network
Singh et al. Recognition of online unconstrained handwritten Gurmukhi characters based on Finite State Automata
NAKJAI et al. Automatic Thai finger spelling transcription
JP2023043910A (ja) 文字列抽出装置、文字列抽出方法、および文字列抽出プログラム
James et al. Handwritten Malayalam Character Recognition using Regional Zoning and Structural Features
Nguyen et al. Semi-incremental recognition of on-line handwritten Japanese text
JP3925011B2 (ja) パターン認識装置及び認識方法
KR100204618B1 (ko) 문자 또는 도형의 인식 방법 및 시스템
Sharma et al. Gujarati Script Recognition
JP3209197B2 (ja) 文字認識装置及び文字認識プログラムを記録した記録媒体
Kishore et al. similarity assessment of 30 world sign languages and exploring scope for a sign–to–sign translator
Indhu et al. Multilingual online handwriting recognition system: an android app
Singh et al. Post-processing algorithms for the formation of online handwritten Gurmukhi character/akshara
JPH05189621A (ja) オンライン手書き文字認識装置
Nurmamatovna CREATION OF ARAB GRAPHIC WRITINGS RECOGNITION PROGRAM

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080325

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080625

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20081209

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090309

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20090407

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20090501

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120515

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130515

Year of fee payment: 4

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees