JP2014235551A - 検索装置、方法及びプログラム - Google Patents

検索装置、方法及びプログラム Download PDF

Info

Publication number
JP2014235551A
JP2014235551A JP2013116419A JP2013116419A JP2014235551A JP 2014235551 A JP2014235551 A JP 2014235551A JP 2013116419 A JP2013116419 A JP 2013116419A JP 2013116419 A JP2013116419 A JP 2013116419A JP 2014235551 A JP2014235551 A JP 2014235551A
Authority
JP
Japan
Prior art keywords
point sequences
stroke
unit
point
search
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2013116419A
Other languages
English (en)
Other versions
JP6125333B2 (ja
Inventor
智行 柴田
Satoyuki Shibata
智行 柴田
洋次郎 登内
Yojiro Touchi
洋次郎 登内
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2013116419A priority Critical patent/JP6125333B2/ja
Priority to US14/198,369 priority patent/US9195887B2/en
Priority to CN201410082975.3A priority patent/CN104216940B/zh
Publication of JP2014235551A publication Critical patent/JP2014235551A/ja
Application granted granted Critical
Publication of JP6125333B2 publication Critical patent/JP6125333B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/32Digital ink
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • G06F16/90335Query processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • G06F3/0487Interaction techniques based on graphical user interfaces [GUI] using specific features provided by the input device, e.g. functions controlled by the rotation of a mouse with dual sensing arrangements, or of the nature of the input device, e.g. tap gestures based on pressure sensed by a digitiser
    • G06F3/0488Interaction techniques based on graphical user interfaces [GUI] using specific features provided by the input device, e.g. functions controlled by the rotation of a mouse with dual sensing arrangements, or of the nature of the input device, e.g. tap gestures based on pressure sensed by a digitiser using a touch-screen or digitiser, e.g. input of commands through traced gestures
    • G06F3/04883Interaction techniques based on graphical user interfaces [GUI] using specific features provided by the input device, e.g. functions controlled by the rotation of a mouse with dual sensing arrangements, or of the nature of the input device, e.g. tap gestures based on pressure sensed by a digitiser using a touch-screen or digitiser, e.g. input of commands through traced gestures for inputting data by handwriting, e.g. gesture or text
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/24Character recognition characterised by the processing or recognition method
    • G06V30/242Division of the character sequences into groups prior to recognition; Selection of dictionaries
    • G06V30/244Division of the character sequences into groups prior to recognition; Selection of dictionaries using graphical properties, e.g. alphabet type or font

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Character Discrimination (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】検索速度の低下を抑えつつ検索精度を高めることができる検索装置、方法及びプログラムを提供する。【解決手段】実施形態の検索装置は、取得部と、分割部と、抽出部と、算出部と、検索部と、を備える。取得部は、複数の第1点列を取得する。分割部は、前記複数の第1点列それぞれを複数の第2点列に分割する。抽出部は、前記複数の第2点列それぞれの特徴量を抽出する。算出部は、前記複数の第1点列それぞれに属する複数の第2点列間の最適経路に基づいて、当該複数の第1点列間の距離を算出する。検索部は、前記距離を用いて、前記複数の第1点列に対応するデータを検索する。【選択図】図1

Description

本発明の実施形態は、検索装置、方法及びプログラムに関する。
点列で構成されるクエリに一致又は類似するデータをデータベースから検索する技術が知られている。
Cheng Cheng, Bilan Zhu, Masaki Nakagawa: "A Discriminative Model for On-line Handwritten Japanese Text Retrieval", International Conference on Document Analysis and Recognition, 2011
Pasitthideth LUANGVILAY, Bilan ZHU, Masaki NAKAGAWA: "An On-line Handwritten Text Search Method based on Directional Feature Matching", International Conference on Document Analysis and Recognition, 2011
しかしながら、上述したような従来技術では、クエリを構成する点列の数が少ないと、検索精度が低下するおそれがある。また、点列の数が少ないクエリであっても点列の数を擬似的に増やすことで検索精度を高めることができるが、この場合、検索速度が低下するおそれがある。
本発明は、上記事情に鑑みてなされたものであり、検索速度の低下を抑えつつ検索精度を高めることができる検索装置、方法及びプログラムを提供することを目的とする。
実施形態の検索装置は、取得部と、分割部と、抽出部と、算出部と、検索部と、を備える。取得部は、複数の第1点列を取得する。分割部は、前記複数の第1点列それぞれを複数の第2点列に分割する。抽出部は、前記複数の第2点列それぞれの特徴量を抽出する。算出部は、前記複数の第1点列それぞれに属する複数の第2点列間の最適経路に基づいて、当該複数の第1点列間の距離を算出する。検索部は、前記距離を用いて、前記複数の第1点列に対応するデータを検索する。
第1実施形態の検索装置の例を示す構成図。 第1実施形態のストロークの例を示す図。 第1実施形態のストロークの例を示す図。 第1実施形態のインクデータのデータ構造の例を示す図。 第1実施形態のサブストロークを表現するデータのデータ構造の例を示す図。 第1実施形態のDPマッチング例を示す図。 第1実施形態の検索例を示す図。 第1実施形態の表示例を示す図。 第1実施形態の処理例を示すフローチャート図。 第1実施形態の検索装置のハードウェア構成例を示す図。 第1実施形態の検索装置の実現例を示す図。
以下、添付図面を参照しながら、実施形態を詳細に説明する。
(第1実施形態)
第1実施形態では、ユーザが手書きした手書き文字列をクエリとして、予め筆記された(例えば大量の)手書き文書から検索を行う場合について説明する。なお第1実施形態では、主として、文字列を例に説明するが、クエリはユーザが描画した線やマークなど文字コードが割り当てられない自由筆記であってもよい。また、ユーザが手書き文字列を指定する方法には、どのような方法を使用してもよい。例えば、ユーザが実際に文字列を手書きすることによって、クエリを指定するようにしてもよいし、既存の手書き文書の中からユーザがクエリとして用いる部分を選択するようにしてもよいし、クエリ用のテンプレートの中からユーザがクエリとして用いるものを選択するようしてもよいし、これらの組み合わせであってもよい。
図1は、第1実施形態の検索装置10の一例を示す構成図である。図1に示すように、検索装置10は、入力部11と、取得部13と、インクデータ記憶部15と、分割部17と、抽出部19と、特徴量記憶部21と、算出部23と、検索部25と、表示制御部27と、表示部29とを、備える。
入力部11は、例えば、タッチパネル、タッチパッド、電子ペン、及びマウスなどの手書き入力可能な入力装置により実現できる。取得部13、分割部17、抽出部19、算出部23、検索部25、及び表示制御部27は、例えば、CPU(Central Processing Unit)などの処理装置にプログラムを実行させること、即ち、ソフトウェアにより実現してもよいし、IC(Integrated Circuit)などのハードウェアにより実現してもよいし、ソフトウェア及びハードウェアを併用して実現してもよい。インクデータ記憶部15及び特徴量記憶部21は、例えば、HDD(Hard Disk Drive)、SSD(Solid State Drive)、メモリカード、光ディスク、及びRAM(Random Access Memory)などの磁気的、光学的、又は電気的に記憶可能な記憶装置により実現できる。表示部29は、例えば、タッチパネルディスプレイや液晶ディスプレイなどの表示装置により実現できる。
入力部11は、複数の第1点列を検索装置10に入力する。第1実施形態では、入力部11は、ユーザが文字などを意図して手書き(描画)又は指定した複数のストローク(複数の第1点列の一例)を検索装置10に入力するものとするが、これに限定されるものではない。また第1実施形態では、入力部11はタッチパネルであり、ユーザがスタイラスペン又は指を用いてタッチパネル上で手書きすることにより、複数のストロークを入力することを想定しているが、これに限定されるものではない。例えば、入力部11をタッチパッド、電子ペン、又はマウスなどで実現してもよい。
ストロークは、ユーザの手書きの1画、即ち、スタイラスペン又は指がタッチパネルの入力面に接してから離れるまで(ペンダウンからペンアップまで)の軌跡を示す。ストロークを表現するデータは、タッチパネルの入力面に対するスタイラスペン又は指の軌跡上のサンプリング点(時系列の座標値)、当該軌跡の外接矩形、及び当該軌跡の筆圧などが挙げられる。
具体的には、タッチパネルの入力面に対してスタイラスペン又は指がペンダウンされると、タッチパネルが、当該入力面に対するスタイラスペン又は指の軌跡上の点、当該軌跡の筆圧、当該軌跡の入力が開始されてからの経過時間を定期的にサンプリングし、スタイラスペン又は指がペンアップされると、タッチパネルが、当該軌跡の外接矩形を抽出することで、ストロークを表現するデータを生成し、検索装置10に入力する。
図2及び図3は、第1実施形態のストロークの一例を示す図であり、図2に示す例では、ストロークのサンプリング点を示し、図3に示す例では、図2に示すサンプリング点を時系列で線形補完したストロークを示している。図2及び図3に示す例では、サンプリングは定期的(一定周期)に行われているが、ユーザの筆記速度の影響でサンプリング点の座標間隔が異なっている。なお、ストロークのサンプリング点の数は、ストローク毎に異なる。
取得部13は、複数の第1点列を取得する。第1実施形態では、取得部13は、入力部11により入力されたストロークを順次取得することで、複数のストロークを取得する。そして取得部13は、ストロークの取得が完了すると、即ち、入力部11からのストロークの入力が完了すると、取得済みのストロークを表現するデータの集合であるインクデータをインクデータ記憶部15に記憶する。なお、入力部11からのストロークの入力が完了とは、ユーザが手書き文字列を書き終えた場合や、当該手書き文字列の保存操作が行われた場合などが挙げられる。つまり、インクデータは、ページ(文書)単位でのストローク群を表現するデータとなる。
なお、取得部13は、複数のストローク群をインクデータ記憶部15に記憶する場合、インクデータにページ(文書)IDを対応付けることで、各ストローク群を識別できるようにすることができる。また、取得部13は、ストロークを表現するデータにストロークIDを対応付けることで、各ストロークを識別できるようにすることができる。
図4は、第1実施形態のインクデータのデータ構造の一例を示す図であり、取得部13によりインクデータ記憶部15に記憶されるインクデータのデータ構造を示す。第1実施形態では、インクデータは、インクデータ構造、ストローク構造、及び点構造の3階層のデータ構造で表されているが、これに限定されるものではない。
インクデータ構造は、ストローク群を構成するストロークのストローク総数、及びストローク群を構成する各ストロークのストローク構造を含む構造体である。ストローク構造は、ストロークを構成するサンプリング点の点総数、当該ストロークの入力が開始された開始時間(ペンダウンが開始された時間)、当該ストロークの外接矩形、当該ストロークを構成する各サンプリング点の点構造を含む構造体である。第1実施形態では、ストロークの外接矩形は、当該ストロークを内包する最小面積の矩形とするが、これに限定されるものではない。点構造は、サンプリング点のx座標、y座標、筆圧、及び開始時間との時間差を含む構造体である。なお、x座標及びy座標の座標系は、タッチパネルの入力面の左上の隅(角)を原点とし、タッチパネルの右側ほどx座標の値が大きくなり、タッチパネルの下側ほどy座標の値が大きくなるような座標系とすることができる。
また、タッチパネルが筆圧をサンプリングできない場合、又は以降の処理で筆圧を使用しない場合には、点構造の筆圧を省略してもよいし、点構造の筆圧に無効を示す値を設定してもよい。また、タッチパネルが開始時間や開始時間との時間差などの時刻をサンプリングできない場合、又は以降の処理で時刻を使用しない場合には、点構造の時間差に点構造の順番を示す値を設定してもよいし、点構造の時間差を省略してもよいし、点構造の時間差に無効を示す値を設定してもよい。
また、ストローク構造の各項目には、実データを記載してもよいし、インクデータ構造のデータとストローク構造のデータとを別々に管理するものとして、インクデータ構造におけるストローク構造の領域に、対応するストローク構造へのリンク情報を記載してもよい。同様に、点構造の各項目には、実データを記載してもよいし、ストローク構造のデータと点構造のデータとを別々に管理するものとして、ストローク構造における点構造の領域に、対応する点構造へのリンク情報を記載してもよい。
分割部17は、取得部13により取得された複数の第1点列それぞれを複数の第2点列に分割する。第1実施形態では、分割部17は、インクデータ記憶部15に記憶されたインクデータが示すストローク群(複数のストローク)を構成するストロークそれぞれを複数のサブストロークに分割する。そして分割部17は、各サブストロークを表現するデータ、及び当該データがいずれのストロークを表現するデータに属するかを示すリンク情報を、インクデータ記憶部15に記憶されているインクデータに追加する。
図5は、第1実施形態のサブストロークを表現するデータのデータ構造の一例を示す図であり、分割部17によりインクデータ記憶部15に追加されるデータのデータ構造を示す。第1実施形態では、サブストロークを表現するデータは、サブストローク構造及び点構造の2階層のデータ構造で表されているが、これに限定されるものではない。
サブストローク構造は、サブストロークを構成するサンプリング点の点総数、当該サブストロークの入力が開始された開始時間、当該サブストロークが属するストロークのストローク構造へのポインタ、当該サブストロークの外接矩形、当該サブストロークを構成する各サンプリング点の点構造を含む構造体である。
なお分割部17は、例えば、複数のサブストロークそれぞれの曲率が閾値以下となるように、ストロークを当該複数のサブストロークに分割する。ここで、ストロークの曲率は、各サンプリング点上で計算できるが、ストロークの大きさやサンプリングレートによりサンプリング点数が異なるため、このままでは曲率を計算できる箇所がストローク毎に異なってしまう。
このため、分割部17は、ストロークを固定数のサンプリング点で近似し、サンプリング点間の距離が一定になるようにリサンプリングする。分割部17は、例えば、サンプリング点間の距離が一定になるように線形補完することで、リサンプリング点の座標値を算出する。この際、分割部17は、リサンプリング点数を減少させるほど、ストロークを直線で近似することになる。
例えば、分割対象のストロークSにおけるリサンプリング点Sbaseからリサンプリング点Sまでの曲率CS(base,i)は、数式(1)で表される。
Figure 2014235551
ここで、dist(S,Sj+1)は、サンプル点Sからサンプル点Sj+1までの距離を示す。また、曲率CS(base,i)の値が1に近いほどストロークSは直線となり、曲率CS(base,i)の値が0に近いほどストロークSは曲線となる。
分割部17は、リサンプリングした各ストロークに対して、開始点から順に曲率を算出し、閾値以下となったサンプリング点の直前までをサブストロークに分割し、以降、同様の処理を終了点まで行う。
なお、ストロークの分割手法はこれに限定されず、分割部17は、例えば、複数のサブストロークそれぞれの長さが閾値以下となるように、ストロークを当該複数のサブストロークに分割してもよいし、複数のサブストロークの数が予め定められた数となるように、ストロークを当該複数のサブストロークに分割してもよい。
また第1実施形態では、取得部13によるストローク群の取得完了後に、分割部17が各ストロークを分割することを想定して説明したが、取得部13によるストロークの取得と分割部17によるストロークの分割とを並列して処理するようにしてもよい。
抽出部19は、分割部17により分割された複数の第2点列それぞれの特徴量を抽出する。第1実施形態では、抽出部19は、複数のサブストロークそれぞれに固有の特徴量を当該サブストロークから抽出する。
ここで、分割部17はストロークをリサンプリングしているため、全てのストロークが同数の点構造を有している。しかしながら、サブストロークの点構造の数は、ストロークの分割手法に依存するため、全てのサブストロークが同数の点構造を有しているとは限らない。
このため、抽出部19は、サブストロークを固定数のサンプリング点で近似し、リサンプリングする。抽出部19は、例えば、サブストローク長を固定数N(例えば、N=128)のサンプリング点で一定間隔に再サンプリングし、元のサブストロークのサンプリング点の近傍2点から線形補間することで、リサンプリング点の座標値を算出する。
そして抽出部19は、以下のような手法で、サブストロークに固有の特徴量を抽出(算出)する。但し、特徴量の抽出手法は、これに限定されるものではない。
まず、抽出部19は、リサンプリング後のサブストロークに対し、当該サブストロークの外接矩形の長辺を1辺の長さとする正方形のサブストローク領域を設定する。この際、抽出部19は、サブストロークの外接矩形の中心がサブストローク領域の中央に位置するように当該サブストローク領域を設定する。ここで、サブストローク領域の中央とは、例えば、サブストローク領域内の複数の点の座標を平均した位置である。
次に、抽出部19は、数式(2)を用いて、リサンプリング後のサブストロークの2つのサンプル点間のベクトルの角度(方向)を量子化し、投票するヒストグラムのビンを算出する。なお、サブストロークの筆記方向にも意味があるため、角度の値域は、−πからπとする。
Figure 2014235551
ここで、devx及びdevyは、サブストロークの微分値に相当する2つのサンプル点間のベクトルの成分を示し、directionは、方向の量子化数を示す。
また、サブストローク領域全体からではなく、サブストローク領域をブロック分割した各ブロック領域から方向ヒストグラムを算出し、結合することで、特徴量の表現能力が向上する。このため第1実施形態では、抽出部19は、サブストローク領域をブロック分割するが、サブストロークが、固定のアスペクト比ではなく,x軸又はy軸に平行の直線であることもあるため、数式(3)及び数式(4)に示すように、アスペクト比を保存するようにブロック分割する。
Figure 2014235551
Figure 2014235551
ここで、x及びyは、i番目のリサンプリング点の座標値を示し、xmin及びyminは、サブストローク中で最も小さい座標値を示し、length及びlengthは、座標中の値域のサイズを示し、splitは、分割数を示す。
つまり、抽出部19は、各サンプル点がどのブロック領域に属するかを算出し、各ブロック領域において、数式(2)を用いて投票するヒストグラムのビンを算出する。
例えば、ブロック領域のx軸方向の量子化値をx、y軸方向の量子化値をy、方向成分の量子化値をd、投票先のビンをbin(x,y,d)とすると、抽出部19は、bin(x,y,d)=9、bin(x,y,d’)=6、bin(x’,y,d)=4、bin(x’,y,d’)=3、bin(x,y’,d)=4、bin(x,y’,d’)=3、bin(x’,y’,d)=3、bin(x’,y’,d’)=2のような投票を行う。
ここで、x’、y’、及びd’は、最も近い量子化値を示す。
なお、サブストロークから特徴抽出する際に方向を量子化するが、少しの表記ブレで量子化先が変わることがあるため、対象のビンと隣接関係にあるビンへ重付きで投票することで、表記ゆれにロバストな特徴抽出を行うことができる。例えば、抽出部19は、8方向に量子化したい場合、予め16方向に量子化して、数式(5)に示すように、8方向にガウシアンフィルタで平滑化する。
Figure 2014235551
ここで、dは算出するi方向の頻度を示し、d’は、2倍の解像度で量子化した頻度を示す。但し、i=0の場合、方向は周期性があるため、数式(6)に示すようなガウシアンフィルタで平滑化する。この場合、予め量子化する数は、2directionでよい。
Figure 2014235551
また、方向だけでなく、ブロック領域間も同様に平滑化することで、表記ゆれにロバストな特徴抽出を行うことができる。この場合、方向とは異なり周期性がないため、抽出部19は、サブストローク領域を(2split+1)×(2split+1)に分割した後、split×splitの各領域を、数式(7)に示すようなガウシアンフィルタで平滑化する。
Figure 2014235551
ここで、coord(x,y)は、抽出対象領域のヒストグラムを示し、coord’(x,y)は、予め算出した(2split+1)×(2split+1)に領域分割したヒストグラムを示し、|W|は、ガウシアンフィルタを示す。
以上より、抽出部19は、最終的に、split×split×deliction次元の特徴量を抽出する。そして抽出部19は、抽出した複数のサブストロークそれぞれの特徴量、及びサブストロークの特徴量と当該サブストロークが属するストロークとを関連付ける関連付け情報を特徴量記憶部21に記憶する。
例えば、取得部13がストロークにストロークIDを付与している場合には、当該ストロークIDを関連付け情報に用いることができる。また例えば、サブストロークが属するストロークのストローク構造へのリンク情報を関連付け情報に用いることもできる。なお、インクデータ記憶部15及び特徴量記憶部21を1つのデータベースとし、サブストローク構造内に特徴量を記述するようにしてもよい。
また第1実施形態では、分割部17によるストローク群の分割完了後に、抽出部19が各サブストロークの特徴量を抽出することを想定して説明したが、取得部13によるストロークの取得、分割部17によるストロークの分割、及び抽出部19によるサブストロークの特徴量抽出を並列して処理するようにしてもよい。
算出部23は、複数の第1点列それぞれに属する複数の第2点列間の最適経路に基づいて、当該複数の第1点列間の距離を算出する。第1実施形態では、算出部23は、ストローク群(複数のストローク)それぞれに属する複数のサブストローク間の最適経路に基づいて、当該ストローク群を構成するストローク間の距離を算出する。
具体的には、算出部23は、ストローク間の距離を、当該ストロークに属する複数のサブストロークそれぞれの特徴量に基づく距離を用いてDP(Dynamic Programming)マッチング(広義には、弾性マッチング)して、最適な組み合わせ(最適経路)を求め、当該最適な組み合わせの平均距離とすることで、求める。
つまり、算出部23は、抽出部19により抽出されたサブストロークの特徴量(特徴ベクトル)を用いて、ストローク間の距離を算出する。第1実施形態では、ストローク間の距離を、DPマッチングを用いたサブストローク単位での対応付けを行うことで算出する。サブストローク間の距離は、それぞれのサブストロークの特徴量間の距離で規定されるので、特徴量に応じた最適なMetricを用いればよい。例えば、サブストローク間の距離を、L2ノルムやL1ノルムとしてもよいし、正規化相互相関などで算出したベクトル間尤度を1から引いた値(距離基準に統一するため)としてもよい。
ここで、全てのサブストロークに対してDPマッチングを行うと、計算量が増大してしまう。例えば、検索対象のストローク群(画数N)及びクエリとなるストローク群(画数M)のストロークの平均分割率をRとすると、それぞれでサブストローク数がR倍になるので、探索範囲はN×MからNR×MRに増加する。なお、クエリとなるストローク群は、ユーザが手書き又は指定したストローク群であり、取得部13により取得されたストローク群が該当する。
このため第1実施形態では、算出部23は、ストロークの分割に伴う索範囲の増加を抑える為、2段階でDPマッチングを行う。具体的には、算出部23は、まず、ストローク間で1段目のDPマッチングを行い、次に、1段目のDPマッチングで対応付けられたそれぞれのストロークに属するサブストローク列間で2段目のDPマッチングを行う。
この結果、1段目のDPマッチングでは、ストロークのストローク数で探索できるため、探索範囲をN×Mに抑えることができる(図6参照)。
例えば、I画のストロークxを分割してできるサブストローク列をx’、J画のストロークyを分割してできるサブストローク列をy’とし、サブストローク列x’の画数をI’画、サブストローク列y’の画数をJ’画とする。この場合、ストロークxとストロークyとの間の距離d(x,y)は、サブストローク列x’とサブストローク列y’との間の距離d(x’,y’)で計算される。なお、サブストローク列間の距離d(x’,y’)は、サブストローク単位のDPマッチング(2段目のDPマッチング)の経路の総コストg’(I’,J’)で計算する。つまり、d(x,y)=d(x’,y’)=g’(I’,J’)となる。
なお、g’(I’,J’)は、数式(8)〜数式(11)の漸化式を用いて計算できる(図6参照)。
Figure 2014235551
g(0,0)=0 …(9)
g(i’,0)=∞(i’=1,…,I’) …(10)
g(0,j’)=∞(j’=1,…,J’) …(11)
ここで、g’(i’,j’)は、(i’,j’)までの最適経路の累積コスト、d(x’i’−k,i’,y’j’−l,j’)は、x’の第(i’−k)要素から第i’要素までのサブストローク列x’i’−k,…,x’と、y’の第(j’−k)要素から第j’要素までのサブストローク列y’j’−l,…,y’とを対応付けた時のコスト(局所距離)である。
検索部25は、算出部23により算出された距離を用いて、複数の第1点列に対応するデータを検索する。第1実施形態では、検索部25は、算出部23により算出された距離を用いて、取得部13により取得されたストローク群に対応する文字列データを検索する。つまり、検索部25は、取得部13により取得されたストローク群をクエリとし、算出部23により算出されたストローク群を構成するストローク間の距離を用いて、文字列データを検索する。詳細には、検索部25は、サブストローク間でDPマッチングし最適な各サブストローク間の対応を求めた後、それぞれの対応するサブストローク間の特徴量の距離の平均をオリジナルのストローク間の距離とし、DPマッチングをする。つまり、ストローク内とストローク間の2段階でDPマッチングを行う。
なお、検索部25の検索先、即ち、文字列データを記憶するデータベースは、検索装置10内に配置されていてもよいし、外部(例えば、イントラネット、インターネット、又は検索装置10に外部接続された記憶媒体)に配置されていてもよい。また、検索対象の文字列データには、前述した特徴量が対応付けられていることが好ましい。
例えば、検索部25は、算出部23により算出された2つのストローク列の距離の総和が最小となる画対応付けを行う。具体的には、検索部25は、数式(12)〜数式(14)の漸化式を用いたDPマッチングで経路探索処理を行う(図7参照)。
Figure 2014235551
g(i,0)=∞(i=0,…,I) …(13)
g(0,j)=∞(j=1,…,J) …(14)
ここで、g(i,j)は、(i,j)までの最適経路の累積コスト、d(xi−k,i,yj−l,j)は、ストロークxの第(i−k)要素から第i要素までのk画のストローク列xと、ストロークyの第(j−k)要素から第j要素までのl画のストローク列yとを対応付けた時のコスト(局所距離)である。
そして、ストローク群Xを検索対象、ストローク群Yをクエリとし、それぞれの画数をI、Jとしたとき、数式(15)となる経路に含まれるストローク群Yのストローク列が検索部25の検索結果となる(図7参照)。
Figure 2014235551
表示制御部27は、検索部25により検索されたデータを表示部29に表示させる。第1実施形態では、表示制御部27は、検索部25により検索された文字列データを表示部29に表示させる。例えば、表示制御部27は、図8に示すように、表示部29の画面をタイル状に分割し、各タイルに縮小した文書のサムネイルを表示させるようにしてもよい。この際に、表示制御部27は、例えば、表示順として、検索結果の類似度の高いストローク列を含む順に、文書のサムネイルを並べるようにしてもよい。また、サムネイルにおいて、検索結果のストローク列を強調表示するようにしてもよい。
図9は、第1実施形態の検索装置10で行われる処理の手順の流れの一例を示すフローチャート図である。
まず、取得部13は、入力部11により入力されたストロークを順次取得することで、ストローク群を取得する(ステップS101)。
続いて、分割部17は、取得部13により取得されたストローク群を構成するストロークそれぞれを複数のサブストロークに分割する(ステップS103)。
続いて、抽出部19は、複数のサブストロークそれぞれに固有の特徴量を当該サブストロークから抽出する(ステップS105)。
続いて、算出部23は、ストローク群それぞれに属する複数のサブストローク間の最適経路に基づいて、当該ストローク群を構成するストローク間の距離を算出する(ステップS107)。
続いて、検索部25は、算出部23により算出された距離を用いて、取得部13により取得されたストローク群に対応する文字列データを検索する(ステップS109)。
続いて、表示制御部27は、検索部25により検索された文字列データを表示部29に表示させる(ステップS111)。
なお、上記処理において、ステップS101〜S105は、並列して実行することもできる。
以上のように第1実施形態によれば、ストローク群を構成するストロークを複数のサブストロークに分割して検索用のクエリとすることで、ストローク群を構成するストローク数が少ない場合であってもストローク数を擬似的に増やすことができ、検索精度を高めることができる。また、検索の際に、サブストローク列間の最適経路に基づいて検索を行うことで、検索時の処理コストを削減でき、検索速度の低下を抑えることができる。
(ハードウェア構成)
図10は、第1実施形態の検索装置10のハードウェア構成の一例を示す図である。図10に示すように、検索装置10は、CPU201と、入力デバイス202と、出力デバイス203と、RAM204と、ROM205と、外部メモリインターフェース206と、通信インターフェース207とを、備える。例えば、入力デバイス202及び出力デバイス203にタッチパネルを使用する場合には、液晶パネルとペンと液晶パネル上に設けられたストローク検出装置等が利用される(符号208参照)。
第1実施形態の検索装置10で実行されるプログラムは、ROM等に予め組み込んで提供される。また、第1実施形態の検索装置10で実行されるプログラムを、インストール可能な形式又は実行可能な形式のファイルでCD−ROM、CD−R、メモリカード、DVD、フレキシブルディスク(FD)等のコンピュータで読み取り可能な記憶媒体に記憶されて提供するようにしてもよい。また、第1実施形態の検索装置10で実行されるプログラムを、インターネット等のネットワークに接続されたコンピュータ上に格納し、ネットワーク経由でダウンロードさせることにより提供するようにしてもよい。
第1実施形態の検索装置10で実行されるプログラムは、上述した各部をコンピュータ上で実現させるためのモジュール構成となっている。実際のハードウェアとしては、例えば、CPU201がROM205からプログラムをRAM204上に読み出して実行することにより、上記各部がコンピュータ上で実現されるようになっている。
なお、第1実施形態の検索装置10は、スタンドアローンの装置として構成することも、ネットワークを介して通信可能な複数のノードに分散した形で構成することも可能である。また、第1実施形態の検索装置は、デスクトップ型又はラップトップ型の汎用計算機、携帯型の汎用計算機、その他の携帯型の情報機器、タッチパネルを有する情報機器、スマートフォン、その他の情報処理装置など、様々なデバイスによって実現可能である。
例えば、図11は、イントラネット及び/又はインターネット等のネットワーク302上にサーバ301が存在し、各クライアント303、304がネットワーク302を介してそれぞれサーバ301と通信することによって、本実施形態の検索装置10が実現する様子を例示している。
なお、クライアント303は、無線通信を介してネットワーク302に接続され、クライアント304は、有線通信を介してネットワーク302に接続される場合を例示している。クライアント303,304は、通常、ユーザ装置である。サーバ301は、例えば、企業内LAN等のLAN上に設けられたものであっても良いし、インターネット・サービス・プロバイダ等が運営するものであっても良い。また、サーバ301がユーザ装置であって、あるユーザが他のユーザに機能を提供するものであっても良い。
図1の構成に則して説明すれば、入力部11、取得部13、表示制御部27、及び表示部29をクライアント側に搭載し、それ以外の構成をサーバ側に搭載しても良いし、算出部23と検索部25をサーバ側に搭載し、それ以外の構成をクライアント側に搭載しても良い。
なお、入力部11、取得部13、表示制御部27、及び表示部29以外の構成も備えた装置、表示制御部27及び表示部29を備えた装置を実現しても良い。この場合、当該装置は、サブストロークから特徴量を抽出する機能を有するものである。
また例えば、入力部11、取得部13、表示制御部27、及び表示部29をクライアント側に搭載し、算出部23及び検索部15を第1のサーバに搭載し、インクデータ記憶部15、分割部17、抽出部19、及び特徴量記憶部21第2のサーバに搭載しても良い。
また、これら以外の分散方法も可能である。
(変形例1)
検索装置10において、取得部13が取得するストロークを音波形データとしてもよい。この場合、取得部13は、マイクなどの入力装置から入力された音声をアナログ/デジタル変換し、デジタル信号を取得する。例えば、16KHzでサンプリングし、16Bitで量子化したデジタル信号に変換する。
その後、取得部13は、音信号をデジタル信号の振幅値に対するしきい値によって音声区間と無音区間に分割し、連続した音声区間を順次分割部17に出力する。この分割方法は前記方法に限定したものではなく、例えば、音声区間と無音区間を分割せずに、ある一定の時間区間によって分割したものを出力しても良い。また、出力として音声区間と無音区間両方を分割部17に出力しても良い。
分割部17は、取得部13から出力される一つの連続した音区間を、あらかじめ定められた一定の間隔で分割し、順次特徴抽出部に出力する。分割は一定間隔による分割に限定したものではなく,例えば,スペクトル分析などを行い隣接フレームのスペクトラムの差分がある一定の大きさを超えたら分割するなどの処理を行っても良い。
抽出部19は、分割部17から出力される分割音区間の一つに対して、第1実施形態と同様にあらかじめ定められたサンプル数になるようにリサンプリングした後、フーリエ変換および、24次元のメルフィルタバンク分析を適用して、24次元の対数メルスペクトルを要素に持つベクトルを特徴量として算出する。
なおここで用いる特徴量は、対数メルスペクトルに限定するものではなく、例えば,MFCC(Mel Frequency Cepstrum Coefficient)などの音響特徴量でもよい。
(変形例2)
検索装置10において、取得部13が取得するストロークが位置情報の軌跡データとしてもよい。この場合、取得部13は、GPS(Global Positioning System)などの位置計測装置から、位置情報を取得する。取得部13は、取得した位置情報を軌跡であるストロークして保存する。位置情報でのストロークは、第1実施形態と同様に、2次元空間の座標値の集合として保存される。このとき、1つのストロークとしてまとめる基準は、いくつか考えられるが、例えば一定時間内の移動量が閾値以上の区間のみをストロークとして保存する。
以上説明したとおり、上記実施形態及び各変形例によれば、検索速度の低下を抑えつつ検索精度を高めることができる。
なお本発明は、上記各実施形態そのままに限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で構成要素を変形して具体化することができる。また上記各実施形態に開示されている複数の構成要素の適宜な組み合わせにより、種々の発明を形成することができる。例えば、実施形態に示される全構成要素からいくつかの構成要素を削除してもよい。さらに、異なる実施形態にわたる構成要素を適宜組み合わせても良い。
例えば、上記実施形態のフローチャートにおける各ステップを、その性質に反しない限り、実行順序を変更し、複数同時に実施し、あるいは実施毎に異なった順序で実施してもよい。
10 検索装置
11 入力部
13 取得部
15 インクデータ記憶部
17 分割部
19 抽出部
21 特徴量記憶部
23 算出部
25 検索部
27 表示制御部
29 表示部

Claims (9)

  1. 複数の第1点列を取得する取得部と、
    前記複数の第1点列それぞれを複数の第2点列に分割する分割部と、
    前記複数の第2点列それぞれの特徴量を抽出する抽出部と、
    前記複数の第1点列それぞれに属する複数の第2点列間の最適経路に基づいて、当該複数の第1点列間の距離を算出する算出部と、
    前記距離を用いて、前記複数の第1点列に対応するデータを検索する検索部と、
    を備える検索装置。
  2. 前記分割部は、前記複数の第2点列それぞれの曲率が閾値以下となるように、前記第1点列を前記複数の第2点列に分割する請求項1に記載の検索装置。
  3. 前記分割部は、前記複数の第2点列それぞれの長さが閾値以下となるように、前記第1点列を前記複数の第2点列に分割する請求項1に記載の検索装置。
  4. 前記分割部は、前記複数の第2点列の数が予め定められた数となるように、前記第1点列を前記複数の第2点列に分割する請求項1に記載の検索装置。
  5. 検索された前記データを表示部に表示させる表示制御部を更に備える請求項1に記載の検索装置。
  6. 前記複数の第1点列は、ユーザが文字列を手書きしたストローク群であり、
    前記第2点列は、前記ストローク群を構成するストロークのサブストロークであり、
    前記データは、文字列を示す文字列データであり、
    前記取得部は、前記ストローク群を構成するストロークを順次取得することで、前記前記ストローク群を取得し、
    前記分割部は、前記ストローク群を構成するストロークそれぞれを複数のサブストロークに分割し、
    前記算出部は、前記ストローク群を構成するストロークそれぞれに属する前記複数のサブストローク間の最適経路に基づいて、当該ストローク群を構成するストローク間の距離を算出し、
    前記検索部は、前記距離を用いて、前記ストローク群に対応する文字列データを検索し、
    前記表示制御部は、検索された前記文字列データを前記表示部に表示させる請求項5に記載の検索装置。
  7. 前記取得部は、ユーザにより指定された複数の第1点列を取得する請求項1に記載の検索装置。
  8. 複数の第1点列を取得する取得ステップと、
    前記複数の第1点列それぞれを複数の第2点列に分割する分割ステップと、
    前記複数の第2点列それぞれの特徴量を抽出する抽出ステップと、
    前記複数の第1点列それぞれに属する複数の第2点列間の最適経路に基づいて、当該複数の第1点列間の距離を算出する算出ステップと、
    前記距離を用いて、前記複数の第1点列に対応するデータを検索する検索ステップと、
    を含む検索方法。
  9. 複数の第1点列を取得する取得ステップと、
    前記複数の第1点列それぞれを複数の第2点列に分割する分割ステップと、
    前記複数の第2点列それぞれの特徴量を抽出する抽出ステップと、
    前記複数の第1点列それぞれに属する複数の第2点列間の最適経路に基づいて、当該複数の第1点列間の距離を算出する算出ステップと、
    前記距離を用いて、前記複数の第1点列に対応するデータを検索する検索ステップと、
    をコンピュータに実行させるためのプログラム。
JP2013116419A 2013-05-31 2013-05-31 検索装置、方法及びプログラム Active JP6125333B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2013116419A JP6125333B2 (ja) 2013-05-31 2013-05-31 検索装置、方法及びプログラム
US14/198,369 US9195887B2 (en) 2013-05-31 2014-03-05 Retrieving apparatus, retrieving method, and computer program product
CN201410082975.3A CN104216940B (zh) 2013-05-31 2014-03-07 检索设备和检索方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2013116419A JP6125333B2 (ja) 2013-05-31 2013-05-31 検索装置、方法及びプログラム

Publications (2)

Publication Number Publication Date
JP2014235551A true JP2014235551A (ja) 2014-12-15
JP6125333B2 JP6125333B2 (ja) 2017-05-10

Family

ID=51985180

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013116419A Active JP6125333B2 (ja) 2013-05-31 2013-05-31 検索装置、方法及びプログラム

Country Status (3)

Country Link
US (1) US9195887B2 (ja)
JP (1) JP6125333B2 (ja)
CN (1) CN104216940B (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10725650B2 (en) * 2014-03-17 2020-07-28 Kabushiki Kaisha Kawai Gakki Seisakusho Handwritten music sign recognition device and program
CN106502660B (zh) * 2016-10-14 2019-09-20 广州视睿电子科技有限公司 一种基于触摸屏的线段生成方法、系统及终端
KR102149105B1 (ko) * 2019-09-18 2020-08-27 세종대학교산학협력단 혼합현실 기반 3차원 스케치 장치 및 방법
CN111242219A (zh) * 2020-01-14 2020-06-05 北大方正集团有限公司 文字相似度确定方法、装置、电子设备及存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06301819A (ja) * 1993-04-15 1994-10-28 Seiko Epson Corp オンライン手書き文字認識装置
JPH0962788A (ja) * 1995-08-28 1997-03-07 Ricoh Co Ltd オンライン手書き文字認識方法
JPH11167606A (ja) * 1997-12-04 1999-06-22 Sharp Corp 手書き文字認識装置およびプログラム記憶媒体
JP2005505861A (ja) * 2001-10-15 2005-02-24 シルバーブルック リサーチ ピーティワイ リミテッド 筆跡特徴合成を用いたデジタル・インク・データベースの探索

Family Cites Families (46)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4286255A (en) * 1979-02-22 1981-08-25 Burroughs Corporation Signature verification method and apparatus
US4375081A (en) * 1980-12-05 1983-02-22 Pencept, Inc. Multistage digital filtering utilizing several criteria
US4703511A (en) * 1986-10-09 1987-10-27 Paul Conoval Writing input and dynamics regeneration device
US5272470A (en) * 1991-10-10 1993-12-21 International Business Machines Corporation Apparatus and method for reducing system overhead while inking strokes in a finger or stylus-based input device of a data processing system
US5343537A (en) * 1991-10-31 1994-08-30 International Business Machines Corporation Statistical mixture approach to automatic handwriting recognition
US5515455A (en) * 1992-09-02 1996-05-07 The Research Foundation Of State University Of New York At Buffalo System for recognizing handwritten words of cursive script
US5425109A (en) * 1992-10-22 1995-06-13 Mutoh Industries Ltd. System for identifying freehand drawings
US5392363A (en) * 1992-11-13 1995-02-21 International Business Machines Corporation On-line connected handwritten word recognition by a probabilistic method
US5454046A (en) * 1993-09-17 1995-09-26 Penkey Corporation Universal symbolic handwriting recognition system
JP3486876B2 (ja) * 1994-01-28 2004-01-13 ソニー株式会社 手書き入力装置および方法
IL110137A (en) * 1994-06-27 2000-06-29 Advanced Recognition Tech Handwriting recognition system
US5781661A (en) * 1994-06-29 1998-07-14 Nippon Telegraph And Telephone Corporation Handwritting information detecting method and apparatus detachably holding writing tool
US6052481A (en) * 1994-09-02 2000-04-18 Apple Computers, Inc. Automatic method for scoring and clustering prototypes of handwritten stroke-based data
US5802204A (en) * 1995-06-07 1998-09-01 Microchip Technology Incorporated Handwritten character translator using fuzzy logic
JPH1196301A (ja) * 1997-09-22 1999-04-09 Hitachi Ltd 文字認識装置
US6898315B2 (en) * 1998-03-23 2005-05-24 Microsoft Corporation Feature extraction for real-time pattern recognition using single curve per pattern analysis
KR100454541B1 (ko) * 1998-04-27 2004-11-03 산요덴키가부시키가이샤 수기 문자 인식 방법 및 시스템
US7397949B2 (en) * 2000-06-21 2008-07-08 Microsoft Corporation Serial storage of ink and its properties
WO2002037933A2 (en) * 2000-11-08 2002-05-16 New York University System, process and software arrangement for recognizing handwritten characters
SE521911C2 (sv) * 2001-01-15 2003-12-16 Decuma Ab Ideon Res Park Metod, anordning och datorprogram för igenkänning av ett handskrivet tecken
JP2002222425A (ja) * 2001-01-29 2002-08-09 Canon Inc 情報処理装置及び方法
US7162087B2 (en) * 2001-12-28 2007-01-09 Anoto Ab Method and apparatus for recording of electronic handwriting
US7158675B2 (en) * 2002-05-14 2007-01-02 Microsoft Corporation Interfacing with ink
US7174043B2 (en) * 2003-02-25 2007-02-06 Evernote Corp. On-line handwriting recognizer
US7218782B1 (en) * 2003-04-18 2007-05-15 Kamran Reihani System and method for automated symbolic recognition including multi-phase symbolic reshaping
US7369702B2 (en) * 2003-11-07 2008-05-06 Microsoft Corporation Template-based cursive handwriting recognition
US7529410B2 (en) * 2004-01-07 2009-05-05 Microsoft Corporation Local localization using fast image match
JP4092371B2 (ja) * 2005-02-15 2008-05-28 有限会社Kiteイメージ・テクノロジーズ 手書き文字認識方法、手書き文字認識システム、手書き文字認識プログラム及び記録媒体
US7567711B2 (en) * 2005-08-01 2009-07-28 Microsoft Corporation Cleaning up of handwriting intra-stroke and inter-stroke overtracing
US7664325B2 (en) * 2005-12-21 2010-02-16 Microsoft Corporation Framework for detecting a structured handwritten object
WO2008012824A1 (en) * 2006-07-27 2008-01-31 Bgn Technologies Ltd. Online arabic handwriting recognition
JP2009086749A (ja) * 2007-09-27 2009-04-23 Canon Inc パターン識別手法、識別用パラメータ学習方法、及び装置
WO2010016065A1 (en) * 2008-08-08 2010-02-11 Moonsun Io Ltd. Method and device of stroke based user input
US9251407B2 (en) * 2008-09-04 2016-02-02 Northrop Grumman Systems Corporation Security system utilizing gesture recognition
US20120069027A1 (en) * 2009-04-28 2012-03-22 Wataru Yamazaki Input device
JP5565320B2 (ja) * 2011-01-06 2014-08-06 富士通株式会社 情報処理装置及び情報処理プログラム
CN102081803B (zh) * 2011-01-20 2012-10-10 北京壹人壹本信息科技有限公司 一种手写原笔迹的笔锋实现方法
JP5717691B2 (ja) * 2012-05-28 2015-05-13 株式会社東芝 手書き文字検索装置、方法及びプログラム
JP2013246732A (ja) * 2012-05-28 2013-12-09 Toshiba Corp 手書き文書検索装置、方法及びプログラム
JP2014032632A (ja) * 2012-08-06 2014-02-20 Toshiba Corp 電子機器、方法、およびプログラム
JP5389241B1 (ja) * 2012-09-26 2014-01-15 株式会社東芝 電子機器および手書き文書処理方法
JP5342052B1 (ja) * 2012-10-17 2013-11-13 株式会社東芝 電子機器および方法
US9117125B2 (en) * 2013-02-07 2015-08-25 Kabushiki Kaisha Toshiba Electronic device and handwritten document processing method
WO2014147719A1 (ja) * 2013-03-18 2014-09-25 株式会社 東芝 電子機器および手書き文書処理方法
WO2014147712A1 (ja) * 2013-03-18 2014-09-25 株式会社 東芝 情報処理装置、情報処理方法及びプログラム
JP5735126B2 (ja) * 2013-04-26 2015-06-17 株式会社東芝 システムおよび筆跡検索方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06301819A (ja) * 1993-04-15 1994-10-28 Seiko Epson Corp オンライン手書き文字認識装置
JPH0962788A (ja) * 1995-08-28 1997-03-07 Ricoh Co Ltd オンライン手書き文字認識方法
JPH11167606A (ja) * 1997-12-04 1999-06-22 Sharp Corp 手書き文字認識装置およびプログラム記憶媒体
JP2005505861A (ja) * 2001-10-15 2005-02-24 シルバーブルック リサーチ ピーティワイ リミテッド 筆跡特徴合成を用いたデジタル・インク・データベースの探索

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
JPN6017001629; 加藤 真、外1名: 'オンライン文字認識における文字検証の一手法' 電子情報通信学会論文誌 第J76-D-II巻,第11号, 19931125, p.2295-2303, 社団法人電子情報通信学会 *

Also Published As

Publication number Publication date
US9195887B2 (en) 2015-11-24
JP6125333B2 (ja) 2017-05-10
US20140355885A1 (en) 2014-12-04
CN104216940A (zh) 2014-12-17
CN104216940B (zh) 2017-08-15

Similar Documents

Publication Publication Date Title
JP2667954B2 (ja) 静的及び動的パラメータを使用する自動手書き文字認識装置及び方法
US20180018533A1 (en) Synthetic data generation of time series data
EP4062272A1 (en) Synthetic data generation and building information model (bim) element extraction from floor plan drawings using machine learning
US9298365B2 (en) Storage medium, information processing apparatus and character recognition method
US20080130996A1 (en) Method For Character Recognition
Awal et al. Towards handwritten mathematical expression recognition
CN111931710B (zh) 一种联机手写文字识别方法、装置、电子设备及存储介质
KR20120011010A (ko) 수기 인식 방법 및 장치
JP2010504553A (ja) 音声キーワードの特定方法、装置及び音声識別システム
CN104008363A (zh) 手写轨迹的检测、规范化和在线识别以及异常字根的收集
JP6125333B2 (ja) 検索装置、方法及びプログラム
CN102073884A (zh) 一种手写识别方法、系统及手写识别终端
JP6055065B1 (ja) 文字認識プログラム、文字認識装置
Chaithra et al. Handwritten online character recognition for single stroke Kannada characters
US9384304B2 (en) Document search apparatus, document search method, and program product
Khan Online Urdu handwritten character recognition: Initial half form single stroke characters
JP4570995B2 (ja) マッチング方法およびマッチング装置ならびにプログラム
Liwicki et al. Feature selection for HMM and BLSTM based handwriting recognition of whiteboard notes
Xu et al. On-line sample generation for in-air written chinese character recognition based on leap motion controller
WO2014174665A1 (ja) システムおよび筆跡検索方法
CN103761294A (zh) 基于手写轨迹和语音识别的查询方法及装置
Huh et al. A typeface searching technique using evaluation functions for shapes and positions of alphabets used in ancient books for image searching
JP6030172B2 (ja) 手書き文字検索装置、方法及びプログラム
JPH09319828A (ja) オンライン文字認識装置
Lee et al. An online handwritten recognition system of music score

Legal Events

Date Code Title Description
RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20151102

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20160316

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20170117

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20170131

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170222

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20170307

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20170405

R151 Written notification of patent or utility model registration

Ref document number: 6125333

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313117

Free format text: JAPANESE INTERMEDIATE CODE: R313121

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350