JP5694236B2 - 文書検索装置、方法およびプログラム - Google Patents

文書検索装置、方法およびプログラム Download PDF

Info

Publication number
JP5694236B2
JP5694236B2 JP2012121306A JP2012121306A JP5694236B2 JP 5694236 B2 JP5694236 B2 JP 5694236B2 JP 2012121306 A JP2012121306 A JP 2012121306A JP 2012121306 A JP2012121306 A JP 2012121306A JP 5694236 B2 JP5694236 B2 JP 5694236B2
Authority
JP
Japan
Prior art keywords
query
handwriting
search
type
document
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2012121306A
Other languages
English (en)
Other versions
JP2013246733A (ja
Inventor
洋次郎 登内
洋次郎 登内
山内 康晋
康晋 山内
和範 井本
和範 井本
智行 柴田
智行 柴田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2012121306A priority Critical patent/JP5694236B2/ja
Priority to CN2012103624648A priority patent/CN103455529A/zh
Priority to US13/903,511 priority patent/US9384304B2/en
Publication of JP2013246733A publication Critical patent/JP2013246733A/ja
Application granted granted Critical
Publication of JP5694236B2 publication Critical patent/JP5694236B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • G06F16/9032Query formulation
    • G06F16/90332Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation

Description

本発明の実施形態は、文書検索装置、方法およびプログラムに関する。
ユーザが入力あるいは指定した手書きのクエリーに類似またはマッチする手書き文書をデータベースから検索する文書検索装置が知られている。
Cheng Cheng, Bilan Zhu, Masaki Nakagawa: "A Discriminative Model for On-line Handwritten Japanese Text Retrieval", International Conference on Document Analysis and Recognition, 2011 Pasitthideth LUANGVILAY, Bilan ZHU, Masaki NAKAGAWA: "An On-line Handwritten Text Search Method based on Directional Feature Matching", International Conference on Document Analysis and Recognition, 2011
クエリーの種類に応じた検索方法により的確な検索を行えることが望ましい。
実施形態によれば、筆跡のデータを取得する取得部と、クエリーの種類を判定する判定部と、文書を検索する検索部と、検索結果を表示する表示部と、を具備する文書検索装置が提供される。取得部は、座標データを含む筆跡のデータを取得する。判定部は、前記座標データに基づいて前記筆跡の形状を判定することによりクエリーの種類を判定する。検索部は、前記クエリーの種類に応じた検索方法にしたがって文書を検索することにより検索結果を得る。表示部は、前記検索結果を前記クエリーの種類に応じた表示方法で表示する。
実施形態に係る文書検索装置のブロック図。 クエリーの種類を示す図。 クエリーの入力方法を説明するための図。 筆跡の方向に応じた区別を説明するための図。 クエリー判定の処理を示すフローチャート。 形状判定の処理を示すフローチャート。 閉ループ判定の処理を示すフローチャート。 インクデータ構造を示す図。 検索結果の表示例を示す図。 実施形態に係る文書検索装置のハードウェア構成図。 ネットワークを介して手書き文書データを共有するシステムの一例を示す図。 閉ループの内側に筆跡が含まれるか否かを判定する処理を説明するための図。 横線の近傍上部に筆跡があるか否かを判定する処理を説明するための図。
以下、実施の形態について、図面を参照して説明する。
本実施形態は、検索対象およびクエリーを手書きのデータとする場合の検索システムに関する。すなわち本システムは、検索対象を「手書き文書」とし、検索に用いられるクエリーを手書きした文字等を用いたクエリー(以下「手書きクエリー」と称する)とするような、言語非依存の検索システムを主に対象とする。手書きクエリーは、文字に限らず、マーク、線等、ユーザが描画したものを含む。
しかし、検索対象をテキスト文書としてもよい。この場合、手書きクエリーをテキストクエリーに変換して検索を行う。また、検索対象を手書き文書とし、検索に用いられるクエリーをテキストクエリーとしてもよい。この場合、テキストクエリーを手書きクエリーに変換して検索を行う。いずれのシステム例においても、以下で説明する実施形態に従って手書きクエリーの種類を判定し、手書きクエリーの種類に応じた検索方法により検索を実行し、これに応じた適切な表示方法で検索結果を表示する。
本実施形態では、手書きクエリーの種類の内訳を例えば「文字列」、「1画マーク」、「下線」、「囲み線」としている。手書きクエリーの種類に応じて、類似またはマッチする手書き文書内の検索対象は異なる。例えば、手書きクエリーの種類が文字列の場合には、文字列それ自体が検索対象である。1画マークの場合には、1画マークそれ自体を検索したい場合だけではない。1画マークの場合、検索対象は、当該一画マークの前後の文字列である。手書きクエリーの種類が下線や囲み線の場合、検索したいのはその下に下線が付された文字列や、囲み線で囲まれた文字列である。
なお、手書きクエリーの種類としては上記のみに限定されない。当業者であれば、本開示に基づき、手書きクエリーの種類を拡大し、逆に手書きクエリーの種類を削減するなどして実施の形態を変更することができる。
図1に示すように、実施形態に係る文書検索装置は、筆跡のデータを取得する取得部1と、クエリーの種類を判定するクエリー判定部2と、文書を検索する検索部3と、手書き文書データベース(DB)4と、検索結果を表示する検索結果表示部5を備える。
取得部1は、座標データを含む筆跡のデータを取得する。
取得部1により取得される筆跡のデータは、1画(ストローク)ごとに分離された座標の時系列データを持ち、例えば次のように表される。
画1:(x(1,1),y(1,1)), (x(1,2),y(1,2)),…, (x(1,N(1)),y(1,N(1)))
画2:(x(2,1),y(2,1)), (x(2,2),y(2,2)),…, (x(2,N(2)),y(2,N(2)))

ただし、N(i)は画iサンプリング時の点数である。
なお、手書き文書DB4に格納される手書き文書についても、上記のような筆跡のデータを有する。
図2にクエリーの種類を凡例によって示す。上述したように、本実施形態ではクエリーの種類を文字列、1画マーク、下線、囲み線のいずれかとしている。これらは筆跡の形状によって分類される。図2において、参照数字20で示されるのは文字列のクエリーである。これは、例えば「アイデア」という文字列を手書き入力(あるいは手書き文書中で選択)したものである。文字列の内容は「アイデア」という文字列のみならず任意であることは言うまでもない。なお、ここでいう文字列とは、一連の文字コードからなるテキストとは異なり、筆跡の形状が文字列であることを意味する。参照数字21で示されるのは1画マークのクエリーである。これは、例えば星印を手書き入力(あるいは手書き文書中で選択)したものである。例えば、1画マークは、ユーザの注目度が他と異なる部分に区別するために付される。また、手書き文書において箇条書きをするために行頭に筆記される場合もある。参照数字22で示されるのは下線のクエリーである。下線は、手書き文書において文字列を強調するために筆記される場合が多い。参照数字23で示されるのは囲み線のクエリーである。囲み線は、手書き文書において下線と同様に文字列を強調したり、特定の文字列を他の文字列とは区別するために筆記される場合が多い。
クエリー判定部2は、取得部1により取得された筆跡の座標データに基づいて当該筆跡の形状を判定することにより、上記クエリーの種類を判定する。クエリーの種類を判定する具体的な処理については後述する。
図3を参照してクエリーの入力方法を説明する。クエリーの入力方法としては(i)直接手書き、(ii)直接手書き選択、(iii)間接手書き選択がある。
(i)直接手書きは、検索入力において、クエリーとなる筆跡をユーザが入力デバイス(スタイラスペン等)を用いて手書き入力する方法である。図3において、直接手書きされたクエリーの例30は「アイデア」という文字列であり、同クエリーの例31は星印の1画マークであり、同クエリーの例32は下線であり、同クエリーの例33は囲み線である。主には、検索入力エリアを提示し、ユーザが検索入力エリアに直接入力して実行される。
(ii)直接手書き選択は、上記のようにクエリーそれ自体を手書き入力するのではなく、表示された手書き文書中でクエリーとすべき筆跡を直接的に選択する方法である。例えばユーザが対角線34を描くように入力デバイスを操作することにより、対角線34により規定される矩形内の筆跡35(この例では「アイデア」)を直接的に選択する。あるいは、筆跡36そのものを入力デバイスや指でタップすることにより直接的に選択する。
(iii)間接手書き選択は、表示された手書き文書中でクエリーとすべき筆跡を間接的に選択する方法である。例えば、ユーザが下線37を描くように入力デバイスを操作することにより、下線37に隣接する上側の筆跡38(この例では「アイデア」)を間接的に選択する。あるいは、囲み線39を描くように入力デバイスを操作することにより、囲み線39の内側の筆跡40(この例では「アイデア」)を間接的に選択する。
上記(iii)間接手書き選択において、クエリー入力のためにユーザが下線37を描くように入力デバイスを操作することを示したが、下線37を描いた際の筆跡の方向をクエリー判定部2が判定し、その結果に応じて下線37の処理を異ならせてもよい。筆跡の方向は、上述した筆跡のデータの時系列における座標値の大小関係から判断することができる。例えば、図4(a)に示すように、下線37を紙面左から右の方向に筆記した場合には、これをクエリー入力とするのではなく、通常の下線の筆跡(クエリーでない筆跡)とする。一方、図4(b)に示すように、下線37を紙面右から左の方向に筆記した場合には、これをクエリー入力として扱う。具体的には、図3を参照して説明したように下線37に隣接する上側の筆跡42(この例では「アイデア」)を間接的に選択する。なお、囲み線等の他の筆跡についても同様に筆跡の方向を判定してもよい。例えば、時計回りに筆記した囲み線を通常の筆跡とし、反時計回りに筆記した囲み線の場合には、図3を参照して説明したように間接手書き選択であるという判定をしてもよい。このように筆跡の方向判定に応じて処理を異ならせることにより、手書き検索のユーザーインタフェースを適切に構成することができる。
クエリーの種類を判定する具体的な処理について図5のフローチャートを参照して説明する。
ステップS1において入力筆跡の形状判定を行う。クエリー判定部2は、取得部1により取得されたクエリー入力の筆跡データに含まれる座標データに基づいて、その筆跡の形状を判定することによりクエリーの種類を文字列、一画マーク、下線、囲み線のいずれかに判定する。
図6は、形状判定の処理を示すフローチャートである。この形状判定の処理は、取得部1により取得された筆跡の座標データに基づいて行われる。
図6のステップS11において、入力クエリー(入力筆跡)が1画であるか複数画であるかを判定する。「1画」の場合には、ステップS12において、その1画の筆跡が閉ループを構成しているか否かを判定する。閉ループ判定の処理を、図7を参照して説明する。折れ線P,P,..Pn−1,Pが閉曲線であるかを判定する。折れ線の各線分をL=Pi+1で表す。このとき、LとL(i<j)が交差しているかどうかを調べ、交差している場合、P[i],...P[j+1]が閉曲線を構成していると判定する。例えば、図7の例では、線分L[2]とL[7]が交わっていて、P[2],..,P[8]が閉曲線を構成している。さらに、ストロークの始点から終点までの距離を計算し、これがストロークの全長と比較して小さいならば、閉ループと判定する。図6のステップS12において閉ループと判定された場合には、ステップ15において、閉ループの内側に筆跡が含まれるか否かを判定する。
閉ループの内側に筆跡が含まれるか否かを判定する処理を、図12を参照して説明する。判定対象となる筆跡の各点Q[1],Q[2],…,Q[M]がすべて閉ループ曲線内にあるとき、閉ループ内に筆跡が含まれると判定する。閉ループ内に点Qが含まれるかどうかは、次のように判定することができる。閉ループ曲線をP[1](X[1],Y[1]),P[2](X[2],Y[2]),…,P[N−1](X[N−1],Y[N−1])とし、判定対象の点をQ(X,Y)とする。
(1)2点P[i]、P[i+1]を通る直線f[i](x,y)=0を
f(x,y)=(Y[i+1]−Y[i])*(x−X[i])−(X[i+1]−X[i])*(y−Y[i])=0
として計算する。ただし、i=Nのときは、2点P[N]、P[0]を通る直線f[N](x,y)=0となる。
(2)Q(X,Y)が直線の進行方向に対してどちら側にあるかを判定する。このためf[i](X,Y)を計算する。この値が正なら直線の進行方向に対して右側、負なら左側になる。
(3)上記(1)(2)をすべてのiについて繰り返し、Q(X,Y)がすべての直線f[i](X,Y)で同じ符号を取れば、Qは閉ループの内側にあると判定する。
ステップS15において閉ループと判定された場合には、クエリーの種類は「囲み線」であると判定する。
ステップS12またはステップS15において閉ループと判定されなかった場合には、ステップS13において、当該1画の筆跡は横線であるかを判定する。例えば、公知の直線回帰問題を解き、折れ線を直線で当てはめる。その処理で求められる回帰誤差が閾値以内であれば直線と判定する。直線と判定できた場合、直線の傾きの絶対値が一定値以下であれば横向きと判定する。ステップS13において、横線と判定された場合には、ステップ16において、横線の近傍上部に筆跡があるか否かを判定する。
横線の近傍上部に筆跡があるか否かを判定する処理を、図13を参照して説明する。
判定対象となる筆跡の各点Q[1],Q[2],…,Q[M]がすべて線分の上部近傍にあるとき、線分の上部近傍に筆跡があると判定する。線分の上部近傍に点Qがあるかどうかは次のように判定することができる。線分をP[1](X[1],Y[1]),P[2](X[2],Y[2])、ただし、X[1]<X[2]とし、判定対象の点をQ(X,Y)とする。以下の4式を同時に満たすとき、線分の上部近傍に点Qがあると判定することができる。
X[1]<X
X<X[2]
Y>(Y[1]+Y[2])/2
Y<(Y[1]+Y[2])/2+C
ただしCはあらかじめ定めた閾値である。
ステップS16において横線の近傍上部に筆跡があると判定された場合には、最終的にクエリーの種類は「下線」であると判定する。
ステップS13またはステップS16において横線と判定されなかった場合には、ステップS14において、当該1画の筆跡はマークであるかを判定する。この場合、当該1画の筆跡と、あらかじめ決められたマーク(例:「○」、「△」、「☆」、「□」)との類似度を算出する。各マークとの類似度が一定値以下ならば「1画マーク」であると判定する。なお、あらかじめ決められたマークとの類似度を算出する具体的処理については例えば特許第3537949号明細書に記載された方法を用いてもよい。
図6のステップS14においてマークと判定されなかった場合、ならびに、ステップS11において「複数画」と判定された場合には、クエリーの種類は「文字列」と判定する。
図5のステップS2では、クエリー入力の方法が「直接筆記」であるかそれとも「選択」であるかを判定する(クエリー入力の方法については図3を参照されたい)。「直接筆記」の場合には、判定されたクエリーの種類とともに、入力された筆跡のデータをそのままクエリーとして出力する。「選択」の場合には、表示中の手書き文書からクエリーとすべき領域を選択することで筆跡のデータを抽出し、判定されたクエリーの種類とともに出力する。
以上のように判定されたクエリーの種類および筆跡のデータは、クエリー判定部2から検索部3および検索結果表示部5に渡される。
次に、検索処理起動のタイミングについて説明する。本実施形態に係る検索処理は、(i)直接手書き筆記、(ii)直接手書き選択、(iii)間接手書き選択の各場面で検索実行をすることができる。(i)直接手書き筆記の場合、筆記入力後、検索ボタンをペンで選択した際に検索処理が実行される。これは、テキスト検索の際に、テキスト入力後に検索ボタンをマウスでクリックする一連の操作に似ている。検索入力エリアを提示する場合、ペンアップ時や所定時間入力がない場合に、入力された筆跡を検索すべき筆跡としてもよい。
(ii)直接手書き選択の場合には、クエリー筆跡が選択されたと判定した時点で以下を実行する。
(1)ペンアップ時に検索処理を実行する(おもに検索モード時)。
あるいは、
(2)ペンアップ時にコンテクストメニューやダイアログを表示して、ユーザに検索を行うか確認する。
(iii)間接手書き選択の場合には、クエリー筆跡が選択されたと判定した時点で、上記(ii)と同様の動作を行う。
検索部3は、クエリー判定部2により判定されたクエリーの種類に応じた検索方法にしたがって手書き文書DB4から文書を検索することにより検索結果を得る。具体的には、以下のようにクエリーの種類に応じた検索方法にしたがって検索を行う。
(a)文字列:手書き文書DB4において当該文字列のクエリーに類似またはマッチする筆跡を検索する。
(b)1画マーク:手書き文書DB4において当該1画マークのクエリーに類似またはマッチする筆跡を検索する。ただし、当該1画マークが行頭から選択されたものである場合には、検索対象を行頭だけに限定するか、行頭にあるマークの優先順位を上げる等をしてもよい。
(c)下線:手書き文書DB4において、上側に筆跡が隣接している横線を検索する。
(d)囲み線:手書き文書DB4において、内側に筆跡が含まれる閉曲線を検索する。
ここで、文字列のクエリーに類似またはマッチする筆跡を手書き文書DB4から検索する処理の具体例について説明する。検索部3は、クエリーの筆跡を表すストローク列に類似するストローク列を例えば特徴ベクトルのマッチングによって検索する。ストロークデータ(筆跡データ)のより具体的な構造の例を図8を参照して説明する。
「ストローク」とは、手書き入力された筆画であり、ペン等が入力面に接してから離れるまでの軌跡を表す。通常、所定のタイミングで(例えば一定周期で)軌跡上の点がサンプリングされるので、ストロークは、サンプリングされた点の系列により表現される。
図8(b)の例において、1ストローク分(すなわち、1画分)のストローク構造は、ペンが移動した平面上の座標値の集合(点構造)で表現され、具体的には、そのストロークを形成する点の個数を示す「点総数」、「開始時刻」、「外接図形」、点総数に相当する個数の「点構造」の配列を含む構造体である。ここで、開始時刻は、そのストロークにおいてペンが入力面に接して書き出された時刻を示す。外接図形は、文書平面上においてそのストロークの軌跡に対する外接図形(好ましくは、文書平面上においてそのストロークを内包する最小面積の矩形)を示す。
点の構造は、入力デバイスに依存し得る。図8(c)の例では、1点の構造は、その点がサンプリングされた座標値x,y、筆圧並びに初期点(例えば上記の「開始時刻」)からの時間差の4値を持つ構造体である。
なお、座標は文書平面の座標系であり、左上の隅の原点として右下の隅になるほど値が大きくなる正の値で表現しても良い。
また、入力デバイスが筆圧を取得できない場合或いは筆圧を取得できても以降の処理で筆圧を使用しない場合には、図8(c)の筆圧を省いても良いし或いは筆圧に無効を示すデータを記述しても良い。
なお、図8(b),(c)の例において、ストローク構造における個々の点構造の領域に、座標値x,y等の実データを記載しても良いし、あるいは、ストローク構造のデータと点構造のデータとを別々に管理するものとして、ストローク構造における個々の点構造の領域に、対応する点構造へのリンク情報を記載しても良い。
クエリーの筆跡を表すストローク列に類似するストローク列を検索する際の特徴ベクトルのマッチングの具体例としては、例えば、DPマッチング(DP;Dynamic Programming、動的計画法)を利用しても良い。なお、ユーザが指定するストローク列のストローク数と、ユーザが所望するストローク列のストローク数とは、必ずしも同じにはならない可能性がある。なぜならば、例えば筆記者によっては同じ文字の2画分を1画で筆記することなどがあり、同じ意味を有する文字列であっても、筆記者によって異なる画数で筆記される可能性があるからである。通常、ストロークに関するDPマッチングは、1ストローク対1ストロークの対応のみを扱い、2つのストローク列間の伸縮を許容した最適な対応付けを行う手法である。そこで、ここでは、例えば、1ストローク対Nストロークの対応も考慮したDPマッチングを用いることによって、筆画変動にロバストなマッチングが可能となる(例えば、“増田, 内田, 迫江, オンライン文字認識におけるDPマッチンク゛の実験的最適化, 電気関係学会九州支部連合大会, H.17. http://human.ait.kyushu-u.ac.jp/~uchida/Papers/masuda-shibu2005.pdf”を参照)。
例えば、マッチングの対象となるストローク列に含まれる全てのストロークを始点として、ユーザが指定するクエリーであるストローク列との対応付けを行った後、ストローク列間の類似度を算出する。そして、各始点からの類似度を算出した後、降順にソートする。全てのストロークを始点とするため、オーバーラップした結果が得られる。その後、ピーク検出を行って、オーバーラップしたストロークの範囲を統合する。
なお、上記の他にも、種々のマッチング方法が可能である。
検索結果表示部5は、検索部3により得られた検索結果をクエリーの種類に応じた表示方法で表示する。クエリーの種類ごとの結果表示方法としては、以下の2パターンの表示方法が考えられる。
(1)検索された筆跡と、検索筆跡に近接する筆跡とを表示する。
(2)検索された筆跡を含む1ページ分の筆跡を表示する。
ただしどちらも、クエリーの種類によって次のように強調表示方法を変えることが好ましい。
(a)文字列:検索筆跡に近接する筆跡を含めて表示する。ただし、検索された筆跡自体は色を変えるなどして強調表示する。
(b)1画マーク:検索筆跡に近接する筆跡を含めて表示する。ただし、検索された筆跡自体とその後に続く1行分の筆跡は色を変えるなどして強調表示する。
(c)下線:検索筆跡に近接する筆跡を含めて表示する。ただし、検索された筆跡自体とその上に近接する筆跡は色を変えるなどして強調表示する。
(d)囲み線:検索筆跡について近接する筆跡を含めて表示する。ただし、検索された筆跡自体とその内部に含まれる筆跡は色を変えるなどして強調表示する。
図9に検索結果の表示例を示す。図9(a)は、検索結果を示すウインドウ80において、検索筆跡(文字列)81に近接筆跡を含めた検索結果82を表示する例を示している。図9(b)は、検索された筆跡を含むページ83において、1画マーク85とともに該1画マーク85に続く筆跡を含んだ1行分の筆跡86を表示する例を示している。
以下説明した実施形態によれば、手書きクエリーの種類を判定し、手書きクエリーの種類に応じた検索方法により検索を実行し、これに応じた適切な表示方法で検索結果を表示することができる。したがって、クエリーの種類に応じた検索方法により的確な検索を行えるようになる。
以下、本実施形態のバリエーションについて説明する。
本実施形態の検索部3は、文書検索装置の内部の手書き文書DB4に蓄積されている手書き文書群を検索対象としても良いし、文書検索装置がイントラネット及び/又はインターネット等のネットワークに接続可能である場合に、ネットワークを介してアクセス可能な手書き文書群を検索対象としても良いし、文書検索装置に接続されたリムーバブル・メモリ内に蓄積された手書き文書群を検索対象としても良いし、それらの任意の組み合わせであっても良い。
本実施形態の文書検索装置は、スタンドアローンの装置として構成することも、ネットワークを介して通信可能な複数のノードに分散した形で構成することも可能である。
また、本実施形態の文書検索装置は、デスクトップ型又はラップトップ型の汎用計算機、携帯型の汎用計算機、その他の携帯型の情報機器、タッチパネルを有する情報機器、スマートフォン、その他の情報処理装置など、様々なデバイスによって実現可能である。
図10に、本実施形態の文書検索装置を実現するハードウェアの構成例を示す。図中、201はCPU、202は所定の入力デバイス、203は所定の出力デバイス、204はRAM、205はROM、206は外部メモリ・インタフェース、207は通信インタフェースである。例えば、タッチパネルを使用する場合には、例えば液晶パネルとペンと液晶パネル上に設けられたストローク検出装置等が利用される(図中、208参照)。
また、例えば、図1の構成の一部分をクライアント上に設け、図1の構成の残りの部分をサーバ上に設けることも可能である。
例えば、図11は、イントラネット及び/又はインターネット等のネットワーク300上にサーバ303が存在し、各クライアント301,302がネットワーク300を介してそれぞれサーバ303と通信することによって、本実施形態の文書検索装置が実現する様子を例示している。
なお、クライアント301は、無線通信を介してネットワーク300に接続され、クライアント302は、有線通信を介してネットワーク302に接続される場合を例示している。
クライアント301,302は、通常、ユーザ装置である。サーバ303は、例えば、企業内LAN等のLAN上に設けられたものであっても良いし、インターネット・サービス・プロバイダ等が運営するものであっても良い。また、サーバ303がユーザ装置であって、あるユーザが他のユーザに機能を提供するものであっても良い。
図1の構成を、クライアントとサーバに分散する方法として、種々の方法が考えられる。
また、上述の実施形態の中で示した処理手順に示された指示は、ソフトウェアであるプログラムに基づいて実行されることが可能である。汎用の計算機システムが、このプログラムを予め記憶しておき、このプログラムを読み込むことにより、上述した実施形態の文書検索装置による効果と同様な効果を得ることも可能である。上述の実施形態で記述された指示は、コンピュータに実行させることのできるプログラムとして、磁気ディスク(フレキシブルディスク、ハードディスクなど)、光ディスク(CD−ROM、CD−R、CD−RW、DVD−ROM、DVD±R、DVD±RWなど)、半導体メモリ、またはこれに類する記録媒体に記録される。コンピュータまたは組み込みシステムが読み取り可能な記録媒体であれば、その記憶形式は何れの形態であってもよい。コンピュータは、この記録媒体からプログラムを読み込み、このプログラムに基づいてプログラムに記述されている指示をCPUで実行させれば、上述した実施形態の文書検索装置と同様な動作を実現することができる。もちろん、コンピュータがプログラムを取得する場合または読み込む場合はネットワークを通じて取得または読み込んでもよい。
また、記録媒体からコンピュータや組み込みシステムにインストールされたプログラムの指示に基づきコンピュータ上で稼働しているOS(オペレーティングシステム)や、データベース管理ソフト、ネットワーク等のMW(ミドルウェア)等が本実施形態を実現するための各処理の一部を実行してもよい。
さらに、本実施形態における記録媒体は、コンピュータあるいは組み込みシステムと独立した媒体に限らず、LANやインターネット等により伝達されたプログラムをダウンロードして記憶または一時記憶した記録媒体も含まれる。
また、記録媒体は1つに限られず、複数の媒体から本実施形態における処理が実行される場合も、本実施形態における記録媒体に含まれ、媒体の構成は何れの構成であってもよい。
なお、本実施形態におけるコンピュータまたは組み込みシステムは、記録媒体に記憶されたプログラムに基づき、本実施形態における各処理を実行するためのものであって、パソコン、マイコン等の1つからなる装置、複数の装置がネットワーク接続されたシステム等の何れの構成であってもよい。
また、本実施形態におけるコンピュータとは、パソコンに限らず、情報処理機器に含まれる演算処理装置、マイコン等も含み、プログラムによって本実施形態における機能を実現することが可能な機器、装置を総称している。
本発明のいくつかの実施形態を説明したが、これらの実施形態は、例として提示したものであり、発明の範囲を限定することは意図していない。これら新規な実施形態は、その他の様々な形態で実施されることが可能であり、発明の要旨を逸脱しない範囲で、種々の省略、置き換え、変更を行うことができる。これら実施形態やその変形は、発明の範囲や要旨に含まれるとともに、特許請求の範囲に記載された発明とその均等の範囲に含まれる。
1…取得部、2…クエリー判定部、3…検索部、4…手書き文書データベース(DB)、5…検索結果表示部。

Claims (7)

  1. 座標データを含む筆跡のデータを取得する取得部と、
    前記座標データに基づいて前記筆跡の形状を判定することにより、クエリーの種類を判定する判定部と、
    前記クエリーの種類に応じた検索方法にしたがって文書を検索することにより検索結果を得る検索部と、
    前記検索結果を前記クエリーの種類に応じた表示方法で表示する表示部と、
    を具備し、
    前記判定部は、前記座標データに基づいて前記筆跡の形状とともに前記筆跡の方向を判定し、該方向に応じて前記筆跡をクエリー入力またはクエリーでない筆跡のいずれかに判定する文書検索装置。
  2. 座標データを含む筆跡のデータを取得する取得部と、
    前記座標データに基づいて前記筆跡の形状を判定することにより、クエリーの種類を判定する判定部と、
    前記クエリーの種類に応じた検索方法にしたがって文書を検索することにより検索結果を得る検索部と、
    前記検索結果を前記クエリーの種類に応じた表示方法で表示する表示部と、
    を具備し、
    前記クエリーの種類は、文字列、一画マーク、下線、囲み線を含む文書検索装置。
  3. 前記クエリーの種類が前記文字列の場合には、前記筆跡に類似する手書き文書内の筆跡を検索し、
    前記クエリーの種類が一画マークの場合には、前記筆跡に類似する前記手書き文書内の行頭の筆跡を高い優先度で検索し、
    前記クエリーの種類が下線の場合には、上側に筆跡が隣接している前記手書き文書内の横線を検索し、
    前記クエリーの種類が囲み線の場合には、筆跡を内包する前記手書き文書内の閉曲線を検索する、請求項記載の装置。
  4. 取得部が、座標データを含む筆跡のデータを取得するステップと、
    判定部が、前記座標データに基づいて前記筆跡の形状を判定することにより、クエリーの種類を判定するステップと、
    検索部が、前記クエリーの種類に応じた検索方法にしたがって文書を検索することにより検索結果を得るステップと、
    表示部が、前記検索結果を前記クエリーの種類に応じた表示方法で表示するステップと、
    を含み、
    前記判定部は、前記座標データに基づいて前記筆跡の形状とともに前記筆跡の方向を判定し、該方向に応じて前記筆跡をクエリー入力またはクエリーでない筆跡のいずれかに判定する文書検索方法。
  5. 取得部が、座標データを含む筆跡のデータを取得するステップと、
    判定部が、前記座標データに基づいて前記筆跡の形状を判定することにより、クエリーの種類を判定するステップと、
    検索部が、前記クエリーの種類に応じた検索方法にしたがって文書を検索することにより検索結果を得るステップと、
    表示部が、前記検索結果を前記クエリーの種類に応じた表示方法で表示するステップと、
    を含み、
    前記クエリーの種類は、文字列、一画マーク、下線、囲み線を含む文書検索方法。
  6. コンピュータを、
    座標データを含む筆跡のデータを取得する取得部、
    前記座標データに基づいて前記筆跡の形状を判定することにより、クエリーの種類を判定する判定部、
    前記クエリーの種類に応じた検索方法にしたがって文書を検索することにより検索結果を得る検索部、
    前記検索結果を前記クエリーの種類に応じた表示方法で表示する表示部、
    として機能させるためのプログラムであって、
    前記判定部は、前記座標データに基づいて前記筆跡の形状とともに前記筆跡の方向を判定し、該方向に応じて前記筆跡をクエリー入力またはクエリーでない筆跡のいずれかに判定するプログラム。
  7. コンピュータを、
    座標データを含む筆跡のデータを取得する取得部、
    前記座標データに基づいて前記筆跡の形状を判定することにより、クエリーの種類を判定する判定部、
    前記クエリーの種類に応じた検索方法にしたがって文書を検索することにより検索結果を得る検索部、
    前記検索結果を前記クエリーの種類に応じた表示方法で表示する表示部、
    として機能させるためのプログラムであって、
    前記クエリーの種類は、文字列、一画マーク、下線、囲み線を含むプログラム。
JP2012121306A 2012-05-28 2012-05-28 文書検索装置、方法およびプログラム Active JP5694236B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2012121306A JP5694236B2 (ja) 2012-05-28 2012-05-28 文書検索装置、方法およびプログラム
CN2012103624648A CN103455529A (zh) 2012-05-28 2012-09-25 文件检索装置、方法以及记录介质
US13/903,511 US9384304B2 (en) 2012-05-28 2013-05-28 Document search apparatus, document search method, and program product

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012121306A JP5694236B2 (ja) 2012-05-28 2012-05-28 文書検索装置、方法およびプログラム

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2015014601A Division JP5911981B2 (ja) 2015-01-28 2015-01-28 文書検索装置、方法およびプログラム

Publications (2)

Publication Number Publication Date
JP2013246733A JP2013246733A (ja) 2013-12-09
JP5694236B2 true JP5694236B2 (ja) 2015-04-01

Family

ID=49622416

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012121306A Active JP5694236B2 (ja) 2012-05-28 2012-05-28 文書検索装置、方法およびプログラム

Country Status (3)

Country Link
US (1) US9384304B2 (ja)
JP (1) JP5694236B2 (ja)
CN (1) CN103455529A (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6328436B2 (ja) * 2014-02-06 2018-05-23 シャープ株式会社 手書入力装置及び手書入力方法
JP2016194808A (ja) * 2015-03-31 2016-11-17 オムロン株式会社 プログラマブルロジックコントローラ、データ収集装置、データベースアクセス方法およびデータベースアクセスプログラム
JP6977408B2 (ja) * 2017-09-05 2021-12-08 株式会社リコー 情報処理システム、端末装置、情報処理方法及び情報処理プログラム
JP2019211811A (ja) * 2018-05-31 2019-12-12 富士ゼロックス株式会社 画像処理装置およびプログラム
CN110222144B (zh) * 2019-04-17 2023-03-28 深圳壹账通智能科技有限公司 文本内容提取方法、装置、电子设备及存储介质

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63228874A (ja) * 1987-03-17 1988-09-22 Nec Corp 画像フアイル方式とその装置
JP4098880B2 (ja) 1997-06-06 2008-06-11 松下電器産業株式会社 情報検索装置
JP3974359B2 (ja) * 2000-10-31 2007-09-12 株式会社東芝 オンライン文字認識装置及び方法並びにコンピュータ読み取り可能な記憶媒体及びオンライン文字認識プログラム
AUPS020302A0 (en) * 2002-01-31 2002-02-21 Silverbrook Research Pty. Ltd. Methods and systems (npw007)
US7555705B2 (en) * 2003-09-10 2009-06-30 Microsoft Corporation Annotation management in a pen-based computing system
JP4729879B2 (ja) * 2004-07-20 2011-07-20 株式会社日立製作所 情報管理方法および情報管理装置
JP2006146628A (ja) * 2004-11-22 2006-06-08 Hitachi Ltd 内容画像による文書検索方法および装置
JP2007317022A (ja) 2006-05-26 2007-12-06 Canon Inc 手書文字処理装置及び手書文字処理方法
US20120066578A1 (en) * 2010-08-09 2012-03-15 Adapx, Inc. Attribute value management system and methods

Also Published As

Publication number Publication date
US20130318120A1 (en) 2013-11-28
JP2013246733A (ja) 2013-12-09
CN103455529A (zh) 2013-12-18
US9384304B2 (en) 2016-07-05

Similar Documents

Publication Publication Date Title
RU2702270C2 (ru) Обнаружение выбора рукописного фрагмента
US20140143721A1 (en) Information processing device, information processing method, and computer program product
JP2008250375A (ja) 文字入力装置、方法およびプログラム
JP5832980B2 (ja) 手書き入力支援装置、方法およびプログラム
US20180067640A1 (en) Formula inputting method and apparatus
JP5774558B2 (ja) 手書き文書処理装置、方法及びプログラム
US20070098263A1 (en) Data entry apparatus and program therefor
JP5270027B1 (ja) 情報処理装置および手書き文書検索方法
JP5717691B2 (ja) 手書き文字検索装置、方法及びプログラム
JP2007317022A (ja) 手書文字処理装置及び手書文字処理方法
JP5694236B2 (ja) 文書検索装置、方法およびプログラム
JP4817297B2 (ja) 文字検索装置
JP2014215911A (ja) 注目領域推定装置、方法およびプログラム
JP2013246732A (ja) 手書き文書検索装置、方法及びプログラム
JP6223687B2 (ja) 電子機器および手書き文書検索方法
JP5735126B2 (ja) システムおよび筆跡検索方法
JP5911981B2 (ja) 文書検索装置、方法およびプログラム
US20210406453A1 (en) Mapping annotations to ranges of text across documents
JP6655331B2 (ja) 電子機器及び方法
JP2011237993A (ja) 情報入力装置及び情報入力プログラム
JP6039066B2 (ja) 電子機器、手書き文書検索方法およびプログラム
WO2016031016A1 (ja) 電子機器、方法及びプログラム
JP6030172B2 (ja) 手書き文字検索装置、方法及びプログラム
JP6244676B2 (ja) 操作支援プログラム及び操作支援方法並びに情報処理装置
JP2014157485A (ja) 文書検索装置、文書検索方法、及び文書検索プログラム

Legal Events

Date Code Title Description
RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20131219

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20131226

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20140109

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20140325

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20140513

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140714

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20150106

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20150204

R151 Written notification of patent or utility model registration

Ref document number: 5694236

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313117

Free format text: JAPANESE INTERMEDIATE CODE: R313121

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350