JP5911981B2 - Document search apparatus, method and program - Google Patents

Document search apparatus, method and program Download PDF

Info

Publication number
JP5911981B2
JP5911981B2 JP2015014601A JP2015014601A JP5911981B2 JP 5911981 B2 JP5911981 B2 JP 5911981B2 JP 2015014601 A JP2015014601 A JP 2015014601A JP 2015014601 A JP2015014601 A JP 2015014601A JP 5911981 B2 JP5911981 B2 JP 5911981B2
Authority
JP
Japan
Prior art keywords
handwriting
search
query
type
searched
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2015014601A
Other languages
Japanese (ja)
Other versions
JP2015079544A (en
Inventor
洋次郎 登内
洋次郎 登内
山内 康晋
康晋 山内
和範 井本
和範 井本
智行 柴田
智行 柴田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2015014601A priority Critical patent/JP5911981B2/en
Publication of JP2015079544A publication Critical patent/JP2015079544A/en
Application granted granted Critical
Publication of JP5911981B2 publication Critical patent/JP5911981B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

本発明の実施形態は、文書検索装置、方法およびプログラムに関する。   Embodiments described herein relate generally to a document search apparatus, method, and program.

ユーザが入力あるいは指定した手書きのクエリーに類似またはマッチする手書き文書をデータベースから検索する文書検索装置が知られている。   2. Description of the Related Art A document search apparatus that searches a database for a handwritten document that is similar to or matches a handwritten query input or specified by a user is known.

Cheng Cheng, Bilan Zhu, Masaki Nakagawa: "A Discriminative Model for On-line Handwritten Japanese Text Retrieval", International Conference on Document Analysis and Recognition, 2011Cheng Cheng, Bilan Zhu, Masaki Nakagawa: "A Discriminative Model for On-line Handwritten Japanese Text Retrieval", International Conference on Document Analysis and Recognition, 2011 Pasitthideth LUANGVILAY, Bilan ZHU, Masaki NAKAGAWA: "An On-line Handwritten Text Search Method based on Directional Feature Matching", International Conference on Document Analysis and Recognition, 2011Pasitthideth LUANGVILAY, Bilan ZHU, Masaki NAKAGAWA: "An On-line Handwritten Text Search Method based on Directional Feature Matching", International Conference on Document Analysis and Recognition, 2011

クエリーの種類に応じた検索方法により的確な検索を行えることが望ましい。   It is desirable that an accurate search can be performed by a search method according to the type of query.

実施形態によれば、筆跡のデータを取得する取得部と、クエリーの種類を判定する判定部と、文書を検索する検索部と、検索結果を表示する表示部と、を具備する文書検索装置が提供される。取得部は、座標データを含む筆跡のデータを取得する。判定部は、前記座標データに基づいて前記筆跡の形状を判定することによりクエリーの種類を判定する。検索部は、前記クエリーの種類に応じた検索方法にしたがって文書を検索することにより検索結果を得る。表示部は、前記検索結果を前記クエリーの種類に応じた表示方法で表示する。   According to the embodiment, there is provided a document search apparatus including an acquisition unit that acquires handwriting data, a determination unit that determines a type of query, a search unit that searches for a document, and a display unit that displays a search result. Provided. The acquisition unit acquires handwriting data including coordinate data. The determination unit determines the type of query by determining the shape of the handwriting based on the coordinate data. The retrieval unit obtains a retrieval result by retrieving a document according to a retrieval method corresponding to the type of query. The display unit displays the search result by a display method according to the type of the query.

実施形態に係る文書検索装置のブロック図。1 is a block diagram of a document search apparatus according to an embodiment. クエリーの種類を示す図。The figure which shows the kind of query. クエリーの入力方法を説明するための図。The figure for demonstrating the input method of a query. 筆跡の方向に応じた区別を説明するための図。The figure for demonstrating the distinction according to the direction of handwriting. クエリー判定の処理を示すフローチャート。The flowchart which shows the process of query determination. 形状判定の処理を示すフローチャート。The flowchart which shows the process of shape determination. 閉ループ判定の処理を示すフローチャート。The flowchart which shows the process of closed loop determination. インクデータ構造を示す図。The figure which shows an ink data structure. 検索結果の表示例を示す図。The figure which shows the example of a display of a search result. 実施形態に係る文書検索装置のハードウェア構成図。1 is a hardware configuration diagram of a document search apparatus according to an embodiment. ネットワークを介して手書き文書データを共有するシステムの一例を示す図。The figure which shows an example of the system which shares handwritten document data via a network. 閉ループの内側に筆跡が含まれるか否かを判定する処理を説明するための図。The figure for demonstrating the process which determines whether a handwriting is contained inside a closed loop. 横線の近傍上部に筆跡があるか否かを判定する処理を説明するための図。The figure for demonstrating the process which determines whether there exists a handwriting in the vicinity upper part of a horizontal line.

以下、実施の形態について、図面を参照して説明する。
本実施形態は、検索対象およびクエリーを手書きのデータとする場合の検索システムに関する。すなわち本システムは、検索対象を「手書き文書」とし、検索に用いられるクエリーを手書きした文字等を用いたクエリー(以下「手書きクエリー」と称する)とするような、言語非依存の検索システムを主に対象とする。手書きクエリーは、文字に限らず、マーク、線等、ユーザが描画したものを含む。
Hereinafter, embodiments will be described with reference to the drawings.
The present embodiment relates to a search system when a search target and a query are handwritten data. In other words, this system is mainly a language-independent search system in which the search target is a “handwritten document” and the query used for the search is a query using handwritten characters (hereinafter referred to as “handwritten query”). Target. The handwritten query includes not only characters but also those drawn by the user such as marks and lines.

しかし、検索対象をテキスト文書としてもよい。この場合、手書きクエリーをテキストクエリーに変換して検索を行う。また、検索対象を手書き文書とし、検索に用いられるクエリーをテキストクエリーとしてもよい。この場合、テキストクエリーを手書きクエリーに変換して検索を行う。いずれのシステム例においても、以下で説明する実施形態に従って手書きクエリーの種類を判定し、手書きクエリーの種類に応じた検索方法により検索を実行し、これに応じた適切な表示方法で検索結果を表示する。   However, the search target may be a text document. In this case, the handwritten query is converted into a text query and a search is performed. The search target may be a handwritten document, and the query used for the search may be a text query. In this case, the text query is converted into a handwritten query and a search is performed. In any system example, the type of the handwritten query is determined according to the embodiment described below, the search is executed by a search method according to the type of the handwritten query, and the search result is displayed by an appropriate display method according to the search method. To do.

本実施形態では、手書きクエリーの種類の内訳を例えば「文字列」、「1画マーク」、「下線」、「囲み線」としている。手書きクエリーの種類に応じて、類似またはマッチする手書き文書内の検索対象は異なる。例えば、手書きクエリーの種類が文字列の場合には、文字列それ自体が検索対象である。1画マークの場合には、1画マークそれ自体を検索したい場合だけではない。1画マークの場合、検索対象は、当該一画マークの前後の文字列である。手書きクエリーの種類が下線や囲み線の場合、検索したいのはその下に下線が付された文字列や、囲み線で囲まれた文字列である。   In the present embodiment, the breakdown of the types of handwritten queries is, for example, “character string”, “single stroke mark”, “underline”, and “border line”. Depending on the type of handwritten query, search targets in similar or matching handwritten documents differ. For example, when the type of handwritten query is a character string, the character string itself is a search target. In the case of a one-stroke mark, it is not only the case that one-stroke mark itself is to be searched. In the case of a single stroke mark, the search target is a character string before and after the single stroke mark. When the type of the handwritten query is an underline or a surrounding line, what is desired to be searched is a character string underlined or a character string surrounded by the surrounding line.

なお、手書きクエリーの種類としては上記のみに限定されない。当業者であれば、本開示に基づき、手書きクエリーの種類を拡大し、逆に手書きクエリーの種類を削減するなどして実施の形態を変更することができる。   Note that the type of handwritten query is not limited to the above. A person skilled in the art can change the embodiment by expanding the types of handwritten queries and conversely reducing the types of handwritten queries based on the present disclosure.

図1に示すように、実施形態に係る文書検索装置は、筆跡のデータを取得する取得部1と、クエリーの種類を判定するクエリー判定部2と、文書を検索する検索部3と、手書き文書データベース(DB)4と、検索結果を表示する検索結果表示部5を備える。   As shown in FIG. 1, the document search apparatus according to the embodiment includes an acquisition unit 1 that acquires handwriting data, a query determination unit 2 that determines a type of query, a search unit 3 that searches for a document, and a handwritten document. A database (DB) 4 and a search result display unit 5 for displaying search results are provided.

取得部1は、座標データを含む筆跡のデータを取得する。   The acquisition unit 1 acquires handwriting data including coordinate data.

取得部1により取得される筆跡のデータは、1画(ストローク)ごとに分離された座標の時系列データを持ち、例えば次のように表される。
画1:(x(1,1),y(1,1)), (x(1,2),y(1,2)),…, (x(1,N(1)),y(1,N(1)))
画2:(x(2,1),y(2,1)), (x(2,2),y(2,2)),…, (x(2,N(2)),y(2,N(2)))

ただし、N(i)は画iサンプリング時の点数である。
なお、手書き文書DB4に格納される手書き文書についても、上記のような筆跡のデータを有する。
The handwriting data acquired by the acquisition unit 1 has time-series data of coordinates separated for each stroke (stroke), and is expressed as follows, for example.
Picture 1: (x (1,1), y (1,1)), (x (1,2), y (1,2)), ..., (x (1, N (1)), y ( 1, N (1)))
Picture 2: (x (2,1), y (2,1)), (x (2,2), y (2,2)), ..., (x (2, N (2)), y ( 2, N (2)))
...
N (i) is the number of points at the time of sampling i.
The handwritten document stored in the handwritten document DB 4 also has handwriting data as described above.

図2にクエリーの種類を凡例によって示す。上述したように、本実施形態ではクエリーの種類を文字列、1画マーク、下線、囲み線のいずれかとしている。これらは筆跡の形状によって分類される。図2において、参照数字20で示されるのは文字列のクエリーである。これは、例えば「アイデア」という文字列を手書き入力(あるいは手書き文書中で選択)したものである。文字列の内容は「アイデア」という文字列のみならず任意であることは言うまでもない。なお、ここでいう文字列とは、一連の文字コードからなるテキストとは異なり、筆跡の形状が文字列であることを意味する。参照数字21で示されるのは1画マークのクエリーである。これは、例えば星印を手書き入力(あるいは手書き文書中で選択)したものである。例えば、1画マークは、ユーザの注目度が他と異なる部分に区別するために付される。また、手書き文書において箇条書きをするために行頭に筆記される場合もある。参照数字22で示されるのは下線のクエリーである。下線は、手書き文書において文字列を強調するために筆記される場合が多い。参照数字23で示されるのは囲み線のクエリーである。囲み線は、手書き文書において下線と同様に文字列を強調したり、特定の文字列を他の文字列とは区別するために筆記される場合が多い。
クエリー判定部2は、取得部1により取得された筆跡の座標データに基づいて当該筆跡の形状を判定することにより、上記クエリーの種類を判定する。クエリーの種類を判定する具体的な処理については後述する。
FIG. 2 shows the types of queries by legend. As described above, in this embodiment, the type of query is any one of a character string, a single stroke mark, an underline, and a surrounding line. These are classified according to the shape of the handwriting. In FIG. 2, the reference numeral 20 indicates a character string query. This is, for example, a character string “idea” input by handwriting (or selected in a handwritten document). It goes without saying that the content of the character string is arbitrary as well as the character string “idea”. Note that the character string here means that the shape of the handwriting is a character string, unlike text consisting of a series of character codes. Reference numeral 21 indicates a one-stroke mark query. This is, for example, a star that has been input by handwriting (or selected in a handwritten document). For example, the one-stroke mark is added to distinguish a portion where the degree of attention of the user is different from others. In some cases, a handwritten document is written at the beginning of a line to be bulleted. Reference numeral 22 indicates an underlined query. The underline is often written to emphasize a character string in a handwritten document. Reference numeral 23 indicates an enclosing line query. The encircled line is often written in a handwritten document in order to emphasize a character string in the same manner as an underline, or to distinguish a specific character string from other character strings.
The query determination unit 2 determines the type of the query by determining the shape of the handwriting based on the handwriting coordinate data acquired by the acquisition unit 1. Specific processing for determining the type of query will be described later.

図3を参照してクエリーの入力方法を説明する。クエリーの入力方法としては(i)直接手書き、(ii)直接手書き選択、(iii)間接手書き選択がある。   A query input method will be described with reference to FIG. Query input methods include (i) direct handwriting, (ii) direct handwriting selection, and (iii) indirect handwriting selection.

(i)直接手書きは、検索入力において、クエリーとなる筆跡をユーザが入力デバイス(スタイラスペン等)を用いて手書き入力する方法である。図3において、直接手書きされたクエリーの例30は「アイデア」という文字列であり、同クエリーの例31は星印の1画マークであり、同クエリーの例32は下線であり、同クエリーの例33は囲み線である。主には、検索入力エリアを提示し、ユーザが検索入力エリアに直接入力して実行される。   (I) Direct handwriting is a method in which a user manually inputs a handwriting as a query using an input device (such as a stylus pen) in search input. In FIG. 3, a directly handwritten query example 30 is a character string “idea”, the query example 31 is an asterisk one-stroke mark, and the query example 32 is underlined. Example 33 is a box line. Mainly, a search input area is presented, and a user directly inputs into the search input area for execution.

(ii)直接手書き選択は、上記のようにクエリーそれ自体を手書き入力するのではなく、表示された手書き文書中でクエリーとすべき筆跡を直接的に選択する方法である。例えばユーザが対角線34を描くように入力デバイスを操作することにより、対角線34により規定される矩形内の筆跡35(この例では「アイデア」)を直接的に選択する。あるいは、筆跡36そのものを入力デバイスや指でタップすることにより直接的に選択する。   (Ii) Direct handwriting selection is a method for directly selecting a handwriting to be a query in a displayed handwritten document, instead of handwriting input of the query itself as described above. For example, when the user operates the input device so as to draw the diagonal line 34, the handwriting 35 (in this example, “idea”) within the rectangle defined by the diagonal line 34 is directly selected. Alternatively, the handwriting 36 itself is directly selected by tapping with an input device or a finger.

(iii)間接手書き選択は、表示された手書き文書中でクエリーとすべき筆跡を間接的に選択する方法である。例えば、ユーザが下線37を描くように入力デバイスを操作することにより、下線37に隣接する上側の筆跡38(この例では「アイデア」)を間接的に選択する。あるいは、囲み線39を描くように入力デバイスを操作することにより、囲み線39の内側の筆跡40(この例では「アイデア」)を間接的に選択する。   (Iii) Indirect handwriting selection is a method of indirectly selecting a handwriting to be a query in a displayed handwritten document. For example, when the user operates the input device to draw the underline 37, the upper handwriting 38 (“idea” in this example) adjacent to the underline 37 is indirectly selected. Alternatively, the handwriting 40 (in this example, “idea”) inside the surrounding line 39 is indirectly selected by operating the input device to draw the surrounding line 39.

上記(iii)間接手書き選択において、クエリー入力のためにユーザが下線37を描くように入力デバイスを操作することを示したが、下線37を描いた際の筆跡の方向をクエリー判定部2が判定し、その結果に応じて下線37の処理を異ならせてもよい。筆跡の方向は、上述した筆跡のデータの時系列における座標値の大小関係から判断することができる。例えば、図4(a)に示すように、下線37を紙面左から右の方向に筆記した場合には、これをクエリー入力とするのではなく、通常の下線の筆跡(クエリーでない筆跡)とする。一方、図4(b)に示すように、下線37を紙面右から左の方向に筆記した場合には、これをクエリー入力として扱う。具体的には、図3を参照して説明したように下線37に隣接する上側の筆跡42(この例では「アイデア」)を間接的に選択する。なお、囲み線等の他の筆跡についても同様に筆跡の方向を判定してもよい。例えば、時計回りに筆記した囲み線を通常の筆跡とし、反時計回りに筆記した囲み線の場合には、図3を参照して説明したように間接手書き選択であるという判定をしてもよい。このように筆跡の方向判定に応じて処理を異ならせることにより、手書き検索のユーザーインタフェースを適切に構成することができる。   In the above (iii) indirect handwriting selection, it is shown that the user operates the input device to draw the underline 37 for query input, but the query determination unit 2 determines the direction of the handwriting when the underline 37 is drawn. However, the processing of the underline 37 may be varied depending on the result. The direction of the handwriting can be determined from the magnitude relationship of the coordinate values in the time series of the handwriting data described above. For example, as shown in FIG. 4A, when the underline 37 is written in the direction from the left to the right of the page, it is not used as a query input, but is used as a normal underline handwriting (handwriting which is not a query). . On the other hand, as shown in FIG. 4B, when the underline 37 is written in the direction from the right to the left of the page, this is handled as a query input. Specifically, as described with reference to FIG. 3, the upper handwriting 42 (“idea” in this example) adjacent to the underline 37 is indirectly selected. Note that the direction of the handwriting may be similarly determined for other handwriting such as a surrounding line. For example, in the case of an encircling line written in a clockwise direction as a normal handwriting and an encircling line written in a counterclockwise direction, it may be determined that the selection is indirect handwriting as described with reference to FIG. . In this way, by changing the processing according to the direction determination of the handwriting, the user interface for handwriting search can be appropriately configured.

クエリーの種類を判定する具体的な処理について図5のフローチャートを参照して説明する。   A specific process for determining the type of query will be described with reference to the flowchart of FIG.

ステップS1において入力筆跡の形状判定を行う。クエリー判定部2は、取得部1により取得されたクエリー入力の筆跡データに含まれる座標データに基づいて、その筆跡の形状を判定することによりクエリーの種類を文字列、一画マーク、下線、囲み線のいずれかに判定する。   In step S1, the shape of the input handwriting is determined. The query determination unit 2 determines the shape of the handwriting based on the coordinate data included in the handwriting data of the query input acquired by the acquisition unit 1, thereby determining the type of the query as a character string, a single stroke mark, an underline, an enclosure Determine to one of the lines.

図6は、形状判定の処理を示すフローチャートである。この形状判定の処理は、取得部1により取得された筆跡の座標データに基づいて行われる。   FIG. 6 is a flowchart showing the shape determination process. The shape determination process is performed based on handwriting coordinate data acquired by the acquisition unit 1.

図6のステップS11において、入力クエリー(入力筆跡)が1画であるか複数画であるかを判定する。「1画」の場合には、ステップS12において、その1画の筆跡が閉ループを構成しているか否かを判定する。閉ループ判定の処理を、図7を参照して説明する。折れ線P,P,..Pn−1,Pが閉曲線であるかを判定する。折れ線の各線分をL=Pi+1で表す。このとき、LとL(i<j)が交差しているかどうかを調べ、交差している場合、P[i],...P[j+1]が閉曲線を構成していると判定する。例えば、図7の例では、線分L[2]とL[7]が交わっていて、P[2],..,P[8]が閉曲線を構成している。さらに、ストロークの始点から終点までの距離を計算し、これがストロークの全長と比較して小さいならば、閉ループと判定する。図6のステップS12において閉ループと判定された場合には、ステップ15において、閉ループの内側に筆跡が含まれるか否かを判定する。 In step S11 of FIG. 6, it is determined whether the input query (input handwriting) is a single stroke or multiple strokes. In the case of “one stroke”, it is determined in step S12 whether or not the stroke of the one stroke constitutes a closed loop. The closed loop determination process will be described with reference to FIG. Plot lines P 1 , P 2 ,. . It is determined whether P n−1 and P n are closed curves. Each line segment of the broken line is represented by L i = P i P i + 1 . At this time, it is checked whether L i and L j (i <j) intersect. If they intersect, P [i],. . . It is determined that P [j + 1] constitutes a closed curve. For example, in the example of FIG. 7, line segments L [2] and L [7] intersect, and P [2],. . , P [8] constitute a closed curve. Further, the distance from the start point to the end point of the stroke is calculated. If this is smaller than the total length of the stroke, it is determined that the loop is closed. If it is determined in step S12 in FIG. 6 that the loop is closed, it is determined in step 15 whether or not handwriting is included inside the closed loop.

閉ループの内側に筆跡が含まれるか否かを判定する処理を、図12を参照して説明する。判定対象となる筆跡の各点Q[1],Q[2],…,Q[M]がすべて閉ループ曲線内にあるとき、閉ループ内に筆跡が含まれると判定する。閉ループ内に点Qが含まれるかどうかは、次のように判定することができる。閉ループ曲線をP[1](X[1],Y[1]),P[2](X[2],Y[2]),…,P[N−1](X[N−1],Y[N−1])とし、判定対象の点をQ(X,Y)とする。   Processing for determining whether or not handwriting is included inside the closed loop will be described with reference to FIG. When each point Q [1], Q [2],..., Q [M] of the handwriting to be determined is within the closed loop curve, it is determined that the handwriting is included in the closed loop. Whether or not the point Q is included in the closed loop can be determined as follows. P [1] (X [1], Y [1]), P [2] (X [2], Y [2]),..., P [N-1] (X [N-1]) , Y [N−1]), and the point to be determined is Q (X, Y).

(1)2点P[i]、P[i+1]を通る直線f[i](x,y)=0を
f(x,y)=(Y[i+1]−Y[i])*(x−X[i])−(X[i+1]−X[i])*(y−Y[i])=0
として計算する。ただし、i=Nのときは、2点P[N]、P[0]を通る直線f[N](x,y)=0となる。
(1) A straight line f [i] (x, y) = 0 passing through two points P [i] and P [i + 1]
f (x, y) = (Y [i + 1] −Y [i]) * (x−X [i]) − (X [i + 1] −X [i]) * (y−Y [i]) = 0
Calculate as However, when i = N, the straight line f [N] (x, y) = 0 passing through the two points P [N] and P [0].

(2)Q(X,Y)が直線の進行方向に対してどちら側にあるかを判定する。このためf[i](X,Y)を計算する。この値が正なら直線の進行方向に対して右側、負なら左側になる。 (2) It is determined which side Q (X, Y) is on the straight line traveling direction. Therefore, f [i] (X, Y) is calculated. If this value is positive, it is on the right side of the straight line direction, and if it is negative, it is on the left side.

(3)上記(1)(2)をすべてのiについて繰り返し、Q(X,Y)がすべての直線f[i](X,Y)で同じ符号を取れば、Qは閉ループの内側にあると判定する。 (3) Repeat (1) and (2) above for all i, and if Q (X, Y) takes the same sign for all straight lines f [i] (X, Y), then Q is inside the closed loop Is determined.

ステップS15において閉ループと判定された場合には、クエリーの種類は「囲み線」であると判定する。   If it is determined in step S15 that the loop is closed, it is determined that the type of query is “border”.

ステップS12またはステップS15において閉ループと判定されなかった場合には、ステップS13において、当該1画の筆跡は横線であるかを判定する。例えば、公知の直線回帰問題を解き、折れ線を直線で当てはめる。その処理で求められる回帰誤差が閾値以内であれば直線と判定する。直線と判定できた場合、直線の傾きの絶対値が一定値以下であれば横向きと判定する。ステップS13において、横線と判定された場合には、ステップ16において、横線の近傍上部に筆跡があるか否かを判定する。   If the closed loop is not determined in step S12 or step S15, it is determined in step S13 whether the handwriting of the one stroke is a horizontal line. For example, a known linear regression problem is solved and a broken line is fitted with a straight line. If the regression error obtained by the processing is within the threshold, it is determined as a straight line. If it can be determined that the line is straight, it is determined to be in the horizontal direction if the absolute value of the inclination of the line is equal to or less than a certain value. If it is determined in step S13 that the line is a horizontal line, it is determined in step 16 whether or not there is a handwriting near the top of the horizontal line.

横線の近傍上部に筆跡があるか否かを判定する処理を、図13を参照して説明する。   Processing for determining whether or not there is a handwriting near the top of the horizontal line will be described with reference to FIG.

判定対象となる筆跡の各点Q[1],Q[2],…,Q[M]がすべて線分の上部近傍にあるとき、線分の上部近傍に筆跡があると判定する。線分の上部近傍に点Qがあるかどうかは次のように判定することができる。線分をP[1](X[1],Y[1]),P[2](X[2],Y[2])、ただし、X[1]<X[2]とし、判定対象の点をQ(X,Y)とする。以下の4式を同時に満たすとき、線分の上部近傍に点Qがあると判定することができる。   When each point Q [1], Q [2],..., Q [M] of the handwriting to be determined is near the upper part of the line segment, it is determined that there is a handwriting near the upper part of the line segment. Whether or not there is a point Q near the top of the line segment can be determined as follows. The line segment is P [1] (X [1], Y [1]), P [2] (X [2], Y [2]), where X [1] <X [2] Let Q (X, Y) be the point. When the following four expressions are satisfied at the same time, it can be determined that there is a point Q near the top of the line segment.

X[1]<X
X<X[2]
Y>(Y[1]+Y[2])/2
Y<(Y[1]+Y[2])/2+C
ただしCはあらかじめ定めた閾値である。
X [1] <X
X <X [2]
Y> (Y [1] + Y [2]) / 2
Y <(Y [1] + Y [2]) / 2 + C
However, C is a predetermined threshold value.

ステップS16において横線の近傍上部に筆跡があると判定された場合には、最終的にクエリーの種類は「下線」であると判定する。 If it is determined in step S16 that there is a handwriting near the top of the horizontal line, it is finally determined that the type of query is “underline”.

ステップS13またはステップS16において横線と判定されなかった場合には、ステップS14において、当該1画の筆跡はマークであるかを判定する。この場合、当該1画の筆跡と、あらかじめ決められたマーク(例:「○」、「△」、「☆」、「□」)との類似度を算出する。各マークとの類似度が一定値以下ならば「1画マーク」であると判定する。なお、あらかじめ決められたマークとの類似度を算出する具体的処理については例えば特許第3537949号明細書に記載された方法を用いてもよい。   If it is not determined that the line is a horizontal line in step S13 or step S16, it is determined in step S14 whether the handwriting of the one stroke is a mark. In this case, the degree of similarity between the one-stroke handwriting and a predetermined mark (eg, “◯”, “Δ”, “☆”, “□”) is calculated. If the degree of similarity with each mark is equal to or less than a certain value, it is determined that the mark is a “1-stroke mark”. For example, a method described in Japanese Patent No. 3537949 may be used as a specific process for calculating the similarity with a predetermined mark.

図6のステップS14においてマークと判定されなかった場合、ならびに、ステップS11において「複数画」と判定された場合には、クエリーの種類は「文字列」と判定する。   If it is not determined as a mark in step S14 of FIG. 6 and if it is determined as “multiple images” in step S11, the type of query is determined as “character string”.

図5のステップS2では、クエリー入力の方法が「直接筆記」であるかそれとも「選択」であるかを判定する(クエリー入力の方法については図3を参照されたい)。「直接筆記」の場合には、判定されたクエリーの種類とともに、入力された筆跡のデータをそのままクエリーとして出力する。「選択」の場合には、表示中の手書き文書からクエリーとすべき領域を選択することで筆跡のデータを抽出し、判定されたクエリーの種類とともに出力する。   In step S2 of FIG. 5, it is determined whether the query input method is “direct writing” or “selection” (refer to FIG. 3 for the query input method). In the case of “direct writing”, the input handwriting data is output as a query together with the determined query type. In the case of “selection”, handwriting data is extracted by selecting a region to be a query from the displayed handwritten document, and is output together with the determined type of query.

以上のように判定されたクエリーの種類および筆跡のデータは、クエリー判定部2から検索部3および検索結果表示部5に渡される。   The query type and handwriting data determined as described above are passed from the query determination unit 2 to the search unit 3 and the search result display unit 5.

次に、検索処理起動のタイミングについて説明する。本実施形態に係る検索処理は、(i)直接手書き筆記、(ii)直接手書き選択、(iii)間接手書き選択の各場面で検索実行をすることができる。(i)直接手書き筆記の場合、筆記入力後、検索ボタンをペンで選択した際に検索処理が実行される。これは、テキスト検索の際に、テキスト入力後に検索ボタンをマウスでクリックする一連の操作に似ている。検索入力エリアを提示する場合、ペンアップ時や所定時間入力がない場合に、入力された筆跡を検索すべき筆跡としてもよい。   Next, the search processing start timing will be described. The search process according to the present embodiment can execute a search in each of the scenes of (i) direct handwriting, (ii) direct handwriting selection, and (iii) indirect handwriting selection. (I) In the case of direct handwritten writing, a search process is executed when a search button is selected with a pen after writing. This is similar to a series of operations in which a search button is clicked with a mouse after text input during text search. When the search input area is presented, the input handwriting may be used as a handwriting to be searched when pen-up or when there is no input for a predetermined time.

(ii)直接手書き選択の場合には、クエリー筆跡が選択されたと判定した時点で以下を実行する。   (Ii) In the case of direct handwriting selection, the following is executed when it is determined that the query handwriting is selected.

(1)ペンアップ時に検索処理を実行する(おもに検索モード時)。   (1) A search process is executed at the time of pen-up (mainly in the search mode).

あるいは、
(2)ペンアップ時にコンテクストメニューやダイアログを表示して、ユーザに検索を行うか確認する。
Or
(2) Display a context menu or a dialog at the time of pen-up and confirm whether to perform a search to the user.

(iii)間接手書き選択の場合には、クエリー筆跡が選択されたと判定した時点で、上記(ii)と同様の動作を行う。   (Iii) In the case of indirect handwriting selection, when it is determined that the query handwriting has been selected, the same operation as in (ii) above is performed.

検索部3は、クエリー判定部2により判定されたクエリーの種類に応じた検索方法にしたがって手書き文書DB4から文書を検索することにより検索結果を得る。具体的には、以下のようにクエリーの種類に応じた検索方法にしたがって検索を行う。
(a)文字列:手書き文書DB4において当該文字列のクエリーに類似またはマッチする筆跡を検索する。
(b)1画マーク:手書き文書DB4において当該1画マークのクエリーに類似またはマッチする筆跡を検索する。ただし、当該1画マークが行頭から選択されたものである場合には、検索対象を行頭だけに限定するか、行頭にあるマークの優先順位を上げる等をしてもよい。
(c)下線:手書き文書DB4において、上側に筆跡が隣接している横線を検索する。
(d)囲み線:手書き文書DB4において、内側に筆跡が含まれる閉曲線を検索する。
ここで、文字列のクエリーに類似またはマッチする筆跡を手書き文書DB4から検索する処理の具体例について説明する。検索部3は、クエリーの筆跡を表すストローク列に類似するストローク列を例えば特徴ベクトルのマッチングによって検索する。ストロークデータ(筆跡データ)のより具体的な構造の例を図8を参照して説明する。
The search unit 3 obtains a search result by searching a document from the handwritten document DB 4 according to a search method according to the type of query determined by the query determination unit 2. Specifically, the search is performed according to a search method corresponding to the type of query as follows.
(A) Character string: The handwritten document DB 4 is searched for a handwriting that is similar to or matches the query for the character string.
(B) Single stroke mark: A handwriting similar to or matching with the single stroke mark query is searched in the handwritten document DB 4. However, if the one-stroke mark is selected from the beginning of the line, the search target may be limited to the beginning of the line or the priority of the mark at the beginning of the line may be increased.
(C) Underline: In the handwritten document DB 4, a horizontal line adjacent to the handwriting on the upper side is searched.
(D) Enclosed line: In the handwritten document DB 4, a closed curve including a handwriting inside is searched.
Here, a specific example of processing for searching the handwritten document DB 4 for a handwriting similar to or matching a character string query will be described. The search unit 3 searches for a stroke sequence similar to the stroke sequence representing the handwriting of the query, for example, by matching feature vectors. An example of a more specific structure of stroke data (handwriting data) will be described with reference to FIG.

「ストローク」とは、手書き入力された筆画であり、ペン等が入力面に接してから離れるまでの軌跡を表す。通常、所定のタイミングで(例えば一定周期で)軌跡上の点がサンプリングされるので、ストロークは、サンプリングされた点の系列により表現される。   A “stroke” is a handwritten input stroke and represents a trajectory from when the pen or the like touches the input surface until it leaves. Usually, since points on the trajectory are sampled at a predetermined timing (for example, at a constant period), the stroke is expressed by a series of sampled points.

図8(b)の例において、1ストローク分(すなわち、1画分)のストローク構造は、ペンが移動した平面上の座標値の集合(点構造)で表現され、具体的には、そのストロークを形成する点の個数を示す「点総数」、「開始時刻」、「外接図形」、点総数に相当する個数の「点構造」の配列を含む構造体である。ここで、開始時刻は、そのストロークにおいてペンが入力面に接して書き出された時刻を示す。外接図形は、文書平面上においてそのストロークの軌跡に対する外接図形(好ましくは、文書平面上においてそのストロークを内包する最小面積の矩形)を示す。   In the example of FIG. 8B, the stroke structure for one stroke (that is, one fraction) is expressed by a set of coordinate values (point structure) on the plane on which the pen has moved. Is a structure including an array of “point structure” indicating the number of points forming “number of points”, “start time”, “circumscribed figure”, and a number of “point structures” corresponding to the total number of points. Here, the start time indicates the time when the pen is written in contact with the input surface in the stroke. The circumscribed figure indicates a circumscribed figure (preferably, a rectangle with the smallest area that includes the stroke on the document plane) with respect to the locus of the stroke on the document plane.

点の構造は、入力デバイスに依存し得る。図8(c)の例では、1点の構造は、その点がサンプリングされた座標値x,y、筆圧並びに初期点(例えば上記の「開始時刻」)からの時間差の4値を持つ構造体である。   The point structure may depend on the input device. In the example of FIG. 8C, the structure of one point has a coordinate value x, y at which the point is sampled, a writing pressure, and a four-value difference of time from an initial point (for example, the above “start time”). Is the body.

なお、座標は文書平面の座標系であり、左上の隅の原点として右下の隅になるほど値が大きくなる正の値で表現しても良い。   Note that the coordinates are a coordinate system of the document plane, and may be expressed as a positive value whose value becomes larger as it goes to the lower right corner as the origin of the upper left corner.

また、入力デバイスが筆圧を取得できない場合或いは筆圧を取得できても以降の処理で筆圧を使用しない場合には、図8(c)の筆圧を省いても良いし或いは筆圧に無効を示すデータを記述しても良い。   In addition, when the input device cannot acquire the writing pressure, or when the writing pressure can be acquired but the writing pressure is not used in the subsequent processing, the writing pressure in FIG. 8C may be omitted or the writing pressure may be reduced. Data indicating invalidity may be described.

なお、図8(b),(c)の例において、ストローク構造における個々の点構造の領域に、座標値x,y等の実データを記載しても良いし、あるいは、ストローク構造のデータと点構造のデータとを別々に管理するものとして、ストローク構造における個々の点構造の領域に、対応する点構造へのリンク情報を記載しても良い。   In the example of FIGS. 8B and 8C, actual data such as coordinate values x and y may be described in the area of each point structure in the stroke structure, or the data of the stroke structure and As information for managing point structure data separately, link information to the corresponding point structure may be described in the area of each point structure in the stroke structure.

クエリーの筆跡を表すストローク列に類似するストローク列を検索する際の特徴ベクトルのマッチングの具体例としては、例えば、DPマッチング(DP;Dynamic Programming、動的計画法)を利用しても良い。なお、ユーザが指定するストローク列のストローク数と、ユーザが所望するストローク列のストローク数とは、必ずしも同じにはならない可能性がある。なぜならば、例えば筆記者によっては同じ文字の2画分を1画で筆記することなどがあり、同じ意味を有する文字列であっても、筆記者によって異なる画数で筆記される可能性があるからである。通常、ストロークに関するDPマッチングは、1ストローク対1ストロークの対応のみを扱い、2つのストローク列間の伸縮を許容した最適な対応付けを行う手法である。そこで、ここでは、例えば、1ストローク対Nストロークの対応も考慮したDPマッチングを用いることによって、筆画変動にロバストなマッチングが可能となる(例えば、“増田, 内田, 迫江, オンライン文字認識におけるDPマッチンク゛の実験的最適化, 電気関係学会九州支部連合大会, H.17. http://human.ait.kyushu-u.ac.jp/~uchida/Papers/masuda-shibu2005.pdf”を参照)。   For example, DP matching (DP; Dynamic Programming) may be used as a specific example of feature vector matching when searching for a stroke sequence similar to a stroke sequence representing the handwriting of a query. Note that the number of strokes specified by the user and the number of strokes desired by the user may not necessarily be the same. This is because, for example, some writers may write two strokes of the same character in one stroke, and even a character string having the same meaning may be written with a different number of strokes depending on the writer. It is. Normally, DP matching related to strokes is a method that handles only one-to-one stroke correspondence and performs an optimum association that allows expansion and contraction between two stroke sequences. Therefore, for example, by using DP matching that also takes into account the correspondence between 1 stroke and N stroke, it is possible to perform robust matching against stroke variations (for example, “DP in Masuda, Uchida, Sakoe, Online Character Recognition”). (See Matching experimental optimization, Electrical Engineering Society Kyushu Branch Association, H.17. Http://human.ait.kyushu-u.ac.jp/~uchida/Papers/masuda-shibu2005.pdf ”).

例えば、マッチングの対象となるストローク列に含まれる全てのストロークを始点として、ユーザが指定するクエリーであるストローク列との対応付けを行った後、ストローク列間の類似度を算出する。そして、各始点からの類似度を算出した後、降順にソートする。全てのストロークを始点とするため、オーバーラップした結果が得られる。その後、ピーク検出を行って、オーバーラップしたストロークの範囲を統合する。   For example, after associating with all strokes included in a stroke sequence to be matched as a starting point, a stroke sequence which is a query designated by the user, the similarity between the stroke sequences is calculated. And after calculating the similarity from each starting point, it sorts in descending order. Since all strokes are the starting points, overlapping results are obtained. Thereafter, peak detection is performed to integrate the overlapping stroke ranges.

なお、上記の他にも、種々のマッチング方法が可能である。   In addition to the above, various matching methods are possible.

検索結果表示部5は、検索部3により得られた検索結果をクエリーの種類に応じた表示方法で表示する。クエリーの種類ごとの結果表示方法としては、以下の2パターンの表示方法が考えられる。
(1)検索された筆跡と、検索筆跡に近接する筆跡とを表示する。
The search result display unit 5 displays the search result obtained by the search unit 3 by a display method according to the type of query. As a result display method for each type of query, the following two patterns of display methods can be considered.
(1) Display the searched handwriting and the handwriting close to the search handwriting.

(2)検索された筆跡を含む1ページ分の筆跡を表示する。   (2) One page of handwriting including the searched handwriting is displayed.

ただしどちらも、クエリーの種類によって次のように強調表示方法を変えることが好ましい。
(a)文字列:検索筆跡に近接する筆跡を含めて表示する。ただし、検索された筆跡自体は色を変えるなどして強調表示する。
(b)1画マーク:検索筆跡に近接する筆跡を含めて表示する。ただし、検索された筆跡自体とその後に続く1行分の筆跡は色を変えるなどして強調表示する。
In both cases, however, it is preferable to change the highlighting method according to the type of query as follows.
(A) Character string: Displayed including a handwriting close to the search handwriting. However, the searched handwriting itself is highlighted by changing the color.
(B) Single stroke mark: Displayed including a handwriting close to the search handwriting. However, the searched handwriting itself and the handwriting for one line following it are highlighted by changing the color or the like.

(c)下線:検索筆跡に近接する筆跡を含めて表示する。ただし、検索された筆跡自体とその上に近接する筆跡は色を変えるなどして強調表示する。   (C) Underline: A handwriting close to the search handwriting is included and displayed. However, the retrieved handwriting itself and the handwriting adjacent thereto are highlighted by changing the color.

(d)囲み線:検索筆跡について近接する筆跡を含めて表示する。ただし、検索された筆跡自体とその内部に含まれる筆跡は色を変えるなどして強調表示する。   (D) Surrounding line: The search handwriting is displayed including the handwriting adjacent to it. However, the searched handwriting itself and the handwriting contained therein are highlighted by changing the color or the like.

図9に検索結果の表示例を示す。図9(a)は、検索結果を示すウインドウ80において、検索筆跡(文字列)81に近接筆跡を含めた検索結果82を表示する例を示している。図9(b)は、検索された筆跡を含むページ83において、1画マーク85とともに該1画マーク85に続く筆跡を含んだ1行分の筆跡86を表示する例を示している。   FIG. 9 shows a display example of search results. FIG. 9A shows an example in which a search result 82 including a proximity handwriting in a search handwriting (character string) 81 is displayed in a window 80 showing the search result. FIG. 9B shows an example in which, on the page 83 including the searched handwriting, a one-line mark 85 and one line of handwriting 86 including the handwriting following the one-stroke mark 85 are displayed.

以下説明した実施形態によれば、手書きクエリーの種類を判定し、手書きクエリーの種類に応じた検索方法により検索を実行し、これに応じた適切な表示方法で検索結果を表示することができる。したがって、クエリーの種類に応じた検索方法により的確な検索を行えるようになる。   According to the embodiment described below, it is possible to determine the type of handwritten query, execute a search by a search method according to the type of handwritten query, and display the search result by an appropriate display method according to this. Therefore, an accurate search can be performed by a search method corresponding to the type of query.

以下、本実施形態のバリエーションについて説明する。   Hereinafter, variations of the present embodiment will be described.

本実施形態の検索部3は、文書検索装置の内部の手書き文書DB4に蓄積されている手書き文書群を検索対象としても良いし、文書検索装置がイントラネット及び/又はインターネット等のネットワークに接続可能である場合に、ネットワークを介してアクセス可能な手書き文書群を検索対象としても良いし、文書検索装置に接続されたリムーバブル・メモリ内に蓄積された手書き文書群を検索対象としても良いし、それらの任意の組み合わせであっても良い。   The search unit 3 of the present embodiment may search for a handwritten document group stored in the handwritten document DB 4 inside the document search device, and the document search device can be connected to a network such as an intranet and / or the Internet. In some cases, a group of handwritten documents accessible via a network may be searched, a group of handwritten documents stored in a removable memory connected to the document search apparatus may be searched, Any combination may be used.

本実施形態の文書検索装置は、スタンドアローンの装置として構成することも、ネットワークを介して通信可能な複数のノードに分散した形で構成することも可能である。   The document search apparatus according to the present embodiment can be configured as a stand-alone apparatus or can be configured in a distributed form among a plurality of nodes that can communicate via a network.

また、本実施形態の文書検索装置は、デスクトップ型又はラップトップ型の汎用計算機、携帯型の汎用計算機、その他の携帯型の情報機器、タッチパネルを有する情報機器、スマートフォン、その他の情報処理装置など、様々なデバイスによって実現可能である。   In addition, the document search apparatus according to the present embodiment includes a desktop or laptop general-purpose computer, a portable general-purpose computer, other portable information devices, information devices having a touch panel, smartphones, other information processing devices, and the like. It can be realized by various devices.

図10に、本実施形態の文書検索装置を実現するハードウェアの構成例を示す。図中、201はCPU、202は所定の入力デバイス、203は所定の出力デバイス、204はRAM、205はROM、206は外部メモリ・インタフェース、207は通信インタフェースである。例えば、タッチパネルを使用する場合には、例えば液晶パネルとペンと液晶パネル上に設けられたストローク検出装置等が利用される(図中、208参照)。   FIG. 10 shows a configuration example of hardware that realizes the document search apparatus according to the present embodiment. In the figure, 201 is a CPU, 202 is a predetermined input device, 203 is a predetermined output device, 204 is a RAM, 205 is a ROM, 206 is an external memory interface, and 207 is a communication interface. For example, when a touch panel is used, for example, a liquid crystal panel, a pen, and a stroke detection device provided on the liquid crystal panel are used (see 208 in the figure).

また、例えば、図1の構成の一部分をクライアント上に設け、図1の構成の残りの部分をサーバ上に設けることも可能である。   Further, for example, a part of the configuration of FIG. 1 can be provided on the client, and the remaining part of the configuration of FIG. 1 can be provided on the server.

例えば、図11は、イントラネット及び/又はインターネット等のネットワーク300上にサーバ303が存在し、各クライアント301,302がネットワーク300を介してそれぞれサーバ303と通信することによって、本実施形態の文書検索装置が実現する様子を例示している。   For example, FIG. 11 shows that the server 303 exists on a network 300 such as an intranet and / or the Internet, and the clients 301 and 302 communicate with the server 303 via the network 300, respectively. This illustrates how this is realized.

なお、クライアント301は、無線通信を介してネットワーク300に接続され、クライアント302は、有線通信を介してネットワーク302に接続される場合を例示している。   Note that the client 301 is connected to the network 300 via wireless communication, and the client 302 is connected to the network 302 via wired communication.

クライアント301,302は、通常、ユーザ装置である。サーバ303は、例えば、企業内LAN等のLAN上に設けられたものであっても良いし、インターネット・サービス・プロバイダ等が運営するものであっても良い。また、サーバ303がユーザ装置であって、あるユーザが他のユーザに機能を提供するものであっても良い。   The clients 301 and 302 are usually user devices. For example, the server 303 may be provided on a LAN such as a corporate LAN or may be operated by an Internet service provider or the like. Further, the server 303 may be a user device, and a certain user may provide functions to other users.

図1の構成を、クライアントとサーバに分散する方法として、種々の方法が考えられる。   Various methods can be considered as a method of distributing the configuration of FIG. 1 to the client and the server.

また、上述の実施形態の中で示した処理手順に示された指示は、ソフトウェアであるプログラムに基づいて実行されることが可能である。汎用の計算機システムが、このプログラムを予め記憶しておき、このプログラムを読み込むことにより、上述した実施形態の文書検索装置による効果と同様な効果を得ることも可能である。上述の実施形態で記述された指示は、コンピュータに実行させることのできるプログラムとして、磁気ディスク(フレキシブルディスク、ハードディスクなど)、光ディスク(CD−ROM、CD−R、CD−RW、DVD−ROM、DVD±R、DVD±RWなど)、半導体メモリ、またはこれに類する記録媒体に記録される。コンピュータまたは組み込みシステムが読み取り可能な記録媒体であれば、その記憶形式は何れの形態であってもよい。コンピュータは、この記録媒体からプログラムを読み込み、このプログラムに基づいてプログラムに記述されている指示をCPUで実行させれば、上述した実施形態の文書検索装置と同様な動作を実現することができる。もちろん、コンピュータがプログラムを取得する場合または読み込む場合はネットワークを通じて取得または読み込んでもよい。
また、記録媒体からコンピュータや組み込みシステムにインストールされたプログラムの指示に基づきコンピュータ上で稼働しているOS(オペレーティングシステム)や、データベース管理ソフト、ネットワーク等のMW(ミドルウェア)等が本実施形態を実現するための各処理の一部を実行してもよい。
さらに、本実施形態における記録媒体は、コンピュータあるいは組み込みシステムと独立した媒体に限らず、LANやインターネット等により伝達されたプログラムをダウンロードして記憶または一時記憶した記録媒体も含まれる。
また、記録媒体は1つに限られず、複数の媒体から本実施形態における処理が実行される場合も、本実施形態における記録媒体に含まれ、媒体の構成は何れの構成であってもよい。
The instructions shown in the processing procedure shown in the above embodiment can be executed based on a program that is software. The general-purpose computer system stores this program in advance and reads this program, so that it is possible to obtain the same effect as that obtained by the document search apparatus of the above-described embodiment. The instructions described in the above-described embodiments are, as programs that can be executed by a computer, magnetic disks (flexible disks, hard disks, etc.), optical disks (CD-ROM, CD-R, CD-RW, DVD-ROM, DVD). ± R, DVD ± RW, etc.), semiconductor memory, or a similar recording medium. As long as the recording medium is readable by the computer or the embedded system, the storage format may be any form. If the computer reads the program from the recording medium and causes the CPU to execute instructions described in the program based on the program, the same operation as that of the document search apparatus of the above-described embodiment can be realized. Of course, when the computer acquires or reads the program, it may be acquired or read through a network.
In addition, the OS (operating system), database management software, MW (middleware) such as a network, etc. running on the computer based on the instructions of the program installed in the computer or embedded system from the recording medium implement this embodiment. A part of each process for performing may be executed.
Furthermore, the recording medium in the present embodiment is not limited to a medium independent of a computer or an embedded system, but also includes a recording medium in which a program transmitted via a LAN, the Internet, or the like is downloaded and stored or temporarily stored.
Further, the number of recording media is not limited to one, and when the processing in this embodiment is executed from a plurality of media, it is included in the recording medium in this embodiment, and the configuration of the media may be any configuration.

なお、本実施形態におけるコンピュータまたは組み込みシステムは、記録媒体に記憶されたプログラムに基づき、本実施形態における各処理を実行するためのものであって、パソコン、マイコン等の1つからなる装置、複数の装置がネットワーク接続されたシステム等の何れの構成であってもよい。
また、本実施形態におけるコンピュータとは、パソコンに限らず、情報処理機器に含まれる演算処理装置、マイコン等も含み、プログラムによって本実施形態における機能を実現することが可能な機器、装置を総称している。
The computer or the embedded system in the present embodiment is for executing each process in the present embodiment based on a program stored in a recording medium. The computer or the embedded system includes a single device such as a personal computer or a microcomputer. The system may be any configuration such as a system connected to the network.
In addition, the computer in this embodiment is not limited to a personal computer, but includes an arithmetic processing device, a microcomputer, and the like included in an information processing device, and is a generic term for devices and devices that can realize the functions in this embodiment by a program. ing.

本発明のいくつかの実施形態を説明したが、これらの実施形態は、例として提示したものであり、発明の範囲を限定することは意図していない。これら新規な実施形態は、その他の様々な形態で実施されることが可能であり、発明の要旨を逸脱しない範囲で、種々の省略、置き換え、変更を行うことができる。これら実施形態やその変形は、発明の範囲や要旨に含まれるとともに、特許請求の範囲に記載された発明とその均等の範囲に含まれる。   Although several embodiments of the present invention have been described, these embodiments are presented by way of example and are not intended to limit the scope of the invention. These novel embodiments can be implemented in various other forms, and various omissions, replacements, and changes can be made without departing from the scope of the invention. These embodiments and modifications thereof are included in the scope and gist of the invention, and are included in the invention described in the claims and the equivalents thereof.

1…取得部、2…クエリー判定部、3…検索部、4…手書き文書データベース(DB)、5…検索結果表示部。   DESCRIPTION OF SYMBOLS 1 ... Acquisition part, 2 ... Query determination part, 3 ... Search part, 4 ... Handwritten document database (DB), 5 ... Search result display part.

Claims (12)

座標データを含む筆跡のデータを取得する取得手段と、
前記座標データに基づいて、文字列、一画マーク、下線、囲み線のいずれか一つを含むクエリーの種類分類し、前記クエリーの種類に応じた検索方法にしたがって文書を検索する検手段と、
を備える文書検索装置。
An acquisition means for acquiring handwriting data including coordinate data;
Based on the coordinate data, character strings, Ichikaku mark, underlining, classifies the types of queries that contain one of the encircling line, search that searches a document according to the search method corresponding to the type of the query Means ,
Ru with a document retrieval apparatus.
前記クエリーの種類が前記文字列の場合には、前記筆跡に類似する手書き文書内の筆跡を検索し、
前記クエリーの種類が一画マークの場合には、前記筆跡に類似する前記手書き文書内の行頭の筆跡を高い優先度で検索し、
前記クエリーの種類が下線の場合には、上側に筆跡が隣接している前記手書き文書内の横線を検索し、
前記クエリーの種類が囲み線の場合には、筆跡を内包する前記手書き文書内の閉曲線を検索する、請求項1記載の装置。
If the query type is the character string, search for a handwriting in a handwritten document similar to the handwriting,
If the query type is a one-stroke mark, the handwriting at the beginning of the line in the handwritten document similar to the handwriting is searched with high priority,
If the type of query is underlined, search for a horizontal line in the handwritten document with handwriting adjacent on the upper side,
The apparatus according to claim 1, wherein when the type of the query is an encircling line, a closed curve in the handwritten document including a handwriting is searched.
前記種類に応じた検索方法にしたがって検索した検索結果を表示する表示手段を更に備え
前記検索結果は、前記クエリーの種類に応じて強調表示される請求項1記載の装置。
Comprising the further display means for displaying a search result of a search according to the search method in accordance with the type,
The apparatus according to claim 1, wherein the search result is highlighted according to a type of the query.
前記種類に応じた検索方法にしたがって検索した検索結果を表示する表示手段を更に備え
前記検索結果としては、前記クエリーの種類と前記検索された検索結果を含んだ筆跡とが表示される請求項1記載の装置。
Comprising the further display means for displaying a search result of a search according to the search method in accordance with the type,
The apparatus according to claim 1, wherein the search result includes a type of the query and a handwriting including the searched search result.
取得手段が、座標データを含む筆跡のデータを取得するステップと、
検索手段が、前記座標データに基づいて、文字列、一画マーク、下線、囲み線のいずれか一つを含むクエリーの種類分類し、前記クエリーの種類に応じた検索方法にしたがって文書を検索するステップと、を備える文書検索方法。
An acquisition means for acquiring handwriting data including coordinate data; and
Search means, based on the coordinate data, character strings, Ichikaku mark, classified into types of queries, including underline, any one of the encircling line, searching a document according to the search method corresponding to the type of the query and to Luz step, document retrieval method Ru equipped with.
前記クエリーの種類が前記文字列の場合には、前記筆跡に類似する手書き文書内の筆跡を検索し、
前記クエリーの種類が一画マークの場合には、前記筆跡に類似する前記手書き文書内の行頭の筆跡を高い優先度で検索し、
前記クエリーの種類が下線の場合には、上側に筆跡が隣接している前記手書き文書内の横線を検索し、
前記クエリーの種類が囲み線の場合には、筆跡を内包する前記手書き文書内の閉曲線を検索する、請求項5記載の方法。
If the query type is the character string, search for a handwriting in a handwritten document similar to the handwriting,
If the query type is a one-stroke mark, the handwriting at the beginning of the line in the handwritten document similar to the handwriting is searched with high priority,
If the type of query is underlined, search for a horizontal line in the handwritten document with handwriting adjacent on the upper side,
The method according to claim 5, wherein, when the type of the query is a surrounding line, a closed curve in the handwritten document that includes a handwriting is searched.
表示手段が、前記種類に応じた検索方法にしたがって検索した検索結果を表示するステップを更に備え
前記検索結果は、前記クエリーの種類に応じて強調表示される請求項5記載の方法。
Display means, further to comprising the step of displaying the search result of a search according to the search method in accordance with the type,
The method according to claim 5, wherein the search result is highlighted according to a type of the query.
表示手段が、前記種類に応じた検索方法にしたがって検索した検索結果を表示するステップを更に備え
前記検索結果としては、前記クエリーの種類と前記検索された検索結果を含んだ筆跡とが表示される請求項5記載の方法。
Display means, further to comprising the step of displaying the search result of a search according to the search method in accordance with the type,
The method according to claim 5, wherein the search result includes a type of the query and a handwriting including the searched search result.
コンピュータを、
座標データを含む筆跡のデータを取得する取得手段
前記座標データに基づいて、文字列、一画マーク、下線、囲み線のいずれか一つを含むクエリーの種類分類し、前記クエリーの種類に応じた検索方法にしたがって文書を検索する検手段
として機能させるためのプログラム。
Computer
Acquisition means for acquiring handwriting data including coordinate data;
Based on the coordinate data, character strings, Ichikaku mark, underlining, classifies the types of queries that contain one of the encircling line, search that searches a document according to the search method corresponding to the type of the query Means ,
Program to function as.
前記クエリーの種類が前記文字列の場合には、前記筆跡に類似する手書き文書内の筆跡を検索し、
前記クエリーの種類が一画マークの場合には、前記筆跡に類似する前記手書き文書内の行頭の筆跡を高い優先度で検索し、
前記クエリーの種類が下線の場合には、上側に筆跡が隣接している前記手書き文書内の横線を検索し、
前記クエリーの種類が囲み線の場合には、筆跡を内包する前記手書き文書内の閉曲線を検索する、請求項9記載のプログラム。
If the query type is the character string, search for a handwriting in a handwritten document similar to the handwriting,
If the query type is a one-stroke mark, the handwriting at the beginning of the line in the handwritten document similar to the handwriting is searched with high priority,
If the type of query is underlined, search for a horizontal line in the handwritten document with handwriting adjacent on the upper side,
The program according to claim 9, wherein when the type of the query is an encircling line, a closed curve in the handwritten document that includes a handwriting is searched.
前記種類に応じた検索方法にしたがって検索した検索結果を表示する表示手段として更に機能させ、
前記検索結果は、前記クエリーの種類に応じて強調表示される請求項9記載のプログラム。
Further function as a display means for displaying a search result searched according to the search method according to the type,
The program according to claim 9, wherein the search result is highlighted according to the type of the query.
前記種類に応じた検索方法にしたがって検索した検索結果を表示する表示手段として更に機能させ、
前記検索結果としては、前記クエリーの種類と前記検索された検索結果を含んだ筆跡とが表示される請求項9記載のプログラム。
Further function as a display means for displaying a search result searched according to the search method according to the type,
The program according to claim 9, wherein as the search result, a type of the query and a handwriting including the searched search result are displayed.
JP2015014601A 2015-01-28 2015-01-28 Document search apparatus, method and program Active JP5911981B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2015014601A JP5911981B2 (en) 2015-01-28 2015-01-28 Document search apparatus, method and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2015014601A JP5911981B2 (en) 2015-01-28 2015-01-28 Document search apparatus, method and program

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2012121306A Division JP5694236B2 (en) 2012-05-28 2012-05-28 Document search apparatus, method and program

Publications (2)

Publication Number Publication Date
JP2015079544A JP2015079544A (en) 2015-04-23
JP5911981B2 true JP5911981B2 (en) 2016-04-27

Family

ID=53010842

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015014601A Active JP5911981B2 (en) 2015-01-28 2015-01-28 Document search apparatus, method and program

Country Status (1)

Country Link
JP (1) JP5911981B2 (en)

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63228874A (en) * 1987-03-17 1988-09-22 Nec Corp Image file system and its device
JP4098880B2 (en) * 1997-06-06 2008-06-11 松下電器産業株式会社 Information retrieval device
JP2007042050A (en) * 2005-06-30 2007-02-15 Canon Inc Information processor, information processing controlling method, and program
JP2007317022A (en) * 2006-05-26 2007-12-06 Canon Inc Handwritten character processor and method for processing handwritten character

Also Published As

Publication number Publication date
JP2015079544A (en) 2015-04-23

Similar Documents

Publication Publication Date Title
RU2702270C2 (en) Detection of handwritten fragment selection
US7778464B2 (en) Apparatus and method for searching for digital ink query
US20140143721A1 (en) Information processing device, information processing method, and computer program product
US20180067640A1 (en) Formula inputting method and apparatus
JP5832980B2 (en) Handwriting input support device, method and program
JP5774558B2 (en) Handwritten document processing apparatus, method and program
JP2008250375A (en) Character input device, method, and program
JP2007317022A (en) Handwritten character processor and method for processing handwritten character
JP2007109118A (en) Input instruction processing apparatus and input instruction processing program
JP5717691B2 (en) Handwritten character search device, method and program
JP5694236B2 (en) Document search apparatus, method and program
CN114365075A (en) Method for selecting a graphical object and corresponding device
JP4817297B2 (en) Character search device
WO2015161823A1 (en) Handwriting recognition method and device
JP2013246732A (en) Handwritten character retrieval apparatus, method and program
JP2014215911A (en) Interest area estimation device, method, and program
JP5735126B2 (en) System and handwriting search method
JP6223687B2 (en) Electronic device and handwritten document search method
JP5911981B2 (en) Document search apparatus, method and program
JP6655331B2 (en) Electronic equipment and methods
JP2011237993A (en) Information input device and information input program
JP2012108893A (en) Hand-written entry method
WO2016031016A1 (en) Electronic device, method, and program
JP6030172B2 (en) Handwritten character search device, method and program
WO2014181433A1 (en) Electronic device, handwritten document search method, and program

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20150128

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20151105

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20151110

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160112

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20160301

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20160330

R151 Written notification of patent or utility model registration

Ref document number: 5911981

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313121

Free format text: JAPANESE INTERMEDIATE CODE: R313117

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350