JP2014215911A - Interest area estimation device, method, and program - Google Patents
Interest area estimation device, method, and program Download PDFInfo
- Publication number
- JP2014215911A JP2014215911A JP2013094511A JP2013094511A JP2014215911A JP 2014215911 A JP2014215911 A JP 2014215911A JP 2013094511 A JP2013094511 A JP 2013094511A JP 2013094511 A JP2013094511 A JP 2013094511A JP 2014215911 A JP2014215911 A JP 2014215911A
- Authority
- JP
- Japan
- Prior art keywords
- attention area
- document
- stroke
- unit
- screen
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
- G06F3/048—Interaction techniques based on graphical user interfaces [GUI]
- G06F3/0484—Interaction techniques based on graphical user interfaces [GUI] for the control of specific functions or operations, e.g. selecting or manipulating an object, an image or a displayed text element, setting a parameter value or selecting a range
- G06F3/04842—Selection of displayed objects or displayed text elements
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
- G06F3/048—Interaction techniques based on graphical user interfaces [GUI]
- G06F3/0487—Interaction techniques based on graphical user interfaces [GUI] using specific features provided by the input device, e.g. functions controlled by the rotation of a mouse with dual sensing arrangements, or of the nature of the input device, e.g. tap gestures based on pressure sensed by a digitiser
- G06F3/0488—Interaction techniques based on graphical user interfaces [GUI] using specific features provided by the input device, e.g. functions controlled by the rotation of a mouse with dual sensing arrangements, or of the nature of the input device, e.g. tap gestures based on pressure sensed by a digitiser using a touch-screen or digitiser, e.g. input of commands through traced gestures
Abstract
Description
本発明の実施形態は、注目領域推定装置、方法およびプログラムに関する。 Embodiments described herein relate generally to a region-of-interest estimation apparatus, method, and program.
電子機器に対してペン入力などを用いた手書きによる文字入力方式は従来から広く利用されている。PDA(Personal Digital Assistant:携帯用情報端末)だけでなく、スマートフォンやタブレット型端末、ゲーム機の広がりに伴い、ペン入力機能を備えた機器も増えている。 2. Description of the Related Art Handwritten character input methods using pen input or the like have been widely used for electronic devices. Not only PDA (Personal Digital Assistant: portable information terminal) but also smartphones, tablet-type terminals, and devices with pen input functions are increasing with the spread of game machines.
こうした環境において、ユーザが文書中で注目した内容を手書きで下線を引いたり、丸で囲んだりすることで、領域を指定する方法がある。これは、従来から利用されるマウスによる文字列の始点と終点とをドラッグすることで文字列を選択するよりも、自由度が高く、ユーザがより直感的に注目する領域を指定することができる。 In such an environment, there is a method of designating an area by underlining a user's attention in a document by hand-drawing or underlining. This is more flexible than selecting a character string by dragging the start point and end point of a character string with a mouse that has been used in the past, and allows the user to specify an area that the user is more intuitively interested in. .
しかし、ユーザが注目した領域を、ペンなどによる手書きのストロークやマウスのフリーフォームなどで指定する場合、自由度が高いためにストロークによる指定範囲が明確ではなく、どの部分までを選択された範囲とするかが困難である。 However, when the user's attention area is specified by a handwritten stroke with a pen or the like or a free form of a mouse, the range specified by the stroke is not clear due to the high degree of freedom. It is difficult to do.
本開示は、上述の課題を解決するためになされたものであり、範囲指定における自由度を確保しつつ、選択範囲を特定することができる注目領域推定装置、方法およびプログラムを提供することを目的とする。 The present disclosure has been made to solve the above-described problem, and an object thereof is to provide a region-of-interest estimation apparatus, method, and program capable of specifying a selection range while ensuring a degree of freedom in range specification. And
本実施形態に係る注目領域推定装置は、第1取得部、ストローク取得部、変換部および推定部を含む。第1取得部は、複数の要素により構成される文書を取得する。ストローク取得部は、画面に表示される前記文書へのストロークの入力を受け付け、前記画面上の座標値で表される前記ストロークのサンプリング点を得る。変換部は、前記サンプリング点を、前記画面に表示された部分に対応する前記文書中での位置または該位置を含む前記文書中の要素を示す、対応点に変換する。推定部は、前記対応点に応じて、ユーザが関心を持つ領域である注目領域を前記要素から推定する。 The attention area estimation apparatus according to the present embodiment includes a first acquisition unit, a stroke acquisition unit, a conversion unit, and an estimation unit. The first acquisition unit acquires a document composed of a plurality of elements. The stroke acquisition unit receives an input of a stroke to the document displayed on the screen, and obtains a sampling point of the stroke represented by a coordinate value on the screen. The conversion unit converts the sampling point into a corresponding point indicating a position in the document corresponding to a portion displayed on the screen or an element in the document including the position. The estimation unit estimates a region of interest, which is a region of interest to the user, from the elements according to the corresponding points.
以下、図面を参照しながら本実施形態に係る注目領域推定装置、方法およびプログラムについて詳細に説明する。なお、以下の実施形態では、同一の参照符号を付した部分は同様の動作をおこなうものとして、重複する説明を適宜省略する。
(第1の実施形態)
第1の実施形態に係る注目領域推定装置について図1のブロック図を参照して説明する。
第1の実施形態に係る注目領域推定装置100は、閲覧情報取得部101、ストローク取得部102、位置変換部103および注目領域推定部104を含む。
Hereinafter, an attention area estimation apparatus, method, and program according to the present embodiment will be described in detail with reference to the drawings. Note that, in the following embodiments, the same reference numerals are assigned to the same operations, and duplicate descriptions are omitted as appropriate.
(First embodiment)
The attention area estimation apparatus according to the first embodiment will be described with reference to the block diagram of FIG.
A region of
閲覧情報取得部101は、外部から複数の要素により構成される文書、例えば構造化文書を取得する。構造化文書は、HTML(Hyper Text Markup Language)文書、XML(eXtensible Markup Language)文書、EPUB(登録商標)(Electronic PUBlication)文書、または文書作成アプリケーションなどにより作成された文書である。構造化文書は、例えば、HTML文書であれば、タグによって記述された複数のHTML要素を有し、これらのHTML要素は、開始タグ及び終了タグ、並びにこれらに囲まれる文字列(テキストデータ)から構成される。また、構造化文書が電子書籍の場合は、章、節、段落などの章立てを要素とする。なお、本実施形態では、ユーザが閲覧する構造化文書の一例としてHTML構造であるWebページを対象として説明する。ここで、Webページには、テキスト情報に加え、静止画像及び動画像が含まれてもよい。
The browsing
ストローク取得部102は、表示画面に対して描かれたストロークを一定間隔でサンプリングしてサンプリング点を得ることで、ユーザからのストロークを取得する。また、サンプリング点から、ストロークが入力された画面上の2次元の座標値と座標値を取得した時刻とを対応付けた情報であるストローク情報を得る。ストローク情報については、図3を参照して後述する。
ユーザから入力されるストロークは、例えば、タブレット端末やスマートフォンなどの表示画面にペンや指により入力される手書きストロークでもよく、ユーザがマウスを操作することによりフリーハンドで描かれるストロークでもよい。
The
The stroke input from the user may be, for example, a handwritten stroke input with a pen or a finger on a display screen of a tablet terminal or a smartphone, or may be a stroke drawn freehand by the user operating the mouse.
位置変換部103は、閲覧情報取得部101から構造化文書を、ストローク取得部102からストローク情報をそれぞれ取得する。位置変換部103は、サンプリング点を、ストローク情報に含まれる座標に基づいて対応点に変換する。対応点は、画面に表示された部分に対応する構造化文書中での位置、または、その位置を含む構造化文書中の要素を示す。なお、位置変換部103における変換処理は、webページを画面に表示する際に、画面に表示される画像が構造化文書中のどの部分であるかを抽出する既存の処理であればよく、ここでの詳細な説明は省略する。
注目領域推定部104は、位置変換部103から対応点を受け取り、構造化文書中の要素と対応点との関係に応じて、ストロークを入力したユーザが関心を持つ領域である注目領域を推定する。
The
The attention
次に、入力されるストロークの具体例について図2を参照して説明する。
ユーザは、注目する文字列または範囲に対して、下線を引いたり、線で囲むことにより、範囲を指定することができる。
例えば、図2(a)に示すように、ユーザが、文字列「ペンでスラスラと手書きできる端末」に興味があれば、下線を引くことで、興味がある文字列を指定することができる。また、図2(b)に示すように、ユーザが、文字列「ペンでスラスラと手書きできる端末」を線で囲んでもよい。このようにすることで、ユーザが興味がある文の範囲を指定することができる。
Next, a specific example of the input stroke will be described with reference to FIG.
The user can designate a range by drawing an underline or enclosing the target character string or range with a line.
For example, as shown in FIG. 2A, if the user is interested in a character string “a terminal that can be handwritten with a pen smoothly,” the underlined character string can be designated. Further, as shown in FIG. 2B, the user may surround a character string “terminal that can be handwritten with a pen with a pen” with a line. By doing in this way, the range of the sentence which a user is interested can be designated.
次に、ストローク取得部102で得られるストローク情報の一例について図3を参照して説明する。
ストローク取得部102は、図3に示すような、ストロークID301と座標値および時刻からなるストローク情報302との対応付けを得る。
ストロークID301は、ストロークの識別番号を示す。ストローク情報302は、画面にペンや指などが接触したときから、画面からペンや指などが離れる時までの、ストロークの一定の時間間隔によるサンプリング点の2次元座標値、および2次元座標値をサンプリングした時刻である。すなわち、1つのストロークID301により、ストロークの始点から終点までの一筆書きを表す。
具体的には、例えば、ストロークID301「1」とストローク情報302「(x1,x1,t1)、(x2,x2,t2)、・・・」とが対応付けられて、バッファ(図示せず)などに格納される。
Next, an example of stroke information obtained by the
The
The
Specifically, for example,
次に、注目領域推定部104における注目領域の推定方法について図4を参照して説明する。
図4(a)は、画面に表示されるwebページ上でのストローク401を示し、黒丸はストロークの代表点となるサンプリング点である。図4(b)は、画面に表示されるwebページのHTML構造上での、ストロークの対応点402を示す。
Next, an attention area estimation method in the attention
FIG. 4A shows a
注目領域の推定は、例えば、構造化文書の要素に含まれるストロークの対応点402の数が一番多い要素のブロック領域を注目領域として推定する。
図4(b)を参照すると、HTMLタグの要素403に含まれる対応点402の数と、HTMLタグの要素404に含まれる対応点402の数とを比較する。要素403に含まれる対応点402の数が、要素404に含まれる対応点402の数よりも多いので、要素403をユーザが注目する注目領域として推定すればよい。
In the estimation of the attention area, for example, the block area of the element having the largest number of
Referring to FIG. 4B, the number of
次に、注目領域推定部104における注目領域の推定方法の別例について図5を参照して説明する。
図5(a)は、画面に表示されるwebページ上でのストローク501を示し、黒丸はストロークの代表点となるサンプリング点である。図5(b)は、画面に表示されるwebページのHTML構造上での、ストロークの対応点502を示す。
Next, another example of an attention area estimation method in the attention
FIG. 5A shows a
図5(a)に示すように、ストロークのサンプリング点(対応点)の隣接する密度が高い場合、ゆっくりとストロークが引かれていることを表す。このような場合は、ストロークのサンプリング点(対応点)の密度が低い、すなわち素早く範囲を指定している場合に比べ、ユーザが注目するキーワードまたは文のみを指定してマーキングしている可能性が高い。よって、このような場合は、要素に含まれる文字列を文字単位で注目領域として推定する。 As shown in FIG. 5A, when the density of adjacent sampling points (corresponding points) of the stroke is high, it indicates that the stroke is slowly drawn. In such a case, the density of sampling points (corresponding points) of the stroke is low, that is, there is a possibility that marking is performed by specifying only the keyword or sentence that the user is interested in, compared to the case where the range is specified quickly. high. Therefore, in such a case, the character string included in the element is estimated as the attention area in units of characters.
次に、HTML要素の画面表示範囲とHTMLソースの構造との関係に基づく注目領域の判定について、図6を参照して説明する。
図6は、Webページを表示したときのページ全体601、画面の表示範囲602、表示範囲602に一部が表示されるwebページの段落603およびストロークで囲まれた注目領域604と、HTML構造を用いて記述された文書(webページのソース)との関係を示す。Webページの内容に対するユーザの注目の仕方としては、まずページ全体の中で画面に表示しているかどうかの第1段階がある。次に画面に表示されるページの中でストロークが入力された範囲があるかどうか第2段階がある。
Next, the determination of the attention area based on the relationship between the screen display range of the HTML element and the structure of the HTML source will be described with reference to FIG.
FIG. 6 shows an entire page 601 when a Web page is displayed, a screen display range 602, a web page paragraph 603 partially displayed in the display range 602, an attention area 604 surrounded by strokes, and an HTML structure. The relationship with the document (source of the web page) described by using is shown. As a way of attention of the user with respect to the contents of the Web page, there is a first stage as to whether or not it is displayed on the screen in the entire page. Next, there is a second stage whether or not there is a range where the stroke is input in the page displayed on the screen.
図6(a)で示される画面の表示範囲602において「スラスラと書ける」という言葉をペンによるストロークで囲った時点では、ページ内の単語「ITニュース」は、画面の表示範囲602にもwebページの段落603にも表示されていないページ全体601に含まれる文章であるため、ユーザには注目されていない。 In the screen display range 602 shown in FIG. 6A, the word “IT news” in the page is also displayed on the screen display range 602 at the time when the word “slurry can be written” is surrounded by a stroke with a pen. Since the text is included in the entire page 601 that is not displayed in the paragraph 603, the user does not pay attention.
一方、単語「新端末」「広告」「文字認識」および「スラスラと書ける」は、画面の表示範囲602に表示されているため、第1段階の注目領域に含まれることがわかる。さらに、単語「スラスラと書ける」はストロークで囲まれた注目領域604であり、第1段階より優先度が高い第2段階の注目領域となる。このように、表示範囲と段階を設けて、段階に応じた優先度と対応付けて注目領域を推定してもよい。 On the other hand, since the words “new terminal”, “advertisement”, “character recognition”, and “can be written as slack” are displayed in the display range 602 of the screen, it is understood that they are included in the attention area in the first stage. Further, the word “slurry can be written” is an attention area 604 surrounded by strokes, and is a second stage attention area having a higher priority than the first stage. As described above, the attention area may be estimated by providing the display range and the stage and associating the display range with the priority according to the stage.
次に、第1の実施形態に係る注目領域推定部104の動作について、図7のフローチャートを参照して説明する。
ステップS701では、閲覧情報取得部101が、構造化文書を取得する。
ステップS702では、ストローク取得部102が、ユーザからのストロークを取得する。
ステップS703では、位置変換部103が、画面上のストロークのサンプリング点を構造化文書中の対応点に変換する。
Next, the operation of the attention
In step S701, the browsing
In step S702, the
In step S703, the
ステップS704では、注目領域推定部104が、対応点の密度が閾値以上であるかどうかを判定する。対応点の密度が閾値以上であれば、ステップS705に進み、対応点の密度が閾値未満であれば、ステップS706へ進む。
ステップS705では、構造化文書の要素中の文字列を、対応点に応じて文字単位で抽出し、注目領域と推定する。
ステップS706では、対応点が複数の要素にまたがって含まれるかどうかを判定する。対応点が複数の要素にまたがる場合は、ステップS707へ進み、対応点が複数の要素にまたがらない、すなわち、1つの要素に収まる場合は、ステップS708へ進む。
In step S704, the attention
In step S705, the character string in the element of the structured document is extracted in character units according to the corresponding points, and is estimated as the attention area.
In step S706, it is determined whether or not the corresponding point is included across a plurality of elements. If the corresponding point extends over a plurality of elements, the process proceeds to step S707. If the corresponding point does not extend over a plurality of elements, that is, falls within one element, the process proceeds to step S708.
ステップS707では、最も多い対応点を含む要素中の文字列を注目領域として推定する。
ステップS708では、対応点を含む要素中の文字列を注目領域として推定する。以上で、第1の実施形態に係る注目領域推定装置の動作を終了する。
In step S707, the character string in the element including the most corresponding points is estimated as the attention area.
In step S708, the character string in the element including the corresponding point is estimated as the attention area. Above, operation | movement of the attention area estimation apparatus which concerns on 1st Embodiment is complete | finished.
以上に示した第1の実施形態によれば、入力されたストロークの位置および密度に応じて、ユーザが注目する注目領域を推定することで、範囲指定における自由度を確保しつつ、選択範囲を特定することができる。 According to the first embodiment described above, the selection range can be selected while ensuring the degree of freedom in range specification by estimating the attention area that the user pays attention to according to the position and density of the input stroke. Can be identified.
(第2の実施形態)
第2の実施形態では、新たに取得したストロークに応じて注目領域を調整する点が第1の実施形態と異なる。
一度注目領域を推定しても、ユーザが再びストロークを入力し、注目領域を書き直したり、注目領域の一部を削除したりすることが考えられる。このような場合、注目領域を修正可能とすることで、より柔軟にユーザが選択範囲を特定することができる。
(Second Embodiment)
The second embodiment is different from the first embodiment in that the attention area is adjusted according to the newly acquired stroke.
Once the attention area is estimated, it is conceivable that the user inputs a stroke again and rewrites the attention area or deletes a part of the attention area. In such a case, by allowing the attention area to be corrected, the user can specify the selection range more flexibly.
第2の実施形態に係る注目領域推定装置を図8のブロック図を参照して説明する。
第2の実施形態に係る注目領域推定装置800は、閲覧情報取得部101、ストローク取得部102、位置変換部103、注目領域推定部104、判定部801および領域修正部802を含む。
閲覧情報取得部101、ストローク取得部102、位置変換部103および注目領域推定部104については、第1の実施形態に係る注目領域推定装置100の構成と同様の動作を行うため、ここでの説明を省略する。
A region of interest estimation apparatus according to the second embodiment will be described with reference to the block diagram of FIG.
A region of
Since the browsing
判定部801は、位置変換部103から対応点を受け取り、ユーザが注目領域に対してどのような処理を加えたかを判定する。ユーザが注目領域へ加える処理としては、例えば、別の注目領域の追加、注目領域の拡大、注目領域の全削除または一部削除が挙げられる。判定部801は、対応点の位置および密度に応じて、ユーザが加えた処理を判定する。
領域修正部802は、判定部801から判定結果を受け取り、判定結果に応じて注目領域を修正する。
The
The
次に、判定部801および領域修正部802における修正処理について図9を参照して説明する。
図9は、画面上で表示されるテキストと、ユーザにより入力されるストロークとを示し、破線が注目領域外のテキスト、実線が注目領域内のテキスト、フリーハンドにより囲まれた楕円状の実線がストロークをそれぞれ示す。
Next, correction processing in the
FIG. 9 shows the text displayed on the screen and the stroke input by the user. The broken line is the text outside the attention area, the solid line is the text within the attention area, and the elliptical solid line surrounded by the freehand Each stroke is shown.
判定部801では、ストロークが追記されると、追記されたストロークの種類および領域に応じて、既存のストロークによる注目領域の位置との関係からどの処理が必要であるかを判定する。
例えば図9(a)は、既存の注目領域に、別の注目領域が追加される例である。まず、(a1)に示すように、既存の注目領域が推定されている場合を想定する。続いて、(a2)に示すように、既存の注目領域から離れた領域にストロークが入力された場合、別の注目領域と判定される。この場合は、(a3)に示すように、最初のストロークが入力された場合と同様に、新しい注目領域が追加される。
When the stroke is added, the
For example, FIG. 9A shows an example in which another attention area is added to the existing attention area. First, as shown in (a1), the case where the existing attention area is estimated is assumed. Subsequently, as shown in (a2), when a stroke is input to an area away from the existing attention area, it is determined as another attention area. In this case, as shown in (a3), a new attention area is added as in the case where the first stroke is input.
図9(b)は、注目領域を書き足す場合の例である。まず、(b1)のように、既存の注目領域が推定されており、(b2)のように、既存の注目領域に隣接する領域にストロークが記入された場合、追加範囲を包含する領域を新たに注目領域として設定する。領域の重なりの判定は、例えば既存のストロークに外接する最小の矩形と重なる点または面積が閾値以上であるかどうかにより判定することができる。結果として、(b3)のように、注目領域を拡大できる。
なお、領域が拡大されたことを明確にするため、例えば、(b4)のように、2つのストロークに内接する最大の矩形に含まれる部分のストロークを非表示とすることで、領域が結合されたことをわかりやすく表示してもよい。
FIG. 9B shows an example of adding a region of interest. First, when an existing attention area is estimated as shown in (b1) and a stroke is entered in an area adjacent to the existing attention area as shown in (b2), a new area including the additional range is newly created. Is set as the attention area. The determination of the overlap of the regions can be made based on, for example, whether or not the point or area that overlaps the smallest rectangle circumscribing the existing stroke is equal to or greater than a threshold value. As a result, the attention area can be expanded as shown in (b3).
In order to clarify that the area has been enlarged, for example, as shown in (b4), the areas included in the largest rectangle inscribed in the two strokes are hidden so that the areas are combined. May be displayed in an easy-to-understand manner.
図9(c)は、削除を表現するストロークにより、注目領域を縮小する例である。(c1)のような注目領域に対して、(c2)のように波線などで取り消しを示すストロークが入力された場合、(c3)のように注目領域が縮小される。取り消しを示す入力であることを判定する方法としては、塗りつぶしのように、短時間に狭い領域内を埋めることにより、対応点の密度が高くなるようなストロークが記入された場合に、削除を表現するストロークと判定すればよい。 FIG. 9C shows an example in which the attention area is reduced by a stroke expressing deletion. When a stroke indicating cancellation with a wavy line or the like is input to the attention area as in (c1), the attention area is reduced as in (c3). As a method of determining that the input is cancellation, a deletion is expressed when a stroke that fills a narrow area in a short time, such as filling, to increase the density of corresponding points. What is necessary is just to determine with the stroke to perform.
また、注目領域の一部取り消しを行った場合の扱いとして、取り消された領域の優先度を、図6の表示範囲602と同じ第1段階としてもよいし、画面に表示されない領域と同様の優先度としてもよい。 In addition, as a treatment when a part of the attention area is canceled, the priority of the canceled area may be set to the same first level as the display range 602 in FIG. 6 or the same priority as that of the area not displayed on the screen. It may be a degree.
次に、行頭へのマーキング例について図10を参照して説明する。
図10に示すように、文書の行頭にマーキングがされる場合は、マーキングされた行および、マーキングされた行を含む段落を注目領域と推定すればよい。
また、文の一部へマーキングされる場合は、線が引かれた単語および線で囲まれた単語、および、マーキングされた単語を含む文を注目領域と推定すればよい。
また、文全体へマーキングされる場合は、線が引かれた文および線で囲まれた文を注目領域とすればよい。
Next, an example of marking at the beginning of a line will be described with reference to FIG.
As shown in FIG. 10, when marking is performed at the beginning of a document, the marked line and the paragraph including the marked line may be estimated as the attention area.
When marking a part of a sentence, a word including a line, a word surrounded by the line, and a sentence including the marked word may be estimated as a region of interest.
Further, in the case where marking is performed on the entire sentence, a sentence with a line and a sentence surrounded by the line may be set as the attention area.
以上に示した第2の実施形態によれば、追加されるストロークがどのようなユーザの意図で記入されたかを判定することで、より柔軟な注目領域の推定をおこなうことができる。 According to the second embodiment described above, it is possible to estimate the attention area more flexibly by determining what kind of intention the user adds to the added stroke.
(第3の実施形態)
第3の実施形態では、注目領域を含む文書をキーワードにより検索する点が上述の実施形態と異なる。ユーザのマーキングがされた注目領域からキーワードを検索することで、ユーザの要求に沿った情報を提供することができる。
(Third embodiment)
The third embodiment is different from the above-described embodiment in that a document including a region of interest is searched using a keyword. By searching for a keyword from the attention area marked by the user, it is possible to provide information in accordance with the user's request.
第3の実施形態に係る注目領域推定装置を図11のブロック図を参照して説明する。
第3の実施形態に係る注目領域推定装置1100は、閲覧情報取得部101、ストローク取得部102、位置変換部103、注目領域推定部104、判定部801、領域修正部802、注目キーワード抽出部1101、注目領域格納部1102、検索部1103および表示部1104を含む。なお、第3の実施形態に係る注目領域推定装置1100は、判定部801および領域修正部802を含まない構成でもよい。
閲覧情報取得部101、ストローク取得部102、位置変換部103、注目領域推定部104、判定部801および領域修正部802については、第2の実施形態に係る注目領域推定装置100の構成と同様の動作を行うため、ここでの説明を省略する。
An attention area estimation apparatus according to a third embodiment will be described with reference to the block diagram of FIG.
An attention
About the browsing
注目キーワード抽出部1101は、注目領域推定部104から注目領域を受け取り、注目領域に含まれる文字列からキーワードを抽出する。キーワードの抽出は、形態素解析処理、固有表現抽出処理、予め登録された辞書に含まれる単語とのマッチングによる抽出処理などの一般的なキーワード抽出方法を用いればよく、ここでの説明を省略する。
注目領域格納部1102は、注目キーワード抽出部1101からキーワードと、注目領域に対応する構造化文書中の要素と、表示範囲に対応する構造化文書中の要素とを受け取って格納する。
The attention
The attention
検索部1103は、ユーザから検索対象とされる文字列である検索ワードの入力を受け取り、注目領域格納部1102に格納されるキーワードから、検索ワードと一致するキーワードを検索し、一致するキーワードとそのキーワードが含まれる注目領域を検索結果として得る。また、検索ワードと一致するキーワードが表示される表示範囲を検索結果としてもよい。
表示部1104は、検索部1103から検索対象とされる文字列、キーワード、および注目領域を受け取り、優先度に応じて画面に表示する。
The
The
なお、検索結果を得る際、キーワードを含む領域が、注目領域であるか、表示範囲であるか、または注目領域および表示範囲以外であるかに応じて、ユーザに提示するキーワードの優先度を設定してもよい。
例えば、図6を参照すれば、注目領域604に含まれるキーワードの優先度を最も高くし、表示範囲602に含まれるキーワードの優先度を2番目に高くし、注目領域および表示範囲以外で、表示範囲602に一部が表示されるwebページの段落603に含まれるキーワードの優先度を3番目に高くし、上記以外のページ全体601に含まれるキーワードの優先度を4番目に設定してもよい。
When obtaining the search result, the priority of the keyword to be presented to the user is set depending on whether the area including the keyword is the attention area, the display range, or the area other than the attention area and the display range. May be.
For example, referring to FIG. 6, the priority of the keyword included in the attention area 604 is the highest, the priority of the keyword included in the display range 602 is the second highest, and the display is performed outside the attention area and the display range. The priority of the keyword included in the paragraph 603 of the web page partially displayed in the range 602 may be set to the third highest, and the priority of the keyword included in the entire page 601 other than the above may be set to the fourth. .
また、第3の実施形態に係る注目領域推定装置1100に注目領域格納部1102を含まず、外部にある記憶装置にキーワードと、注目領域に対応する構造化文書中の要素と、表示範囲に対応する構造化文書中の要素とを格納してもよい。
In addition, the attention
次に、第3の実施形態に係るキーワード検索の一例について図12を参照して説明する。
図12は、検索された注目領域を含む文書をキーワードにより検索する例である。本実施形態では、検索は手書きタブレット端末の内部ストレージまたは外部のweb文書を検索することを示す。図12の例では、キーワード「実施」で検索した場合、注目領域として、ユーザが「実施」という単語をマーキングした注目領域の文書1201および文書1202が検索結果の上位として表示される。また、マーキングした範囲は異なるが表示画面の注目領域にキーワード「実施」を含む文書1203が表示される。すなわち、文書1203では、特許法第67条第1項の「特許出願の日から二十年」をマーキングしているが、文書1203中の特許法第67条第2項に「実施」という文言があるため、検索結果として、特許法第67条第1項および第2項を合わせて表示される。
Next, an example of a keyword search according to the third embodiment will be described with reference to FIG.
FIG. 12 is an example in which a document including the searched attention area is searched by a keyword. In the present embodiment, the search indicates searching the internal storage of the handwritten tablet terminal or an external web document. In the example of FIG. 12, when searching with the keyword “execution”, the
このようにすることで、例えば手書きタブレット端末を利用した学習において、検索したキーワードに関連した部分の文書も合わせて表示することができ、ユーザの学習効率を向上させることができる。 In this way, for example, in learning using a handwritten tablet terminal, a part of a document related to the searched keyword can be displayed together, and the learning efficiency of the user can be improved.
次に、閲覧内容に関連する文書の表示例について図13を参照して説明する。
図13(a)の例では、文書閲覧画面において、「公然実施」という単語がマーキングされた文書を閲覧している場合を示す。ユーザが閲覧している文書の内容に関連する情報を知りたい場合、関連資料検索ボタン1301を押すと、図13(b)に示すように、現在閲覧している文書と関連する内容の文書が「関連資料一覧」として表示される。
なお、現在閲覧している文書中の「公然実施」を含む文書が上位に表示されるが、マーキングされていない文書中のキーワードに関連する語を表示してもよい。例えば、「関連資料一覧」の右側にあるスクロールバー1302を下にスクロールさせることにより、現在の閲覧文書とつながりがある文書を順次表示させる。これによって、注目領域推定装置を含むタブレット端末などを利用するユーザの学習効率を向上させることができる。
Next, a display example of a document related to browsing contents will be described with reference to FIG.
The example in FIG. 13A shows a case where a document marked with the word “publicly implemented” is being browsed on the document browsing screen. When the user wants to know information related to the contents of the document being browsed, when the related
Note that a document including “publicly implemented” in the currently viewed document is displayed at the top, but a word related to a keyword in a document that is not marked may be displayed. For example, by scrolling down the
以上に示した第3の実施形態に係る注目領域推定装置によれば、蓄積された注目領域からキーワードを検索することで、ユーザがマーキングした、自身が興味がある注目領域からキーワードを提示し、さらに関連する注目領域の文書も提示することができるので、ユーザの関心項目を拡げ、学習の場合は学習効率を向上させることができる。 According to the attention area estimation device according to the third embodiment described above, by searching for a keyword from the accumulated attention area, the keyword is presented from the attention area that the user is interested in, Further, since a document of a related region of interest can be presented, the user's items of interest can be expanded, and learning efficiency can be improved in the case of learning.
上述の実施形態の中で示した処理手順に示された指示は、ソフトウェアであるプログラムに基づいて実行されることが可能である。汎用の計算機システムが、このプログラムを予め記憶しておき、このプログラムを読み込むことにより、上述した注目領域推定装置による効果と同様な効果を得ることも可能である。上述の実施形態で記述された指示は、コンピュータに実行させることのできるプログラムとして、磁気ディスク(フレキシブルディスク、ハードディスクなど)、光ディスク(CD−ROM、CD−R、CD−RW、DVD−ROM、DVD±R、DVD±RW、Blu−ray(登録商標)Discなど)、半導体メモリ、又はこれに類する記録媒体に記録される。コンピュータまたは組み込みシステムが読み取り可能な記録媒体であれば、その記憶形式は何れの形態であってもよい。コンピュータは、この記録媒体からプログラムを読み込み、このプログラムに基づいてプログラムに記述されている指示をCPUで実行させれば、上述した実施形態の注目領域推定装置と同様な動作を実現することができる。もちろん、コンピュータがプログラムを取得する場合又は読み込む場合はネットワークを通じて取得又は読み込んでもよい。
また、記録媒体からコンピュータや組み込みシステムにインストールされたプログラムの指示に基づきコンピュータ上で稼働しているOS(オペレーティングシステム)や、データベース管理ソフト、ネットワーク等のMW(ミドルウェア)等が本実施形態を実現するための各処理の一部を実行してもよい。
さらに、本実施形態における記録媒体は、コンピュータあるいは組み込みシステムと独立した媒体に限らず、LANやインターネット等により伝達されたプログラムをダウンロードして記憶または一時記憶した記録媒体も含まれる。
また、記録媒体は1つに限られず、複数の媒体から本実施形態における処理が実行される場合も、本実施形態における記録媒体に含まれ、媒体の構成は何れの構成であってもよい。
The instructions shown in the processing procedure shown in the above-described embodiment can be executed based on a program that is software. A general-purpose computer system stores this program in advance and reads this program, so that the same effect as that obtained by the attention area estimation device described above can be obtained. The instructions described in the above-described embodiments are, as programs that can be executed by a computer, magnetic disks (flexible disks, hard disks, etc.), optical disks (CD-ROM, CD-R, CD-RW, DVD-ROM, DVD). ± R, DVD ± RW, Blu-ray (registered trademark) Disc, etc.), semiconductor memory, or a similar recording medium. As long as the recording medium is readable by the computer or the embedded system, the storage format may be any form. If the computer reads the program from the recording medium and causes the CPU to execute instructions described in the program based on the program, the same operation as the attention area estimation device of the above-described embodiment can be realized. . Of course, when the computer acquires or reads the program, it may be acquired or read through a network.
In addition, the OS (operating system), database management software, MW (middleware) such as a network, etc. running on the computer based on the instructions of the program installed in the computer or embedded system from the recording medium implement this embodiment. A part of each process for performing may be executed.
Furthermore, the recording medium in the present embodiment is not limited to a medium independent of a computer or an embedded system, but also includes a recording medium in which a program transmitted via a LAN, the Internet, or the like is downloaded and stored or temporarily stored.
Further, the number of recording media is not limited to one, and when the processing in this embodiment is executed from a plurality of media, it is included in the recording medium in this embodiment, and the configuration of the media may be any configuration.
なお、本実施形態におけるコンピュータまたは組み込みシステムは、記録媒体に記憶されたプログラムに基づき、本実施形態における各処理を実行するためのものであって、パソコン、マイコン等の1つからなる装置、複数の装置がネットワーク接続されたシステム等の何れの構成であってもよい。
また、本実施形態におけるコンピュータとは、パソコンに限らず、情報処理機器に含まれる演算処理装置、マイコン等も含み、プログラムによって本実施形態における機能を実現することが可能な機器、装置を総称している。
The computer or the embedded system in the present embodiment is for executing each process in the present embodiment based on a program stored in a recording medium. The computer or the embedded system includes a single device such as a personal computer or a microcomputer. The system may be any configuration such as a system connected to the network.
In addition, the computer in this embodiment is not limited to a personal computer, but includes an arithmetic processing device, a microcomputer, and the like included in an information processing device. ing.
本発明のいくつかの実施形態を説明したが、これらの実施形態は、例として提示したものであり、発明の範囲を限定することは意図していない。これら新規な実施形態は、その他の様々な形態で実施されることが可能であり、発明の要旨を逸脱しない範囲で、種々の省略、置き換え、変更を行なうことができる。これら実施形態やその変形は、発明の範囲や要旨に含まれるとともに、特許請求の範囲に記載された発明とその均等の範囲に含まれる。 Although several embodiments of the present invention have been described, these embodiments are presented by way of example and are not intended to limit the scope of the invention. These novel embodiments can be implemented in various other forms, and various omissions, replacements, and changes can be made without departing from the spirit of the invention. These embodiments and modifications thereof are included in the scope and gist of the invention, and are included in the invention described in the claims and the equivalents thereof.
100,800,1100・・・注目領域推定装置、101・・・閲覧情報取得部、102・・・ストローク取得部、103・・・位置変換部、104・・・注目領域推定部、301・・・ストロークID、302・・・ストローク情報、401,501・・・ストローク、402,502・・・対応点、403,404・・・要素、601・・・ページ全体、602・・・表示範囲、603・・・段落、604・・・注目領域、801・・・判定部、802・・・領域修正部、1101・・・注目キーワード抽出部、1102・・・注目領域格納部、1103・・・検索部、1104・・・表示部、1201,1202,
1203・・・文書、1301・・・関連資料検索ボタン、1302・・・スクロールバー。
DESCRIPTION OF SYMBOLS 100,800,1100 ... attention area estimation apparatus, 101 ... browsing information acquisition part, 102 ... stroke acquisition part, 103 ... position conversion part, 104 ... attention area estimation part, 301 ... Stroke ID, 302 ... stroke information, 401,501 ... stroke, 402,502 ... corresponding points, 403,404 ... element, 601 ... entire page, 602 ... display range, 603... Paragraph, 604... Attention area, 801... Determination section, 802... Area correction section, 1101. Search unit, 1104... Display unit, 1201, 1202
1203 ... Document, 1301 ... Related material search button, 1302 ... Scroll bar.
Claims (11)
画面に表示される前記文書へのストロークの入力を受け付け、前記画面上の座標値で表される前記ストロークのサンプリング点を得る第2取得部と、
前記サンプリング点を、前記画面に表示された部分に対応する前記文書中での位置または該位置を含む前記文書中の要素を示す、対応点に変換する変換部と、
前記対応点に応じて、ユーザが関心を持つ領域である注目領域を前記要素から推定する推定部と、を具備することを特徴とする注目領域推定装置。 A first acquisition unit for acquiring a document composed of a plurality of elements;
A second acquisition unit that receives an input of a stroke to the document displayed on the screen and obtains a sampling point of the stroke represented by a coordinate value on the screen;
A conversion unit for converting the sampling point into a corresponding point indicating a position in the document corresponding to a portion displayed on the screen or an element in the document including the position;
An attention area estimation apparatus comprising: an estimation unit that estimates an attention area, which is an area of interest to a user, from the elements according to the corresponding points.
前記推定部は、前記構造化文書において、前記座標値を該構造化文書中の対応する位置にマッピングすることで前記対応点を得、該対応点を含む前記要素ごとのブロック領域を注目領域として推定することを特徴とする請求項1に記載の注目領域推定装置。 The first acquisition unit acquires a structured document including a plurality of elements,
The estimation unit obtains the corresponding point by mapping the coordinate value to a corresponding position in the structured document in the structured document, and sets a block region for each element including the corresponding point as a region of interest. The attention area estimation apparatus according to claim 1, wherein estimation is performed.
前記推定部は、前記ストローク情報に基づいて、前記ストロークの入力時間が短くかつ前記サンプリング点の隣接する密度が閾値未満である場合は、最も多くの対応点を含む要素に含まれるブロック領域を注目領域として推定し、前記ストロークの入力時間が長くかつ前記サンプリング点の隣接する密度が前記閾値以上である場合は、前記要素に含まれる文字列を文字単位で注目領域として推定することを特徴とする請求項1または請求項2に記載の注目領域推定装置。 The second acquisition unit obtains stroke information in which the coordinate value is associated with the time when the coordinate value is acquired,
The estimation unit pays attention to a block region included in an element including the most corresponding points when the input time of the stroke is short and the adjacent density of the sampling points is less than a threshold based on the stroke information. When the stroke input time is long and the adjacent density of the sampling points is greater than or equal to the threshold value, the character string included in the element is estimated as the attention area in units of characters. The attention area estimation apparatus according to claim 1 or 2.
前記新たに取得したストロークが、既存の注目領域を拡大するものである場合または既存の注目領域の一部または全てを削除するものである場合、前記注目領域の範囲を修正する修正部と、をさらに具備することを特徴とする請求項1から請求項4のいずれか1項に記載の注目領域推定装置。 A determination unit for determining whether the newly acquired stroke is to enlarge the existing attention area, to delete a part or all of the existing attention area, or to be another stroke;
When the newly acquired stroke is to enlarge an existing attention area or to delete a part or all of the existing attention area, a correction unit for correcting the range of the attention area, The attention area estimation apparatus according to any one of claims 1 to 4, further comprising:
前記検索部は、前記検索ワードと一致するキーワードを抽出した領域が前記注目領域であれば、該キーワードを前記ユーザに提示する優先度を最も高く設定し、該キーワードを抽出した領域が前記表示範囲であれば、該優先度を該注目領域よりも低く設定し、該キーワードを抽出した領域が該注目領域および該表示範囲以外であれば、該優先度を該表示範囲よりも低く設定して、ことを特徴とする請求項6に記載の注目領域推定装置。 A character string input by the user is used as a search word, and further includes a search unit for searching for a keyword,
If the area from which the keyword that matches the search word is extracted is the attention area, the search unit sets the highest priority for presenting the keyword to the user, and the area from which the keyword is extracted is the display range. If so, the priority is set lower than the attention area, and if the area from which the keyword is extracted is other than the attention area and the display range, the priority is set lower than the display range, The attention area estimation apparatus according to claim 6.
画面に表示される前記文書へのストロークの入力を受け付け、前記画面上の座標値で表される前記ストロークのサンプリング点を得、
前記サンプリング点を、前記画面に表示された部分に対応する前記文書中での位置または該位置を含む前記文書中の要素を示す、対応点に変換し、
前記対応点に応じて、ユーザが関心を持つ領域である注目領域を前記要素から推定することを特徴とする注目領域推定方法。 Get a document composed of multiple elements,
Accepting stroke input to the document displayed on the screen, obtaining the sampling point of the stroke represented by the coordinate value on the screen,
Converting the sampling point into a corresponding point indicating a position in the document corresponding to a portion displayed on the screen or an element in the document including the position;
A region-of-interest estimation method, wherein a region of interest, which is a region of interest to a user, is estimated from the elements according to the corresponding points.
複数の要素により構成される文書を取得する文書取得手段と、
画面に表示される前記文書へのストロークの入力を受け付け、前記画面上の座標値で表される前記ストロークのサンプリング点を得るストローク取得手段と、
前記サンプリング点を、前記画面に表示された部分に対応する前記文書中での位置または該位置を含む前記文書中の要素を示す、対応点に変換する変換手段と、
前記対応点に応じて、ユーザが関心を持つ領域である注目領域を前記要素から推定する推定手段として機能させるための注目領域推定プログラム。 Computer
Document acquisition means for acquiring a document composed of a plurality of elements;
Stroke acquisition means for accepting an input of a stroke to the document displayed on the screen and obtaining a sampling point of the stroke represented by a coordinate value on the screen;
Conversion means for converting the sampling point into a corresponding point indicating a position in the document corresponding to a portion displayed on the screen or an element in the document including the position;
A region-of-interest estimation program for causing a region of interest, which is a region of interest to a user, to function as an estimation unit that estimates from the element according to the corresponding point.
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013094511A JP2014215911A (en) | 2013-04-26 | 2013-04-26 | Interest area estimation device, method, and program |
US14/197,950 US20140325350A1 (en) | 2013-04-26 | 2014-03-05 | Target area estimation apparatus, method and program |
CN201410092451.2A CN104123074A (en) | 2013-04-26 | 2014-03-13 | Target area estimation apparatus, method and program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013094511A JP2014215911A (en) | 2013-04-26 | 2013-04-26 | Interest area estimation device, method, and program |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2014215911A true JP2014215911A (en) | 2014-11-17 |
Family
ID=51768505
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013094511A Pending JP2014215911A (en) | 2013-04-26 | 2013-04-26 | Interest area estimation device, method, and program |
Country Status (3)
Country | Link |
---|---|
US (1) | US20140325350A1 (en) |
JP (1) | JP2014215911A (en) |
CN (1) | CN104123074A (en) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101824360B1 (en) * | 2017-04-14 | 2018-01-31 | 한국 한의학 연구원 | Apparatus and method for anotating facial landmarks |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10423706B2 (en) | 2014-10-31 | 2019-09-24 | Xiaomi Inc. | Method and device for selecting information |
CN104461348B (en) * | 2014-10-31 | 2018-09-04 | 小米科技有限责任公司 | Information choosing method and device |
CN106708910A (en) * | 2015-11-18 | 2017-05-24 | 北大方正集团有限公司 | Underlined question processing method and device |
CN111859052B (en) * | 2020-07-20 | 2023-10-17 | 杭州今奥信息科技股份有限公司 | Grading display method and system for field investigation result |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7551187B2 (en) * | 2004-02-10 | 2009-06-23 | Microsoft Corporation | Systems and methods that utilize a dynamic digital zooming interface in connection with digital inking |
US7574048B2 (en) * | 2004-09-03 | 2009-08-11 | Microsoft Corporation | Freeform digital ink annotation recognition |
CN101063975A (en) * | 2007-02-15 | 2007-10-31 | 刘二中 | Method and system for electronic text-processing and searching |
US8407589B2 (en) * | 2007-04-20 | 2013-03-26 | Microsoft Corporation | Grouping writing regions of digital ink |
US9262390B2 (en) * | 2010-09-02 | 2016-02-16 | Lexis Nexis, A Division Of Reed Elsevier Inc. | Methods and systems for annotating electronic documents |
-
2013
- 2013-04-26 JP JP2013094511A patent/JP2014215911A/en active Pending
-
2014
- 2014-03-05 US US14/197,950 patent/US20140325350A1/en not_active Abandoned
- 2014-03-13 CN CN201410092451.2A patent/CN104123074A/en active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101824360B1 (en) * | 2017-04-14 | 2018-01-31 | 한국 한의학 연구원 | Apparatus and method for anotating facial landmarks |
Also Published As
Publication number | Publication date |
---|---|
US20140325350A1 (en) | 2014-10-30 |
CN104123074A (en) | 2014-10-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5159772B2 (en) | Document search apparatus and document search method | |
JP6462970B1 (en) | Classification device, classification method, generation method, classification program, and generation program | |
US20160026858A1 (en) | Image based search to identify objects in documents | |
US20130339840A1 (en) | System and method for logical chunking and restructuring websites | |
JP5832980B2 (en) | Handwriting input support device, method and program | |
CN102902697A (en) | Method and system for generating structured document guide view | |
JP5025808B1 (en) | Information processing apparatus and information processing program | |
JP2014215911A (en) | Interest area estimation device, method, and program | |
US20170322913A1 (en) | Stylizing text by replacing glyph with alternate glyph | |
JP5869179B2 (en) | Electronic device and handwritten document processing method | |
JP2015094978A (en) | Electronic device and method | |
JP5694236B2 (en) | Document search apparatus, method and program | |
JP5687312B2 (en) | Digital information analysis system, digital information analysis method, and digital information analysis program | |
JP6157965B2 (en) | Electronic device, method, and program | |
JP5345987B2 (en) | Document search apparatus, document search method, and document search program | |
JP2008262506A (en) | Information extraction system, information extraction method, and information extraction program | |
US20150178289A1 (en) | Identifying Semantically-Meaningful Text Selections | |
US20180330156A1 (en) | Detection of caption elements in documents | |
US20130226619A1 (en) | Input support device and input support method | |
US20140289247A1 (en) | Annotation search apparatus and method | |
US20150347376A1 (en) | Server-based platform for text proofreading | |
JP2010117941A (en) | Device for extracting primary content of web documents and program | |
JP6655331B2 (en) | Electronic equipment and methods | |
JP2014067303A (en) | Character recognition device and method and program | |
JP5162215B2 (en) | Data processing apparatus, data processing method, and program |