JP2014215911A - Interest area estimation device, method, and program - Google Patents

Interest area estimation device, method, and program Download PDF

Info

Publication number
JP2014215911A
JP2014215911A JP2013094511A JP2013094511A JP2014215911A JP 2014215911 A JP2014215911 A JP 2014215911A JP 2013094511 A JP2013094511 A JP 2013094511A JP 2013094511 A JP2013094511 A JP 2013094511A JP 2014215911 A JP2014215911 A JP 2014215911A
Authority
JP
Japan
Prior art keywords
attention area
document
stroke
unit
screen
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2013094511A
Other languages
Japanese (ja)
Inventor
昌之 岡本
Masayuki Okamoto
昌之 岡本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2013094511A priority Critical patent/JP2014215911A/en
Priority to US14/197,950 priority patent/US20140325350A1/en
Priority to CN201410092451.2A priority patent/CN104123074A/en
Publication of JP2014215911A publication Critical patent/JP2014215911A/en
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • G06F3/0484Interaction techniques based on graphical user interfaces [GUI] for the control of specific functions or operations, e.g. selecting or manipulating an object, an image or a displayed text element, setting a parameter value or selecting a range
    • G06F3/04842Selection of displayed objects or displayed text elements
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • G06F3/0487Interaction techniques based on graphical user interfaces [GUI] using specific features provided by the input device, e.g. functions controlled by the rotation of a mouse with dual sensing arrangements, or of the nature of the input device, e.g. tap gestures based on pressure sensed by a digitiser
    • G06F3/0488Interaction techniques based on graphical user interfaces [GUI] using specific features provided by the input device, e.g. functions controlled by the rotation of a mouse with dual sensing arrangements, or of the nature of the input device, e.g. tap gestures based on pressure sensed by a digitiser using a touch-screen or digitiser, e.g. input of commands through traced gestures

Abstract

PROBLEM TO BE SOLVED: To specify a selection range while securing freedom in range designation.SOLUTION: An interest area estimation device according to the present embodiment includes a first acquisition unit, a second acquisition unit, a conversion unit, and an estimation unit. The first acquisition unit acquires a document composed of a plurality of elements. The second acquisition unit accepts input of a stroke to the document displayed on a screen and obtains a sampling point of the stroke represented by a coordinate value on the screen. The conversion unit converts the sampling point into a correspondence point indicating a position in the document corresponding to a portion displayed on the screen or an element in the document including the position. The estimation unit estimates, from the element, an area of interest in accordance with the correspondence point, which is an area in which a user has interest.

Description

本発明の実施形態は、注目領域推定装置、方法およびプログラムに関する。   Embodiments described herein relate generally to a region-of-interest estimation apparatus, method, and program.

電子機器に対してペン入力などを用いた手書きによる文字入力方式は従来から広く利用されている。PDA(Personal Digital Assistant:携帯用情報端末)だけでなく、スマートフォンやタブレット型端末、ゲーム機の広がりに伴い、ペン入力機能を備えた機器も増えている。   2. Description of the Related Art Handwritten character input methods using pen input or the like have been widely used for electronic devices. Not only PDA (Personal Digital Assistant: portable information terminal) but also smartphones, tablet-type terminals, and devices with pen input functions are increasing with the spread of game machines.

こうした環境において、ユーザが文書中で注目した内容を手書きで下線を引いたり、丸で囲んだりすることで、領域を指定する方法がある。これは、従来から利用されるマウスによる文字列の始点と終点とをドラッグすることで文字列を選択するよりも、自由度が高く、ユーザがより直感的に注目する領域を指定することができる。   In such an environment, there is a method of designating an area by underlining a user's attention in a document by hand-drawing or underlining. This is more flexible than selecting a character string by dragging the start point and end point of a character string with a mouse that has been used in the past, and allows the user to specify an area that the user is more intuitively interested in. .

特開2006−85695号公報JP 2006-85695 A

しかし、ユーザが注目した領域を、ペンなどによる手書きのストロークやマウスのフリーフォームなどで指定する場合、自由度が高いためにストロークによる指定範囲が明確ではなく、どの部分までを選択された範囲とするかが困難である。   However, when the user's attention area is specified by a handwritten stroke with a pen or the like or a free form of a mouse, the range specified by the stroke is not clear due to the high degree of freedom. It is difficult to do.

本開示は、上述の課題を解決するためになされたものであり、範囲指定における自由度を確保しつつ、選択範囲を特定することができる注目領域推定装置、方法およびプログラムを提供することを目的とする。   The present disclosure has been made to solve the above-described problem, and an object thereof is to provide a region-of-interest estimation apparatus, method, and program capable of specifying a selection range while ensuring a degree of freedom in range specification. And

本実施形態に係る注目領域推定装置は、第1取得部、ストローク取得部、変換部および推定部を含む。第1取得部は、複数の要素により構成される文書を取得する。ストローク取得部は、画面に表示される前記文書へのストロークの入力を受け付け、前記画面上の座標値で表される前記ストロークのサンプリング点を得る。変換部は、前記サンプリング点を、前記画面に表示された部分に対応する前記文書中での位置または該位置を含む前記文書中の要素を示す、対応点に変換する。推定部は、前記対応点に応じて、ユーザが関心を持つ領域である注目領域を前記要素から推定する。   The attention area estimation apparatus according to the present embodiment includes a first acquisition unit, a stroke acquisition unit, a conversion unit, and an estimation unit. The first acquisition unit acquires a document composed of a plurality of elements. The stroke acquisition unit receives an input of a stroke to the document displayed on the screen, and obtains a sampling point of the stroke represented by a coordinate value on the screen. The conversion unit converts the sampling point into a corresponding point indicating a position in the document corresponding to a portion displayed on the screen or an element in the document including the position. The estimation unit estimates a region of interest, which is a region of interest to the user, from the elements according to the corresponding points.

第1の実施形態に係る注目領域推定装置を示すブロック図。The block diagram which shows the attention area estimation apparatus which concerns on 1st Embodiment. 入力されるストロークの具体例を示す図。The figure which shows the specific example of the input stroke. ストローク情報の一例を示すテーブル。The table which shows an example of stroke information. 注目領域の推定方法を示す図。The figure which shows the estimation method of an attention area. 注目領域の推定方法の別例を示す図。The figure which shows another example of the estimation method of an attention area. 文字区切り推定部おける検出および推定処理の一例を示す図。The figure which shows an example of the detection and estimation process in a character segment estimation part. 注目領域推定部の動作を示すフローチャート。The flowchart which shows operation | movement of an attention area estimation part. 第2の実施形態に係る注目領域推定装置を示すブロック図。The block diagram which shows the attention area estimation apparatus which concerns on 2nd Embodiment. 判定部および領域修正部における修正処理の一例を示す図。The figure which shows an example of the correction process in the determination part and an area | region correction part. 文の行頭へのマーキング例を示す図。The figure which shows the example of marking to the beginning of the sentence. 第3の実施形態に係る注目領域推定装置を示すブロック図。The block diagram which shows the attention area estimation apparatus which concerns on 3rd Embodiment. 検索部におけるキーワード検索の一例を示す図。The figure which shows an example of the keyword search in a search part. 閲覧内容に関連する文書の表示例を示す図。The figure which shows the example of a display of the document relevant to browsing content.

以下、図面を参照しながら本実施形態に係る注目領域推定装置、方法およびプログラムについて詳細に説明する。なお、以下の実施形態では、同一の参照符号を付した部分は同様の動作をおこなうものとして、重複する説明を適宜省略する。
(第1の実施形態)
第1の実施形態に係る注目領域推定装置について図1のブロック図を参照して説明する。
第1の実施形態に係る注目領域推定装置100は、閲覧情報取得部101、ストローク取得部102、位置変換部103および注目領域推定部104を含む。
Hereinafter, an attention area estimation apparatus, method, and program according to the present embodiment will be described in detail with reference to the drawings. Note that, in the following embodiments, the same reference numerals are assigned to the same operations, and duplicate descriptions are omitted as appropriate.
(First embodiment)
The attention area estimation apparatus according to the first embodiment will be described with reference to the block diagram of FIG.
A region of interest estimation apparatus 100 according to the first embodiment includes a browsing information acquisition unit 101, a stroke acquisition unit 102, a position conversion unit 103, and a region of interest estimation unit 104.

閲覧情報取得部101は、外部から複数の要素により構成される文書、例えば構造化文書を取得する。構造化文書は、HTML(Hyper Text Markup Language)文書、XML(eXtensible Markup Language)文書、EPUB(登録商標)(Electronic PUBlication)文書、または文書作成アプリケーションなどにより作成された文書である。構造化文書は、例えば、HTML文書であれば、タグによって記述された複数のHTML要素を有し、これらのHTML要素は、開始タグ及び終了タグ、並びにこれらに囲まれる文字列(テキストデータ)から構成される。また、構造化文書が電子書籍の場合は、章、節、段落などの章立てを要素とする。なお、本実施形態では、ユーザが閲覧する構造化文書の一例としてHTML構造であるWebページを対象として説明する。ここで、Webページには、テキスト情報に加え、静止画像及び動画像が含まれてもよい。   The browsing information acquisition unit 101 acquires a document composed of a plurality of elements, for example, a structured document from the outside. The structured document is an HTML (Hyper Text Markup Language) document, an XML (Extensible Markup Language) document, an EPUB (registered trademark) (Electronic PUBlication) document, or a document created by a document creation application. If the structured document is, for example, an HTML document, it has a plurality of HTML elements described by tags, and these HTML elements are derived from a start tag and an end tag, and a character string (text data) surrounded by them. Composed. In addition, when the structured document is an electronic book, chapters such as chapters, sections and paragraphs are used as elements. In the present embodiment, a Web page having an HTML structure will be described as an example of a structured document browsed by a user. Here, the Web page may include still images and moving images in addition to text information.

ストローク取得部102は、表示画面に対して描かれたストロークを一定間隔でサンプリングしてサンプリング点を得ることで、ユーザからのストロークを取得する。また、サンプリング点から、ストロークが入力された画面上の2次元の座標値と座標値を取得した時刻とを対応付けた情報であるストローク情報を得る。ストローク情報については、図3を参照して後述する。
ユーザから入力されるストロークは、例えば、タブレット端末やスマートフォンなどの表示画面にペンや指により入力される手書きストロークでもよく、ユーザがマウスを操作することによりフリーハンドで描かれるストロークでもよい。
The stroke acquisition unit 102 acquires the stroke from the user by sampling the stroke drawn on the display screen at regular intervals to obtain sampling points. Further, stroke information, which is information in which a two-dimensional coordinate value on the screen where the stroke is input and the time when the coordinate value is acquired, is associated from the sampling point is obtained. The stroke information will be described later with reference to FIG.
The stroke input from the user may be, for example, a handwritten stroke input with a pen or a finger on a display screen of a tablet terminal or a smartphone, or may be a stroke drawn freehand by the user operating the mouse.

位置変換部103は、閲覧情報取得部101から構造化文書を、ストローク取得部102からストローク情報をそれぞれ取得する。位置変換部103は、サンプリング点を、ストローク情報に含まれる座標に基づいて対応点に変換する。対応点は、画面に表示された部分に対応する構造化文書中での位置、または、その位置を含む構造化文書中の要素を示す。なお、位置変換部103における変換処理は、webページを画面に表示する際に、画面に表示される画像が構造化文書中のどの部分であるかを抽出する既存の処理であればよく、ここでの詳細な説明は省略する。
注目領域推定部104は、位置変換部103から対応点を受け取り、構造化文書中の要素と対応点との関係に応じて、ストロークを入力したユーザが関心を持つ領域である注目領域を推定する。
The position conversion unit 103 acquires a structured document from the browsing information acquisition unit 101 and stroke information from the stroke acquisition unit 102. The position conversion unit 103 converts the sampling points into corresponding points based on the coordinates included in the stroke information. The corresponding point indicates a position in the structured document corresponding to a portion displayed on the screen or an element in the structured document including the position. The conversion process in the position conversion unit 103 may be an existing process for extracting which part of the structured document the image displayed on the screen when displaying the web page on the screen. The detailed description in is omitted.
The attention area estimation unit 104 receives the corresponding points from the position conversion unit 103, and estimates the attention area, which is the area in which the user who has input the stroke is interested, according to the relationship between the elements in the structured document and the corresponding points. .

次に、入力されるストロークの具体例について図2を参照して説明する。
ユーザは、注目する文字列または範囲に対して、下線を引いたり、線で囲むことにより、範囲を指定することができる。
例えば、図2(a)に示すように、ユーザが、文字列「ペンでスラスラと手書きできる端末」に興味があれば、下線を引くことで、興味がある文字列を指定することができる。また、図2(b)に示すように、ユーザが、文字列「ペンでスラスラと手書きできる端末」を線で囲んでもよい。このようにすることで、ユーザが興味がある文の範囲を指定することができる。
Next, a specific example of the input stroke will be described with reference to FIG.
The user can designate a range by drawing an underline or enclosing the target character string or range with a line.
For example, as shown in FIG. 2A, if the user is interested in a character string “a terminal that can be handwritten with a pen smoothly,” the underlined character string can be designated. Further, as shown in FIG. 2B, the user may surround a character string “terminal that can be handwritten with a pen with a pen” with a line. By doing in this way, the range of the sentence which a user is interested can be designated.

次に、ストローク取得部102で得られるストローク情報の一例について図3を参照して説明する。
ストローク取得部102は、図3に示すような、ストロークID301と座標値および時刻からなるストローク情報302との対応付けを得る。
ストロークID301は、ストロークの識別番号を示す。ストローク情報302は、画面にペンや指などが接触したときから、画面からペンや指などが離れる時までの、ストロークの一定の時間間隔によるサンプリング点の2次元座標値、および2次元座標値をサンプリングした時刻である。すなわち、1つのストロークID301により、ストロークの始点から終点までの一筆書きを表す。
具体的には、例えば、ストロークID301「1」とストローク情報302「(x,x,t)、(x,x,t)、・・・」とが対応付けられて、バッファ(図示せず)などに格納される。
Next, an example of stroke information obtained by the stroke acquisition unit 102 will be described with reference to FIG.
The stroke acquisition unit 102 obtains an association between the stroke ID 301 and the stroke information 302 including the coordinate value and time as shown in FIG.
The stroke ID 301 indicates a stroke identification number. The stroke information 302 includes a two-dimensional coordinate value of a sampling point and a two-dimensional coordinate value at a certain time interval of the stroke from when the pen or finger touches the screen until the pen or finger leaves the screen. The sampling time. That is, one stroke ID 301 represents one stroke from the start point to the end point of the stroke.
Specifically, for example, stroke ID 301 “1” and stroke information 302 “(x 1 , x 1 , t 1 ), (x 2 , x 2 , t 2 ),. It is stored in a buffer (not shown).

次に、注目領域推定部104における注目領域の推定方法について図4を参照して説明する。
図4(a)は、画面に表示されるwebページ上でのストローク401を示し、黒丸はストロークの代表点となるサンプリング点である。図4(b)は、画面に表示されるwebページのHTML構造上での、ストロークの対応点402を示す。
Next, an attention area estimation method in the attention area estimation unit 104 will be described with reference to FIG.
FIG. 4A shows a stroke 401 on a web page displayed on the screen, and a black circle is a sampling point that is a representative point of the stroke. FIG. 4B shows stroke corresponding points 402 on the HTML structure of the web page displayed on the screen.

注目領域の推定は、例えば、構造化文書の要素に含まれるストロークの対応点402の数が一番多い要素のブロック領域を注目領域として推定する。
図4(b)を参照すると、HTMLタグの要素403に含まれる対応点402の数と、HTMLタグの要素404に含まれる対応点402の数とを比較する。要素403に含まれる対応点402の数が、要素404に含まれる対応点402の数よりも多いので、要素403をユーザが注目する注目領域として推定すればよい。
In the estimation of the attention area, for example, the block area of the element having the largest number of stroke corresponding points 402 included in the elements of the structured document is estimated as the attention area.
Referring to FIG. 4B, the number of corresponding points 402 included in the HTML tag element 403 is compared with the number of corresponding points 402 included in the HTML tag element 404. Since the number of corresponding points 402 included in the element 403 is larger than the number of corresponding points 402 included in the element 404, the element 403 may be estimated as a region of interest to which the user pays attention.

次に、注目領域推定部104における注目領域の推定方法の別例について図5を参照して説明する。
図5(a)は、画面に表示されるwebページ上でのストローク501を示し、黒丸はストロークの代表点となるサンプリング点である。図5(b)は、画面に表示されるwebページのHTML構造上での、ストロークの対応点502を示す。
Next, another example of an attention area estimation method in the attention area estimation unit 104 will be described with reference to FIG.
FIG. 5A shows a stroke 501 on a web page displayed on the screen, and a black circle is a sampling point as a representative point of the stroke. FIG. 5B shows stroke corresponding points 502 on the HTML structure of the web page displayed on the screen.

図5(a)に示すように、ストロークのサンプリング点(対応点)の隣接する密度が高い場合、ゆっくりとストロークが引かれていることを表す。このような場合は、ストロークのサンプリング点(対応点)の密度が低い、すなわち素早く範囲を指定している場合に比べ、ユーザが注目するキーワードまたは文のみを指定してマーキングしている可能性が高い。よって、このような場合は、要素に含まれる文字列を文字単位で注目領域として推定する。   As shown in FIG. 5A, when the density of adjacent sampling points (corresponding points) of the stroke is high, it indicates that the stroke is slowly drawn. In such a case, the density of sampling points (corresponding points) of the stroke is low, that is, there is a possibility that marking is performed by specifying only the keyword or sentence that the user is interested in, compared to the case where the range is specified quickly. high. Therefore, in such a case, the character string included in the element is estimated as the attention area in units of characters.

次に、HTML要素の画面表示範囲とHTMLソースの構造との関係に基づく注目領域の判定について、図6を参照して説明する。
図6は、Webページを表示したときのページ全体601、画面の表示範囲602、表示範囲602に一部が表示されるwebページの段落603およびストロークで囲まれた注目領域604と、HTML構造を用いて記述された文書(webページのソース)との関係を示す。Webページの内容に対するユーザの注目の仕方としては、まずページ全体の中で画面に表示しているかどうかの第1段階がある。次に画面に表示されるページの中でストロークが入力された範囲があるかどうか第2段階がある。
Next, the determination of the attention area based on the relationship between the screen display range of the HTML element and the structure of the HTML source will be described with reference to FIG.
FIG. 6 shows an entire page 601 when a Web page is displayed, a screen display range 602, a web page paragraph 603 partially displayed in the display range 602, an attention area 604 surrounded by strokes, and an HTML structure. The relationship with the document (source of the web page) described by using is shown. As a way of attention of the user with respect to the contents of the Web page, there is a first stage as to whether or not it is displayed on the screen in the entire page. Next, there is a second stage whether or not there is a range where the stroke is input in the page displayed on the screen.

図6(a)で示される画面の表示範囲602において「スラスラと書ける」という言葉をペンによるストロークで囲った時点では、ページ内の単語「ITニュース」は、画面の表示範囲602にもwebページの段落603にも表示されていないページ全体601に含まれる文章であるため、ユーザには注目されていない。   In the screen display range 602 shown in FIG. 6A, the word “IT news” in the page is also displayed on the screen display range 602 at the time when the word “slurry can be written” is surrounded by a stroke with a pen. Since the text is included in the entire page 601 that is not displayed in the paragraph 603, the user does not pay attention.

一方、単語「新端末」「広告」「文字認識」および「スラスラと書ける」は、画面の表示範囲602に表示されているため、第1段階の注目領域に含まれることがわかる。さらに、単語「スラスラと書ける」はストロークで囲まれた注目領域604であり、第1段階より優先度が高い第2段階の注目領域となる。このように、表示範囲と段階を設けて、段階に応じた優先度と対応付けて注目領域を推定してもよい。   On the other hand, since the words “new terminal”, “advertisement”, “character recognition”, and “can be written as slack” are displayed in the display range 602 of the screen, it is understood that they are included in the attention area in the first stage. Further, the word “slurry can be written” is an attention area 604 surrounded by strokes, and is a second stage attention area having a higher priority than the first stage. As described above, the attention area may be estimated by providing the display range and the stage and associating the display range with the priority according to the stage.

次に、第1の実施形態に係る注目領域推定部104の動作について、図7のフローチャートを参照して説明する。
ステップS701では、閲覧情報取得部101が、構造化文書を取得する。
ステップS702では、ストローク取得部102が、ユーザからのストロークを取得する。
ステップS703では、位置変換部103が、画面上のストロークのサンプリング点を構造化文書中の対応点に変換する。
Next, the operation of the attention area estimation unit 104 according to the first embodiment will be described with reference to the flowchart of FIG.
In step S701, the browsing information acquisition unit 101 acquires a structured document.
In step S702, the stroke acquisition unit 102 acquires a stroke from the user.
In step S703, the position conversion unit 103 converts the sampling point of the stroke on the screen into a corresponding point in the structured document.

ステップS704では、注目領域推定部104が、対応点の密度が閾値以上であるかどうかを判定する。対応点の密度が閾値以上であれば、ステップS705に進み、対応点の密度が閾値未満であれば、ステップS706へ進む。
ステップS705では、構造化文書の要素中の文字列を、対応点に応じて文字単位で抽出し、注目領域と推定する。
ステップS706では、対応点が複数の要素にまたがって含まれるかどうかを判定する。対応点が複数の要素にまたがる場合は、ステップS707へ進み、対応点が複数の要素にまたがらない、すなわち、1つの要素に収まる場合は、ステップS708へ進む。
In step S704, the attention area estimation unit 104 determines whether the density of corresponding points is equal to or higher than a threshold value. If the density of the corresponding points is greater than or equal to the threshold, the process proceeds to step S705. If the density of the corresponding points is less than the threshold, the process proceeds to step S706.
In step S705, the character string in the element of the structured document is extracted in character units according to the corresponding points, and is estimated as the attention area.
In step S706, it is determined whether or not the corresponding point is included across a plurality of elements. If the corresponding point extends over a plurality of elements, the process proceeds to step S707. If the corresponding point does not extend over a plurality of elements, that is, falls within one element, the process proceeds to step S708.

ステップS707では、最も多い対応点を含む要素中の文字列を注目領域として推定する。
ステップS708では、対応点を含む要素中の文字列を注目領域として推定する。以上で、第1の実施形態に係る注目領域推定装置の動作を終了する。
In step S707, the character string in the element including the most corresponding points is estimated as the attention area.
In step S708, the character string in the element including the corresponding point is estimated as the attention area. Above, operation | movement of the attention area estimation apparatus which concerns on 1st Embodiment is complete | finished.

以上に示した第1の実施形態によれば、入力されたストロークの位置および密度に応じて、ユーザが注目する注目領域を推定することで、範囲指定における自由度を確保しつつ、選択範囲を特定することができる。   According to the first embodiment described above, the selection range can be selected while ensuring the degree of freedom in range specification by estimating the attention area that the user pays attention to according to the position and density of the input stroke. Can be identified.

(第2の実施形態)
第2の実施形態では、新たに取得したストロークに応じて注目領域を調整する点が第1の実施形態と異なる。
一度注目領域を推定しても、ユーザが再びストロークを入力し、注目領域を書き直したり、注目領域の一部を削除したりすることが考えられる。このような場合、注目領域を修正可能とすることで、より柔軟にユーザが選択範囲を特定することができる。
(Second Embodiment)
The second embodiment is different from the first embodiment in that the attention area is adjusted according to the newly acquired stroke.
Once the attention area is estimated, it is conceivable that the user inputs a stroke again and rewrites the attention area or deletes a part of the attention area. In such a case, by allowing the attention area to be corrected, the user can specify the selection range more flexibly.

第2の実施形態に係る注目領域推定装置を図8のブロック図を参照して説明する。
第2の実施形態に係る注目領域推定装置800は、閲覧情報取得部101、ストローク取得部102、位置変換部103、注目領域推定部104、判定部801および領域修正部802を含む。
閲覧情報取得部101、ストローク取得部102、位置変換部103および注目領域推定部104については、第1の実施形態に係る注目領域推定装置100の構成と同様の動作を行うため、ここでの説明を省略する。
A region of interest estimation apparatus according to the second embodiment will be described with reference to the block diagram of FIG.
A region of interest estimation apparatus 800 according to the second embodiment includes a browsing information acquisition unit 101, a stroke acquisition unit 102, a position conversion unit 103, a region of interest estimation unit 104, a determination unit 801, and a region correction unit 802.
Since the browsing information acquisition unit 101, the stroke acquisition unit 102, the position conversion unit 103, and the attention area estimation unit 104 perform the same operation as the configuration of the attention area estimation device 100 according to the first embodiment, description will be given here. Is omitted.

判定部801は、位置変換部103から対応点を受け取り、ユーザが注目領域に対してどのような処理を加えたかを判定する。ユーザが注目領域へ加える処理としては、例えば、別の注目領域の追加、注目領域の拡大、注目領域の全削除または一部削除が挙げられる。判定部801は、対応点の位置および密度に応じて、ユーザが加えた処理を判定する。
領域修正部802は、判定部801から判定結果を受け取り、判定結果に応じて注目領域を修正する。
The determination unit 801 receives the corresponding points from the position conversion unit 103 and determines what processing the user has applied to the attention area. Examples of processing that the user adds to the attention area include addition of another attention area, enlargement of the attention area, and total deletion or partial deletion of the attention area. The determination unit 801 determines the process added by the user according to the position and density of the corresponding points.
The area correction unit 802 receives the determination result from the determination unit 801 and corrects the attention area according to the determination result.

次に、判定部801および領域修正部802における修正処理について図9を参照して説明する。
図9は、画面上で表示されるテキストと、ユーザにより入力されるストロークとを示し、破線が注目領域外のテキスト、実線が注目領域内のテキスト、フリーハンドにより囲まれた楕円状の実線がストロークをそれぞれ示す。
Next, correction processing in the determination unit 801 and the region correction unit 802 will be described with reference to FIG.
FIG. 9 shows the text displayed on the screen and the stroke input by the user. The broken line is the text outside the attention area, the solid line is the text within the attention area, and the elliptical solid line surrounded by the freehand Each stroke is shown.

判定部801では、ストロークが追記されると、追記されたストロークの種類および領域に応じて、既存のストロークによる注目領域の位置との関係からどの処理が必要であるかを判定する。
例えば図9(a)は、既存の注目領域に、別の注目領域が追加される例である。まず、(a1)に示すように、既存の注目領域が推定されている場合を想定する。続いて、(a2)に示すように、既存の注目領域から離れた領域にストロークが入力された場合、別の注目領域と判定される。この場合は、(a3)に示すように、最初のストロークが入力された場合と同様に、新しい注目領域が追加される。
When the stroke is added, the determination unit 801 determines which process is necessary based on the relationship with the position of the attention area based on the existing stroke according to the type and area of the added stroke.
For example, FIG. 9A shows an example in which another attention area is added to the existing attention area. First, as shown in (a1), the case where the existing attention area is estimated is assumed. Subsequently, as shown in (a2), when a stroke is input to an area away from the existing attention area, it is determined as another attention area. In this case, as shown in (a3), a new attention area is added as in the case where the first stroke is input.

図9(b)は、注目領域を書き足す場合の例である。まず、(b1)のように、既存の注目領域が推定されており、(b2)のように、既存の注目領域に隣接する領域にストロークが記入された場合、追加範囲を包含する領域を新たに注目領域として設定する。領域の重なりの判定は、例えば既存のストロークに外接する最小の矩形と重なる点または面積が閾値以上であるかどうかにより判定することができる。結果として、(b3)のように、注目領域を拡大できる。
なお、領域が拡大されたことを明確にするため、例えば、(b4)のように、2つのストロークに内接する最大の矩形に含まれる部分のストロークを非表示とすることで、領域が結合されたことをわかりやすく表示してもよい。
FIG. 9B shows an example of adding a region of interest. First, when an existing attention area is estimated as shown in (b1) and a stroke is entered in an area adjacent to the existing attention area as shown in (b2), a new area including the additional range is newly created. Is set as the attention area. The determination of the overlap of the regions can be made based on, for example, whether or not the point or area that overlaps the smallest rectangle circumscribing the existing stroke is equal to or greater than a threshold value. As a result, the attention area can be expanded as shown in (b3).
In order to clarify that the area has been enlarged, for example, as shown in (b4), the areas included in the largest rectangle inscribed in the two strokes are hidden so that the areas are combined. May be displayed in an easy-to-understand manner.

図9(c)は、削除を表現するストロークにより、注目領域を縮小する例である。(c1)のような注目領域に対して、(c2)のように波線などで取り消しを示すストロークが入力された場合、(c3)のように注目領域が縮小される。取り消しを示す入力であることを判定する方法としては、塗りつぶしのように、短時間に狭い領域内を埋めることにより、対応点の密度が高くなるようなストロークが記入された場合に、削除を表現するストロークと判定すればよい。   FIG. 9C shows an example in which the attention area is reduced by a stroke expressing deletion. When a stroke indicating cancellation with a wavy line or the like is input to the attention area as in (c1), the attention area is reduced as in (c3). As a method of determining that the input is cancellation, a deletion is expressed when a stroke that fills a narrow area in a short time, such as filling, to increase the density of corresponding points. What is necessary is just to determine with the stroke to perform.

また、注目領域の一部取り消しを行った場合の扱いとして、取り消された領域の優先度を、図6の表示範囲602と同じ第1段階としてもよいし、画面に表示されない領域と同様の優先度としてもよい。   In addition, as a treatment when a part of the attention area is canceled, the priority of the canceled area may be set to the same first level as the display range 602 in FIG. 6 or the same priority as that of the area not displayed on the screen. It may be a degree.

次に、行頭へのマーキング例について図10を参照して説明する。
図10に示すように、文書の行頭にマーキングがされる場合は、マーキングされた行および、マーキングされた行を含む段落を注目領域と推定すればよい。
また、文の一部へマーキングされる場合は、線が引かれた単語および線で囲まれた単語、および、マーキングされた単語を含む文を注目領域と推定すればよい。
また、文全体へマーキングされる場合は、線が引かれた文および線で囲まれた文を注目領域とすればよい。
Next, an example of marking at the beginning of a line will be described with reference to FIG.
As shown in FIG. 10, when marking is performed at the beginning of a document, the marked line and the paragraph including the marked line may be estimated as the attention area.
When marking a part of a sentence, a word including a line, a word surrounded by the line, and a sentence including the marked word may be estimated as a region of interest.
Further, in the case where marking is performed on the entire sentence, a sentence with a line and a sentence surrounded by the line may be set as the attention area.

以上に示した第2の実施形態によれば、追加されるストロークがどのようなユーザの意図で記入されたかを判定することで、より柔軟な注目領域の推定をおこなうことができる。   According to the second embodiment described above, it is possible to estimate the attention area more flexibly by determining what kind of intention the user adds to the added stroke.

(第3の実施形態)
第3の実施形態では、注目領域を含む文書をキーワードにより検索する点が上述の実施形態と異なる。ユーザのマーキングがされた注目領域からキーワードを検索することで、ユーザの要求に沿った情報を提供することができる。
(Third embodiment)
The third embodiment is different from the above-described embodiment in that a document including a region of interest is searched using a keyword. By searching for a keyword from the attention area marked by the user, it is possible to provide information in accordance with the user's request.

第3の実施形態に係る注目領域推定装置を図11のブロック図を参照して説明する。
第3の実施形態に係る注目領域推定装置1100は、閲覧情報取得部101、ストローク取得部102、位置変換部103、注目領域推定部104、判定部801、領域修正部802、注目キーワード抽出部1101、注目領域格納部1102、検索部1103および表示部1104を含む。なお、第3の実施形態に係る注目領域推定装置1100は、判定部801および領域修正部802を含まない構成でもよい。
閲覧情報取得部101、ストローク取得部102、位置変換部103、注目領域推定部104、判定部801および領域修正部802については、第2の実施形態に係る注目領域推定装置100の構成と同様の動作を行うため、ここでの説明を省略する。
An attention area estimation apparatus according to a third embodiment will be described with reference to the block diagram of FIG.
An attention area estimation device 1100 according to the third embodiment includes a browsing information acquisition unit 101, a stroke acquisition unit 102, a position conversion unit 103, an attention area estimation unit 104, a determination unit 801, an area correction unit 802, and an attention keyword extraction unit 1101. , An attention area storage unit 1102, a search unit 1103, and a display unit 1104. Note that the attention area estimation device 1100 according to the third embodiment may not include the determination unit 801 and the area correction unit 802.
About the browsing information acquisition part 101, the stroke acquisition part 102, the position conversion part 103, the attention area estimation part 104, the determination part 801, and the area correction part 802, it is the same as that of the structure of the attention area estimation apparatus 100 which concerns on 2nd Embodiment. Since the operation is performed, the description here is omitted.

注目キーワード抽出部1101は、注目領域推定部104から注目領域を受け取り、注目領域に含まれる文字列からキーワードを抽出する。キーワードの抽出は、形態素解析処理、固有表現抽出処理、予め登録された辞書に含まれる単語とのマッチングによる抽出処理などの一般的なキーワード抽出方法を用いればよく、ここでの説明を省略する。
注目領域格納部1102は、注目キーワード抽出部1101からキーワードと、注目領域に対応する構造化文書中の要素と、表示範囲に対応する構造化文書中の要素とを受け取って格納する。
The attention keyword extraction unit 1101 receives the attention region from the attention region estimation unit 104 and extracts a keyword from a character string included in the attention region. The keyword extraction may be performed using a general keyword extraction method such as a morphological analysis process, a specific expression extraction process, or an extraction process based on matching with a word included in a dictionary registered in advance, and a description thereof is omitted here.
The attention area storage unit 1102 receives and stores the keyword, the element in the structured document corresponding to the attention area, and the element in the structured document corresponding to the display range from the attention keyword extraction unit 1101.

検索部1103は、ユーザから検索対象とされる文字列である検索ワードの入力を受け取り、注目領域格納部1102に格納されるキーワードから、検索ワードと一致するキーワードを検索し、一致するキーワードとそのキーワードが含まれる注目領域を検索結果として得る。また、検索ワードと一致するキーワードが表示される表示範囲を検索結果としてもよい。
表示部1104は、検索部1103から検索対象とされる文字列、キーワード、および注目領域を受け取り、優先度に応じて画面に表示する。
The search unit 1103 receives an input of a search word that is a character string to be searched from the user, searches the keyword stored in the attention area storage unit 1102 for a keyword that matches the search word, The attention area including the keyword is obtained as a search result. A display range in which keywords that match the search word are displayed may be used as the search result.
The display unit 1104 receives a character string, a keyword, and a region of interest to be searched from the search unit 1103, and displays them on the screen according to priority.

なお、検索結果を得る際、キーワードを含む領域が、注目領域であるか、表示範囲であるか、または注目領域および表示範囲以外であるかに応じて、ユーザに提示するキーワードの優先度を設定してもよい。
例えば、図6を参照すれば、注目領域604に含まれるキーワードの優先度を最も高くし、表示範囲602に含まれるキーワードの優先度を2番目に高くし、注目領域および表示範囲以外で、表示範囲602に一部が表示されるwebページの段落603に含まれるキーワードの優先度を3番目に高くし、上記以外のページ全体601に含まれるキーワードの優先度を4番目に設定してもよい。
When obtaining the search result, the priority of the keyword to be presented to the user is set depending on whether the area including the keyword is the attention area, the display range, or the area other than the attention area and the display range. May be.
For example, referring to FIG. 6, the priority of the keyword included in the attention area 604 is the highest, the priority of the keyword included in the display range 602 is the second highest, and the display is performed outside the attention area and the display range. The priority of the keyword included in the paragraph 603 of the web page partially displayed in the range 602 may be set to the third highest, and the priority of the keyword included in the entire page 601 other than the above may be set to the fourth. .

また、第3の実施形態に係る注目領域推定装置1100に注目領域格納部1102を含まず、外部にある記憶装置にキーワードと、注目領域に対応する構造化文書中の要素と、表示範囲に対応する構造化文書中の要素とを格納してもよい。   In addition, the attention area estimation apparatus 1100 according to the third embodiment does not include the attention area storage unit 1102, but corresponds to the keywords in the external storage device, the elements in the structured document corresponding to the attention area, and the display range. And an element in the structured document to be stored.

次に、第3の実施形態に係るキーワード検索の一例について図12を参照して説明する。
図12は、検索された注目領域を含む文書をキーワードにより検索する例である。本実施形態では、検索は手書きタブレット端末の内部ストレージまたは外部のweb文書を検索することを示す。図12の例では、キーワード「実施」で検索した場合、注目領域として、ユーザが「実施」という単語をマーキングした注目領域の文書1201および文書1202が検索結果の上位として表示される。また、マーキングした範囲は異なるが表示画面の注目領域にキーワード「実施」を含む文書1203が表示される。すなわち、文書1203では、特許法第67条第1項の「特許出願の日から二十年」をマーキングしているが、文書1203中の特許法第67条第2項に「実施」という文言があるため、検索結果として、特許法第67条第1項および第2項を合わせて表示される。
Next, an example of a keyword search according to the third embodiment will be described with reference to FIG.
FIG. 12 is an example in which a document including the searched attention area is searched by a keyword. In the present embodiment, the search indicates searching the internal storage of the handwritten tablet terminal or an external web document. In the example of FIG. 12, when searching with the keyword “execution”, the document 1201 and the document 1202 in the attention area where the user has marked the word “execution” are displayed as attention areas as the attention area. In addition, although the marked range is different, a document 1203 including the keyword “execution” is displayed in the attention area of the display screen. That is, in Document 1203, “Twenty years from the date of patent application” is marked in Article 67, Paragraph 1 of the Patent Act, but the word “Implementation” is stated in Article 67, Paragraph 2 of Patent Act in Document 1203. Therefore, as a search result, Patent Law Article 67, Paragraph 1 and Paragraph 2 are displayed together.

このようにすることで、例えば手書きタブレット端末を利用した学習において、検索したキーワードに関連した部分の文書も合わせて表示することができ、ユーザの学習効率を向上させることができる。   In this way, for example, in learning using a handwritten tablet terminal, a part of a document related to the searched keyword can be displayed together, and the learning efficiency of the user can be improved.

次に、閲覧内容に関連する文書の表示例について図13を参照して説明する。
図13(a)の例では、文書閲覧画面において、「公然実施」という単語がマーキングされた文書を閲覧している場合を示す。ユーザが閲覧している文書の内容に関連する情報を知りたい場合、関連資料検索ボタン1301を押すと、図13(b)に示すように、現在閲覧している文書と関連する内容の文書が「関連資料一覧」として表示される。
なお、現在閲覧している文書中の「公然実施」を含む文書が上位に表示されるが、マーキングされていない文書中のキーワードに関連する語を表示してもよい。例えば、「関連資料一覧」の右側にあるスクロールバー1302を下にスクロールさせることにより、現在の閲覧文書とつながりがある文書を順次表示させる。これによって、注目領域推定装置を含むタブレット端末などを利用するユーザの学習効率を向上させることができる。
Next, a display example of a document related to browsing contents will be described with reference to FIG.
The example in FIG. 13A shows a case where a document marked with the word “publicly implemented” is being browsed on the document browsing screen. When the user wants to know information related to the contents of the document being browsed, when the related material search button 1301 is pressed, a document having contents related to the currently browsed document is displayed as shown in FIG. Displayed as “Related Materials List”.
Note that a document including “publicly implemented” in the currently viewed document is displayed at the top, but a word related to a keyword in a document that is not marked may be displayed. For example, by scrolling down the scroll bar 1302 on the right side of the “related material list”, documents that are connected to the currently viewed document are sequentially displayed. Thereby, the learning efficiency of the user who uses a tablet terminal including the attention area estimation device can be improved.

以上に示した第3の実施形態に係る注目領域推定装置によれば、蓄積された注目領域からキーワードを検索することで、ユーザがマーキングした、自身が興味がある注目領域からキーワードを提示し、さらに関連する注目領域の文書も提示することができるので、ユーザの関心項目を拡げ、学習の場合は学習効率を向上させることができる。   According to the attention area estimation device according to the third embodiment described above, by searching for a keyword from the accumulated attention area, the keyword is presented from the attention area that the user is interested in, Further, since a document of a related region of interest can be presented, the user's items of interest can be expanded, and learning efficiency can be improved in the case of learning.

上述の実施形態の中で示した処理手順に示された指示は、ソフトウェアであるプログラムに基づいて実行されることが可能である。汎用の計算機システムが、このプログラムを予め記憶しておき、このプログラムを読み込むことにより、上述した注目領域推定装置による効果と同様な効果を得ることも可能である。上述の実施形態で記述された指示は、コンピュータに実行させることのできるプログラムとして、磁気ディスク(フレキシブルディスク、ハードディスクなど)、光ディスク(CD−ROM、CD−R、CD−RW、DVD−ROM、DVD±R、DVD±RW、Blu−ray(登録商標)Discなど)、半導体メモリ、又はこれに類する記録媒体に記録される。コンピュータまたは組み込みシステムが読み取り可能な記録媒体であれば、その記憶形式は何れの形態であってもよい。コンピュータは、この記録媒体からプログラムを読み込み、このプログラムに基づいてプログラムに記述されている指示をCPUで実行させれば、上述した実施形態の注目領域推定装置と同様な動作を実現することができる。もちろん、コンピュータがプログラムを取得する場合又は読み込む場合はネットワークを通じて取得又は読み込んでもよい。
また、記録媒体からコンピュータや組み込みシステムにインストールされたプログラムの指示に基づきコンピュータ上で稼働しているOS(オペレーティングシステム)や、データベース管理ソフト、ネットワーク等のMW(ミドルウェア)等が本実施形態を実現するための各処理の一部を実行してもよい。
さらに、本実施形態における記録媒体は、コンピュータあるいは組み込みシステムと独立した媒体に限らず、LANやインターネット等により伝達されたプログラムをダウンロードして記憶または一時記憶した記録媒体も含まれる。
また、記録媒体は1つに限られず、複数の媒体から本実施形態における処理が実行される場合も、本実施形態における記録媒体に含まれ、媒体の構成は何れの構成であってもよい。
The instructions shown in the processing procedure shown in the above-described embodiment can be executed based on a program that is software. A general-purpose computer system stores this program in advance and reads this program, so that the same effect as that obtained by the attention area estimation device described above can be obtained. The instructions described in the above-described embodiments are, as programs that can be executed by a computer, magnetic disks (flexible disks, hard disks, etc.), optical disks (CD-ROM, CD-R, CD-RW, DVD-ROM, DVD). ± R, DVD ± RW, Blu-ray (registered trademark) Disc, etc.), semiconductor memory, or a similar recording medium. As long as the recording medium is readable by the computer or the embedded system, the storage format may be any form. If the computer reads the program from the recording medium and causes the CPU to execute instructions described in the program based on the program, the same operation as the attention area estimation device of the above-described embodiment can be realized. . Of course, when the computer acquires or reads the program, it may be acquired or read through a network.
In addition, the OS (operating system), database management software, MW (middleware) such as a network, etc. running on the computer based on the instructions of the program installed in the computer or embedded system from the recording medium implement this embodiment. A part of each process for performing may be executed.
Furthermore, the recording medium in the present embodiment is not limited to a medium independent of a computer or an embedded system, but also includes a recording medium in which a program transmitted via a LAN, the Internet, or the like is downloaded and stored or temporarily stored.
Further, the number of recording media is not limited to one, and when the processing in this embodiment is executed from a plurality of media, it is included in the recording medium in this embodiment, and the configuration of the media may be any configuration.

なお、本実施形態におけるコンピュータまたは組み込みシステムは、記録媒体に記憶されたプログラムに基づき、本実施形態における各処理を実行するためのものであって、パソコン、マイコン等の1つからなる装置、複数の装置がネットワーク接続されたシステム等の何れの構成であってもよい。
また、本実施形態におけるコンピュータとは、パソコンに限らず、情報処理機器に含まれる演算処理装置、マイコン等も含み、プログラムによって本実施形態における機能を実現することが可能な機器、装置を総称している。
The computer or the embedded system in the present embodiment is for executing each process in the present embodiment based on a program stored in a recording medium. The computer or the embedded system includes a single device such as a personal computer or a microcomputer. The system may be any configuration such as a system connected to the network.
In addition, the computer in this embodiment is not limited to a personal computer, but includes an arithmetic processing device, a microcomputer, and the like included in an information processing device. ing.

本発明のいくつかの実施形態を説明したが、これらの実施形態は、例として提示したものであり、発明の範囲を限定することは意図していない。これら新規な実施形態は、その他の様々な形態で実施されることが可能であり、発明の要旨を逸脱しない範囲で、種々の省略、置き換え、変更を行なうことができる。これら実施形態やその変形は、発明の範囲や要旨に含まれるとともに、特許請求の範囲に記載された発明とその均等の範囲に含まれる。   Although several embodiments of the present invention have been described, these embodiments are presented by way of example and are not intended to limit the scope of the invention. These novel embodiments can be implemented in various other forms, and various omissions, replacements, and changes can be made without departing from the spirit of the invention. These embodiments and modifications thereof are included in the scope and gist of the invention, and are included in the invention described in the claims and the equivalents thereof.

100,800,1100・・・注目領域推定装置、101・・・閲覧情報取得部、102・・・ストローク取得部、103・・・位置変換部、104・・・注目領域推定部、301・・・ストロークID、302・・・ストローク情報、401,501・・・ストローク、402,502・・・対応点、403,404・・・要素、601・・・ページ全体、602・・・表示範囲、603・・・段落、604・・・注目領域、801・・・判定部、802・・・領域修正部、1101・・・注目キーワード抽出部、1102・・・注目領域格納部、1103・・・検索部、1104・・・表示部、1201,1202,
1203・・・文書、1301・・・関連資料検索ボタン、1302・・・スクロールバー。
DESCRIPTION OF SYMBOLS 100,800,1100 ... attention area estimation apparatus, 101 ... browsing information acquisition part, 102 ... stroke acquisition part, 103 ... position conversion part, 104 ... attention area estimation part, 301 ... Stroke ID, 302 ... stroke information, 401,501 ... stroke, 402,502 ... corresponding points, 403,404 ... element, 601 ... entire page, 602 ... display range, 603... Paragraph, 604... Attention area, 801... Determination section, 802... Area correction section, 1101. Search unit, 1104... Display unit, 1201, 1202
1203 ... Document, 1301 ... Related material search button, 1302 ... Scroll bar.

Claims (11)

複数の要素により構成される文書を取得する第1取得部と、
画面に表示される前記文書へのストロークの入力を受け付け、前記画面上の座標値で表される前記ストロークのサンプリング点を得る第2取得部と、
前記サンプリング点を、前記画面に表示された部分に対応する前記文書中での位置または該位置を含む前記文書中の要素を示す、対応点に変換する変換部と、
前記対応点に応じて、ユーザが関心を持つ領域である注目領域を前記要素から推定する推定部と、を具備することを特徴とする注目領域推定装置。
A first acquisition unit for acquiring a document composed of a plurality of elements;
A second acquisition unit that receives an input of a stroke to the document displayed on the screen and obtains a sampling point of the stroke represented by a coordinate value on the screen;
A conversion unit for converting the sampling point into a corresponding point indicating a position in the document corresponding to a portion displayed on the screen or an element in the document including the position;
An attention area estimation apparatus comprising: an estimation unit that estimates an attention area, which is an area of interest to a user, from the elements according to the corresponding points.
前記第1取得部は、複数の要素を含む構造化文書を取得し、
前記推定部は、前記構造化文書において、前記座標値を該構造化文書中の対応する位置にマッピングすることで前記対応点を得、該対応点を含む前記要素ごとのブロック領域を注目領域として推定することを特徴とする請求項1に記載の注目領域推定装置。
The first acquisition unit acquires a structured document including a plurality of elements,
The estimation unit obtains the corresponding point by mapping the coordinate value to a corresponding position in the structured document in the structured document, and sets a block region for each element including the corresponding point as a region of interest. The attention area estimation apparatus according to claim 1, wherein estimation is performed.
第2取得部は、前記座標値と前記座標値を取得した時刻とを対応付けたストローク情報を得、
前記推定部は、前記ストローク情報に基づいて、前記ストロークの入力時間が短くかつ前記サンプリング点の隣接する密度が閾値未満である場合は、最も多くの対応点を含む要素に含まれるブロック領域を注目領域として推定し、前記ストロークの入力時間が長くかつ前記サンプリング点の隣接する密度が前記閾値以上である場合は、前記要素に含まれる文字列を文字単位で注目領域として推定することを特徴とする請求項1または請求項2に記載の注目領域推定装置。
The second acquisition unit obtains stroke information in which the coordinate value is associated with the time when the coordinate value is acquired,
The estimation unit pays attention to a block region included in an element including the most corresponding points when the input time of the stroke is short and the adjacent density of the sampling points is less than a threshold based on the stroke information. When the stroke input time is long and the adjacent density of the sampling points is greater than or equal to the threshold value, the character string included in the element is estimated as the attention area in units of characters. The attention area estimation apparatus according to claim 1 or 2.
前記推定部は、前記画面全体に表示される前記文書の一部分である表示範囲と、前記注目領域とを抽出し、該注目領域は、前記表示範囲よりも優先度が高くなるように重み付けることを特徴とする請求項1から請求項3までのいずれか1項に記載の注目領域推定装置。   The estimation unit extracts a display range that is a part of the document displayed on the entire screen and the attention area, and weights the attention area to have a higher priority than the display range. The attention area estimation apparatus according to any one of claims 1 to 3, wherein: 新たに取得したストロークが、既存の注目領域を拡大するものであるか、既存の注目領域の一部または全てを削除するものであるか、別のストロークであるかを判定する判定部と、
前記新たに取得したストロークが、既存の注目領域を拡大するものである場合または既存の注目領域の一部または全てを削除するものである場合、前記注目領域の範囲を修正する修正部と、をさらに具備することを特徴とする請求項1から請求項4のいずれか1項に記載の注目領域推定装置。
A determination unit for determining whether the newly acquired stroke is to enlarge the existing attention area, to delete a part or all of the existing attention area, or to be another stroke;
When the newly acquired stroke is to enlarge an existing attention area or to delete a part or all of the existing attention area, a correction unit for correcting the range of the attention area, The attention area estimation apparatus according to any one of claims 1 to 4, further comprising:
前記注目領域に含まれる文字列に対し、形態素解析および固有表現抽出処理を行ない、キーワードを抽出するキーワード抽出部をさらに具備することを特徴とする請求項1から請求項5のいずれか1項に記載の注目領域推定装置。   6. The method according to claim 1, further comprising a keyword extraction unit that performs morphological analysis and specific expression extraction processing on the character string included in the region of interest, and extracts a keyword. The noted region of interest estimation device. ユーザにより入力された文字列を検索ワードとして、キーワードの検索を行なう検索部をさらに具備し、
前記検索部は、前記検索ワードと一致するキーワードを抽出した領域が前記注目領域であれば、該キーワードを前記ユーザに提示する優先度を最も高く設定し、該キーワードを抽出した領域が前記表示範囲であれば、該優先度を該注目領域よりも低く設定し、該キーワードを抽出した領域が該注目領域および該表示範囲以外であれば、該優先度を該表示範囲よりも低く設定して、ことを特徴とする請求項6に記載の注目領域推定装置。
A character string input by the user is used as a search word, and further includes a search unit for searching for a keyword,
If the area from which the keyword that matches the search word is extracted is the attention area, the search unit sets the highest priority for presenting the keyword to the user, and the area from which the keyword is extracted is the display range. If so, the priority is set lower than the attention area, and if the area from which the keyword is extracted is other than the attention area and the display range, the priority is set lower than the display range, The attention area estimation apparatus according to claim 6.
前記表示範囲に対応する前記文書中の要素と、前記注目領域に対応する該文書中の要素とを格納する格納部をさらに具備することを特徴とする請求項4または請求項7に記載の注目領域推定装置。   The attention according to claim 4, further comprising a storage unit that stores an element in the document corresponding to the display range and an element in the document corresponding to the attention area. Area estimation device. 前記表示範囲に対応する前記文書中の要素と、前記注目領域に対応する該文書中の要素とは、外部に存在する記憶装置に格納されることを特徴とする請求項4または請求項7に記載の注目領域推定装置。   8. The element in the document corresponding to the display range and the element in the document corresponding to the attention area are stored in an external storage device. The noted region of interest estimation device. 複数の要素により構成される文書を取得し、
画面に表示される前記文書へのストロークの入力を受け付け、前記画面上の座標値で表される前記ストロークのサンプリング点を得、
前記サンプリング点を、前記画面に表示された部分に対応する前記文書中での位置または該位置を含む前記文書中の要素を示す、対応点に変換し、
前記対応点に応じて、ユーザが関心を持つ領域である注目領域を前記要素から推定することを特徴とする注目領域推定方法。
Get a document composed of multiple elements,
Accepting stroke input to the document displayed on the screen, obtaining the sampling point of the stroke represented by the coordinate value on the screen,
Converting the sampling point into a corresponding point indicating a position in the document corresponding to a portion displayed on the screen or an element in the document including the position;
A region-of-interest estimation method, wherein a region of interest, which is a region of interest to a user, is estimated from the elements according to the corresponding points.
コンピュータを、
複数の要素により構成される文書を取得する文書取得手段と、
画面に表示される前記文書へのストロークの入力を受け付け、前記画面上の座標値で表される前記ストロークのサンプリング点を得るストローク取得手段と、
前記サンプリング点を、前記画面に表示された部分に対応する前記文書中での位置または該位置を含む前記文書中の要素を示す、対応点に変換する変換手段と、
前記対応点に応じて、ユーザが関心を持つ領域である注目領域を前記要素から推定する推定手段として機能させるための注目領域推定プログラム。
Computer
Document acquisition means for acquiring a document composed of a plurality of elements;
Stroke acquisition means for accepting an input of a stroke to the document displayed on the screen and obtaining a sampling point of the stroke represented by a coordinate value on the screen;
Conversion means for converting the sampling point into a corresponding point indicating a position in the document corresponding to a portion displayed on the screen or an element in the document including the position;
A region-of-interest estimation program for causing a region of interest, which is a region of interest to a user, to function as an estimation unit that estimates from the element according to the corresponding point.
JP2013094511A 2013-04-26 2013-04-26 Interest area estimation device, method, and program Pending JP2014215911A (en)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2013094511A JP2014215911A (en) 2013-04-26 2013-04-26 Interest area estimation device, method, and program
US14/197,950 US20140325350A1 (en) 2013-04-26 2014-03-05 Target area estimation apparatus, method and program
CN201410092451.2A CN104123074A (en) 2013-04-26 2014-03-13 Target area estimation apparatus, method and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2013094511A JP2014215911A (en) 2013-04-26 2013-04-26 Interest area estimation device, method, and program

Publications (1)

Publication Number Publication Date
JP2014215911A true JP2014215911A (en) 2014-11-17

Family

ID=51768505

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013094511A Pending JP2014215911A (en) 2013-04-26 2013-04-26 Interest area estimation device, method, and program

Country Status (3)

Country Link
US (1) US20140325350A1 (en)
JP (1) JP2014215911A (en)
CN (1) CN104123074A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101824360B1 (en) * 2017-04-14 2018-01-31 한국 한의학 연구원 Apparatus and method for anotating facial landmarks

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10423706B2 (en) 2014-10-31 2019-09-24 Xiaomi Inc. Method and device for selecting information
CN104461348B (en) * 2014-10-31 2018-09-04 小米科技有限责任公司 Information choosing method and device
CN106708910A (en) * 2015-11-18 2017-05-24 北大方正集团有限公司 Underlined question processing method and device
CN111859052B (en) * 2020-07-20 2023-10-17 杭州今奥信息科技股份有限公司 Grading display method and system for field investigation result

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7551187B2 (en) * 2004-02-10 2009-06-23 Microsoft Corporation Systems and methods that utilize a dynamic digital zooming interface in connection with digital inking
US7574048B2 (en) * 2004-09-03 2009-08-11 Microsoft Corporation Freeform digital ink annotation recognition
CN101063975A (en) * 2007-02-15 2007-10-31 刘二中 Method and system for electronic text-processing and searching
US8407589B2 (en) * 2007-04-20 2013-03-26 Microsoft Corporation Grouping writing regions of digital ink
US9262390B2 (en) * 2010-09-02 2016-02-16 Lexis Nexis, A Division Of Reed Elsevier Inc. Methods and systems for annotating electronic documents

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101824360B1 (en) * 2017-04-14 2018-01-31 한국 한의학 연구원 Apparatus and method for anotating facial landmarks

Also Published As

Publication number Publication date
US20140325350A1 (en) 2014-10-30
CN104123074A (en) 2014-10-29

Similar Documents

Publication Publication Date Title
JP5159772B2 (en) Document search apparatus and document search method
JP6462970B1 (en) Classification device, classification method, generation method, classification program, and generation program
US20160026858A1 (en) Image based search to identify objects in documents
US20130339840A1 (en) System and method for logical chunking and restructuring websites
JP5832980B2 (en) Handwriting input support device, method and program
CN102902697A (en) Method and system for generating structured document guide view
JP5025808B1 (en) Information processing apparatus and information processing program
JP2014215911A (en) Interest area estimation device, method, and program
US20170322913A1 (en) Stylizing text by replacing glyph with alternate glyph
JP5869179B2 (en) Electronic device and handwritten document processing method
JP2015094978A (en) Electronic device and method
JP5694236B2 (en) Document search apparatus, method and program
JP5687312B2 (en) Digital information analysis system, digital information analysis method, and digital information analysis program
JP6157965B2 (en) Electronic device, method, and program
JP5345987B2 (en) Document search apparatus, document search method, and document search program
JP2008262506A (en) Information extraction system, information extraction method, and information extraction program
US20150178289A1 (en) Identifying Semantically-Meaningful Text Selections
US20180330156A1 (en) Detection of caption elements in documents
US20130226619A1 (en) Input support device and input support method
US20140289247A1 (en) Annotation search apparatus and method
US20150347376A1 (en) Server-based platform for text proofreading
JP2010117941A (en) Device for extracting primary content of web documents and program
JP6655331B2 (en) Electronic equipment and methods
JP2014067303A (en) Character recognition device and method and program
JP5162215B2 (en) Data processing apparatus, data processing method, and program