JP2014215911A - 注目領域推定装置、方法およびプログラム - Google Patents
注目領域推定装置、方法およびプログラム Download PDFInfo
- Publication number
- JP2014215911A JP2014215911A JP2013094511A JP2013094511A JP2014215911A JP 2014215911 A JP2014215911 A JP 2014215911A JP 2013094511 A JP2013094511 A JP 2013094511A JP 2013094511 A JP2013094511 A JP 2013094511A JP 2014215911 A JP2014215911 A JP 2014215911A
- Authority
- JP
- Japan
- Prior art keywords
- attention area
- document
- stroke
- unit
- screen
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
- G06F3/048—Interaction techniques based on graphical user interfaces [GUI]
- G06F3/0484—Interaction techniques based on graphical user interfaces [GUI] for the control of specific functions or operations, e.g. selecting or manipulating an object, an image or a displayed text element, setting a parameter value or selecting a range
- G06F3/04842—Selection of displayed objects or displayed text elements
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
- G06F3/048—Interaction techniques based on graphical user interfaces [GUI]
- G06F3/0487—Interaction techniques based on graphical user interfaces [GUI] using specific features provided by the input device, e.g. functions controlled by the rotation of a mouse with dual sensing arrangements, or of the nature of the input device, e.g. tap gestures based on pressure sensed by a digitiser
- G06F3/0488—Interaction techniques based on graphical user interfaces [GUI] using specific features provided by the input device, e.g. functions controlled by the rotation of a mouse with dual sensing arrangements, or of the nature of the input device, e.g. tap gestures based on pressure sensed by a digitiser using a touch-screen or digitiser, e.g. input of commands through traced gestures
Abstract
【課題】範囲指定における自由度を確保しつつ、選択範囲を特定できる。
【解決手段】本実施形態に係る注目領域推定装置は、第1取得部、第2取得部、変換部および推定部を含む。第1取得部は、複数の要素により構成される文書を取得する。第2取得部は、画面に表示される前記文書へのストロークの入力を受け付け、前記画面上の座標値で表される前記ストロークのサンプリング点を得る。変換部は、前記サンプリング点を、前記画面に表示された部分に対応する前記文書中での位置または該位置を含む前記文書中の要素を示す、対応点に変換する。推定部は、前記対応点に応じて、ユーザが関心を持つ領域である注目領域を前記要素から推定する。
【選択図】図1
【解決手段】本実施形態に係る注目領域推定装置は、第1取得部、第2取得部、変換部および推定部を含む。第1取得部は、複数の要素により構成される文書を取得する。第2取得部は、画面に表示される前記文書へのストロークの入力を受け付け、前記画面上の座標値で表される前記ストロークのサンプリング点を得る。変換部は、前記サンプリング点を、前記画面に表示された部分に対応する前記文書中での位置または該位置を含む前記文書中の要素を示す、対応点に変換する。推定部は、前記対応点に応じて、ユーザが関心を持つ領域である注目領域を前記要素から推定する。
【選択図】図1
Description
本発明の実施形態は、注目領域推定装置、方法およびプログラムに関する。
電子機器に対してペン入力などを用いた手書きによる文字入力方式は従来から広く利用されている。PDA(Personal Digital Assistant:携帯用情報端末)だけでなく、スマートフォンやタブレット型端末、ゲーム機の広がりに伴い、ペン入力機能を備えた機器も増えている。
こうした環境において、ユーザが文書中で注目した内容を手書きで下線を引いたり、丸で囲んだりすることで、領域を指定する方法がある。これは、従来から利用されるマウスによる文字列の始点と終点とをドラッグすることで文字列を選択するよりも、自由度が高く、ユーザがより直感的に注目する領域を指定することができる。
しかし、ユーザが注目した領域を、ペンなどによる手書きのストロークやマウスのフリーフォームなどで指定する場合、自由度が高いためにストロークによる指定範囲が明確ではなく、どの部分までを選択された範囲とするかが困難である。
本開示は、上述の課題を解決するためになされたものであり、範囲指定における自由度を確保しつつ、選択範囲を特定することができる注目領域推定装置、方法およびプログラムを提供することを目的とする。
本実施形態に係る注目領域推定装置は、第1取得部、ストローク取得部、変換部および推定部を含む。第1取得部は、複数の要素により構成される文書を取得する。ストローク取得部は、画面に表示される前記文書へのストロークの入力を受け付け、前記画面上の座標値で表される前記ストロークのサンプリング点を得る。変換部は、前記サンプリング点を、前記画面に表示された部分に対応する前記文書中での位置または該位置を含む前記文書中の要素を示す、対応点に変換する。推定部は、前記対応点に応じて、ユーザが関心を持つ領域である注目領域を前記要素から推定する。
以下、図面を参照しながら本実施形態に係る注目領域推定装置、方法およびプログラムについて詳細に説明する。なお、以下の実施形態では、同一の参照符号を付した部分は同様の動作をおこなうものとして、重複する説明を適宜省略する。
(第1の実施形態)
第1の実施形態に係る注目領域推定装置について図1のブロック図を参照して説明する。
第1の実施形態に係る注目領域推定装置100は、閲覧情報取得部101、ストローク取得部102、位置変換部103および注目領域推定部104を含む。
(第1の実施形態)
第1の実施形態に係る注目領域推定装置について図1のブロック図を参照して説明する。
第1の実施形態に係る注目領域推定装置100は、閲覧情報取得部101、ストローク取得部102、位置変換部103および注目領域推定部104を含む。
閲覧情報取得部101は、外部から複数の要素により構成される文書、例えば構造化文書を取得する。構造化文書は、HTML(Hyper Text Markup Language)文書、XML(eXtensible Markup Language)文書、EPUB(登録商標)(Electronic PUBlication)文書、または文書作成アプリケーションなどにより作成された文書である。構造化文書は、例えば、HTML文書であれば、タグによって記述された複数のHTML要素を有し、これらのHTML要素は、開始タグ及び終了タグ、並びにこれらに囲まれる文字列(テキストデータ)から構成される。また、構造化文書が電子書籍の場合は、章、節、段落などの章立てを要素とする。なお、本実施形態では、ユーザが閲覧する構造化文書の一例としてHTML構造であるWebページを対象として説明する。ここで、Webページには、テキスト情報に加え、静止画像及び動画像が含まれてもよい。
ストローク取得部102は、表示画面に対して描かれたストロークを一定間隔でサンプリングしてサンプリング点を得ることで、ユーザからのストロークを取得する。また、サンプリング点から、ストロークが入力された画面上の2次元の座標値と座標値を取得した時刻とを対応付けた情報であるストローク情報を得る。ストローク情報については、図3を参照して後述する。
ユーザから入力されるストロークは、例えば、タブレット端末やスマートフォンなどの表示画面にペンや指により入力される手書きストロークでもよく、ユーザがマウスを操作することによりフリーハンドで描かれるストロークでもよい。
ユーザから入力されるストロークは、例えば、タブレット端末やスマートフォンなどの表示画面にペンや指により入力される手書きストロークでもよく、ユーザがマウスを操作することによりフリーハンドで描かれるストロークでもよい。
位置変換部103は、閲覧情報取得部101から構造化文書を、ストローク取得部102からストローク情報をそれぞれ取得する。位置変換部103は、サンプリング点を、ストローク情報に含まれる座標に基づいて対応点に変換する。対応点は、画面に表示された部分に対応する構造化文書中での位置、または、その位置を含む構造化文書中の要素を示す。なお、位置変換部103における変換処理は、webページを画面に表示する際に、画面に表示される画像が構造化文書中のどの部分であるかを抽出する既存の処理であればよく、ここでの詳細な説明は省略する。
注目領域推定部104は、位置変換部103から対応点を受け取り、構造化文書中の要素と対応点との関係に応じて、ストロークを入力したユーザが関心を持つ領域である注目領域を推定する。
注目領域推定部104は、位置変換部103から対応点を受け取り、構造化文書中の要素と対応点との関係に応じて、ストロークを入力したユーザが関心を持つ領域である注目領域を推定する。
次に、入力されるストロークの具体例について図2を参照して説明する。
ユーザは、注目する文字列または範囲に対して、下線を引いたり、線で囲むことにより、範囲を指定することができる。
例えば、図2(a)に示すように、ユーザが、文字列「ペンでスラスラと手書きできる端末」に興味があれば、下線を引くことで、興味がある文字列を指定することができる。また、図2(b)に示すように、ユーザが、文字列「ペンでスラスラと手書きできる端末」を線で囲んでもよい。このようにすることで、ユーザが興味がある文の範囲を指定することができる。
ユーザは、注目する文字列または範囲に対して、下線を引いたり、線で囲むことにより、範囲を指定することができる。
例えば、図2(a)に示すように、ユーザが、文字列「ペンでスラスラと手書きできる端末」に興味があれば、下線を引くことで、興味がある文字列を指定することができる。また、図2(b)に示すように、ユーザが、文字列「ペンでスラスラと手書きできる端末」を線で囲んでもよい。このようにすることで、ユーザが興味がある文の範囲を指定することができる。
次に、ストローク取得部102で得られるストローク情報の一例について図3を参照して説明する。
ストローク取得部102は、図3に示すような、ストロークID301と座標値および時刻からなるストローク情報302との対応付けを得る。
ストロークID301は、ストロークの識別番号を示す。ストローク情報302は、画面にペンや指などが接触したときから、画面からペンや指などが離れる時までの、ストロークの一定の時間間隔によるサンプリング点の2次元座標値、および2次元座標値をサンプリングした時刻である。すなわち、1つのストロークID301により、ストロークの始点から終点までの一筆書きを表す。
具体的には、例えば、ストロークID301「1」とストローク情報302「(x1,x1,t1)、(x2,x2,t2)、・・・」とが対応付けられて、バッファ(図示せず)などに格納される。
ストローク取得部102は、図3に示すような、ストロークID301と座標値および時刻からなるストローク情報302との対応付けを得る。
ストロークID301は、ストロークの識別番号を示す。ストローク情報302は、画面にペンや指などが接触したときから、画面からペンや指などが離れる時までの、ストロークの一定の時間間隔によるサンプリング点の2次元座標値、および2次元座標値をサンプリングした時刻である。すなわち、1つのストロークID301により、ストロークの始点から終点までの一筆書きを表す。
具体的には、例えば、ストロークID301「1」とストローク情報302「(x1,x1,t1)、(x2,x2,t2)、・・・」とが対応付けられて、バッファ(図示せず)などに格納される。
次に、注目領域推定部104における注目領域の推定方法について図4を参照して説明する。
図4(a)は、画面に表示されるwebページ上でのストローク401を示し、黒丸はストロークの代表点となるサンプリング点である。図4(b)は、画面に表示されるwebページのHTML構造上での、ストロークの対応点402を示す。
図4(a)は、画面に表示されるwebページ上でのストローク401を示し、黒丸はストロークの代表点となるサンプリング点である。図4(b)は、画面に表示されるwebページのHTML構造上での、ストロークの対応点402を示す。
注目領域の推定は、例えば、構造化文書の要素に含まれるストロークの対応点402の数が一番多い要素のブロック領域を注目領域として推定する。
図4(b)を参照すると、HTMLタグの要素403に含まれる対応点402の数と、HTMLタグの要素404に含まれる対応点402の数とを比較する。要素403に含まれる対応点402の数が、要素404に含まれる対応点402の数よりも多いので、要素403をユーザが注目する注目領域として推定すればよい。
図4(b)を参照すると、HTMLタグの要素403に含まれる対応点402の数と、HTMLタグの要素404に含まれる対応点402の数とを比較する。要素403に含まれる対応点402の数が、要素404に含まれる対応点402の数よりも多いので、要素403をユーザが注目する注目領域として推定すればよい。
次に、注目領域推定部104における注目領域の推定方法の別例について図5を参照して説明する。
図5(a)は、画面に表示されるwebページ上でのストローク501を示し、黒丸はストロークの代表点となるサンプリング点である。図5(b)は、画面に表示されるwebページのHTML構造上での、ストロークの対応点502を示す。
図5(a)は、画面に表示されるwebページ上でのストローク501を示し、黒丸はストロークの代表点となるサンプリング点である。図5(b)は、画面に表示されるwebページのHTML構造上での、ストロークの対応点502を示す。
図5(a)に示すように、ストロークのサンプリング点(対応点)の隣接する密度が高い場合、ゆっくりとストロークが引かれていることを表す。このような場合は、ストロークのサンプリング点(対応点)の密度が低い、すなわち素早く範囲を指定している場合に比べ、ユーザが注目するキーワードまたは文のみを指定してマーキングしている可能性が高い。よって、このような場合は、要素に含まれる文字列を文字単位で注目領域として推定する。
次に、HTML要素の画面表示範囲とHTMLソースの構造との関係に基づく注目領域の判定について、図6を参照して説明する。
図6は、Webページを表示したときのページ全体601、画面の表示範囲602、表示範囲602に一部が表示されるwebページの段落603およびストロークで囲まれた注目領域604と、HTML構造を用いて記述された文書(webページのソース)との関係を示す。Webページの内容に対するユーザの注目の仕方としては、まずページ全体の中で画面に表示しているかどうかの第1段階がある。次に画面に表示されるページの中でストロークが入力された範囲があるかどうか第2段階がある。
図6は、Webページを表示したときのページ全体601、画面の表示範囲602、表示範囲602に一部が表示されるwebページの段落603およびストロークで囲まれた注目領域604と、HTML構造を用いて記述された文書(webページのソース)との関係を示す。Webページの内容に対するユーザの注目の仕方としては、まずページ全体の中で画面に表示しているかどうかの第1段階がある。次に画面に表示されるページの中でストロークが入力された範囲があるかどうか第2段階がある。
図6(a)で示される画面の表示範囲602において「スラスラと書ける」という言葉をペンによるストロークで囲った時点では、ページ内の単語「ITニュース」は、画面の表示範囲602にもwebページの段落603にも表示されていないページ全体601に含まれる文章であるため、ユーザには注目されていない。
一方、単語「新端末」「広告」「文字認識」および「スラスラと書ける」は、画面の表示範囲602に表示されているため、第1段階の注目領域に含まれることがわかる。さらに、単語「スラスラと書ける」はストロークで囲まれた注目領域604であり、第1段階より優先度が高い第2段階の注目領域となる。このように、表示範囲と段階を設けて、段階に応じた優先度と対応付けて注目領域を推定してもよい。
次に、第1の実施形態に係る注目領域推定部104の動作について、図7のフローチャートを参照して説明する。
ステップS701では、閲覧情報取得部101が、構造化文書を取得する。
ステップS702では、ストローク取得部102が、ユーザからのストロークを取得する。
ステップS703では、位置変換部103が、画面上のストロークのサンプリング点を構造化文書中の対応点に変換する。
ステップS701では、閲覧情報取得部101が、構造化文書を取得する。
ステップS702では、ストローク取得部102が、ユーザからのストロークを取得する。
ステップS703では、位置変換部103が、画面上のストロークのサンプリング点を構造化文書中の対応点に変換する。
ステップS704では、注目領域推定部104が、対応点の密度が閾値以上であるかどうかを判定する。対応点の密度が閾値以上であれば、ステップS705に進み、対応点の密度が閾値未満であれば、ステップS706へ進む。
ステップS705では、構造化文書の要素中の文字列を、対応点に応じて文字単位で抽出し、注目領域と推定する。
ステップS706では、対応点が複数の要素にまたがって含まれるかどうかを判定する。対応点が複数の要素にまたがる場合は、ステップS707へ進み、対応点が複数の要素にまたがらない、すなわち、1つの要素に収まる場合は、ステップS708へ進む。
ステップS705では、構造化文書の要素中の文字列を、対応点に応じて文字単位で抽出し、注目領域と推定する。
ステップS706では、対応点が複数の要素にまたがって含まれるかどうかを判定する。対応点が複数の要素にまたがる場合は、ステップS707へ進み、対応点が複数の要素にまたがらない、すなわち、1つの要素に収まる場合は、ステップS708へ進む。
ステップS707では、最も多い対応点を含む要素中の文字列を注目領域として推定する。
ステップS708では、対応点を含む要素中の文字列を注目領域として推定する。以上で、第1の実施形態に係る注目領域推定装置の動作を終了する。
ステップS708では、対応点を含む要素中の文字列を注目領域として推定する。以上で、第1の実施形態に係る注目領域推定装置の動作を終了する。
以上に示した第1の実施形態によれば、入力されたストロークの位置および密度に応じて、ユーザが注目する注目領域を推定することで、範囲指定における自由度を確保しつつ、選択範囲を特定することができる。
(第2の実施形態)
第2の実施形態では、新たに取得したストロークに応じて注目領域を調整する点が第1の実施形態と異なる。
一度注目領域を推定しても、ユーザが再びストロークを入力し、注目領域を書き直したり、注目領域の一部を削除したりすることが考えられる。このような場合、注目領域を修正可能とすることで、より柔軟にユーザが選択範囲を特定することができる。
第2の実施形態では、新たに取得したストロークに応じて注目領域を調整する点が第1の実施形態と異なる。
一度注目領域を推定しても、ユーザが再びストロークを入力し、注目領域を書き直したり、注目領域の一部を削除したりすることが考えられる。このような場合、注目領域を修正可能とすることで、より柔軟にユーザが選択範囲を特定することができる。
第2の実施形態に係る注目領域推定装置を図8のブロック図を参照して説明する。
第2の実施形態に係る注目領域推定装置800は、閲覧情報取得部101、ストローク取得部102、位置変換部103、注目領域推定部104、判定部801および領域修正部802を含む。
閲覧情報取得部101、ストローク取得部102、位置変換部103および注目領域推定部104については、第1の実施形態に係る注目領域推定装置100の構成と同様の動作を行うため、ここでの説明を省略する。
第2の実施形態に係る注目領域推定装置800は、閲覧情報取得部101、ストローク取得部102、位置変換部103、注目領域推定部104、判定部801および領域修正部802を含む。
閲覧情報取得部101、ストローク取得部102、位置変換部103および注目領域推定部104については、第1の実施形態に係る注目領域推定装置100の構成と同様の動作を行うため、ここでの説明を省略する。
判定部801は、位置変換部103から対応点を受け取り、ユーザが注目領域に対してどのような処理を加えたかを判定する。ユーザが注目領域へ加える処理としては、例えば、別の注目領域の追加、注目領域の拡大、注目領域の全削除または一部削除が挙げられる。判定部801は、対応点の位置および密度に応じて、ユーザが加えた処理を判定する。
領域修正部802は、判定部801から判定結果を受け取り、判定結果に応じて注目領域を修正する。
領域修正部802は、判定部801から判定結果を受け取り、判定結果に応じて注目領域を修正する。
次に、判定部801および領域修正部802における修正処理について図9を参照して説明する。
図9は、画面上で表示されるテキストと、ユーザにより入力されるストロークとを示し、破線が注目領域外のテキスト、実線が注目領域内のテキスト、フリーハンドにより囲まれた楕円状の実線がストロークをそれぞれ示す。
図9は、画面上で表示されるテキストと、ユーザにより入力されるストロークとを示し、破線が注目領域外のテキスト、実線が注目領域内のテキスト、フリーハンドにより囲まれた楕円状の実線がストロークをそれぞれ示す。
判定部801では、ストロークが追記されると、追記されたストロークの種類および領域に応じて、既存のストロークによる注目領域の位置との関係からどの処理が必要であるかを判定する。
例えば図9(a)は、既存の注目領域に、別の注目領域が追加される例である。まず、(a1)に示すように、既存の注目領域が推定されている場合を想定する。続いて、(a2)に示すように、既存の注目領域から離れた領域にストロークが入力された場合、別の注目領域と判定される。この場合は、(a3)に示すように、最初のストロークが入力された場合と同様に、新しい注目領域が追加される。
例えば図9(a)は、既存の注目領域に、別の注目領域が追加される例である。まず、(a1)に示すように、既存の注目領域が推定されている場合を想定する。続いて、(a2)に示すように、既存の注目領域から離れた領域にストロークが入力された場合、別の注目領域と判定される。この場合は、(a3)に示すように、最初のストロークが入力された場合と同様に、新しい注目領域が追加される。
図9(b)は、注目領域を書き足す場合の例である。まず、(b1)のように、既存の注目領域が推定されており、(b2)のように、既存の注目領域に隣接する領域にストロークが記入された場合、追加範囲を包含する領域を新たに注目領域として設定する。領域の重なりの判定は、例えば既存のストロークに外接する最小の矩形と重なる点または面積が閾値以上であるかどうかにより判定することができる。結果として、(b3)のように、注目領域を拡大できる。
なお、領域が拡大されたことを明確にするため、例えば、(b4)のように、2つのストロークに内接する最大の矩形に含まれる部分のストロークを非表示とすることで、領域が結合されたことをわかりやすく表示してもよい。
なお、領域が拡大されたことを明確にするため、例えば、(b4)のように、2つのストロークに内接する最大の矩形に含まれる部分のストロークを非表示とすることで、領域が結合されたことをわかりやすく表示してもよい。
図9(c)は、削除を表現するストロークにより、注目領域を縮小する例である。(c1)のような注目領域に対して、(c2)のように波線などで取り消しを示すストロークが入力された場合、(c3)のように注目領域が縮小される。取り消しを示す入力であることを判定する方法としては、塗りつぶしのように、短時間に狭い領域内を埋めることにより、対応点の密度が高くなるようなストロークが記入された場合に、削除を表現するストロークと判定すればよい。
また、注目領域の一部取り消しを行った場合の扱いとして、取り消された領域の優先度を、図6の表示範囲602と同じ第1段階としてもよいし、画面に表示されない領域と同様の優先度としてもよい。
次に、行頭へのマーキング例について図10を参照して説明する。
図10に示すように、文書の行頭にマーキングがされる場合は、マーキングされた行および、マーキングされた行を含む段落を注目領域と推定すればよい。
また、文の一部へマーキングされる場合は、線が引かれた単語および線で囲まれた単語、および、マーキングされた単語を含む文を注目領域と推定すればよい。
また、文全体へマーキングされる場合は、線が引かれた文および線で囲まれた文を注目領域とすればよい。
図10に示すように、文書の行頭にマーキングがされる場合は、マーキングされた行および、マーキングされた行を含む段落を注目領域と推定すればよい。
また、文の一部へマーキングされる場合は、線が引かれた単語および線で囲まれた単語、および、マーキングされた単語を含む文を注目領域と推定すればよい。
また、文全体へマーキングされる場合は、線が引かれた文および線で囲まれた文を注目領域とすればよい。
以上に示した第2の実施形態によれば、追加されるストロークがどのようなユーザの意図で記入されたかを判定することで、より柔軟な注目領域の推定をおこなうことができる。
(第3の実施形態)
第3の実施形態では、注目領域を含む文書をキーワードにより検索する点が上述の実施形態と異なる。ユーザのマーキングがされた注目領域からキーワードを検索することで、ユーザの要求に沿った情報を提供することができる。
第3の実施形態では、注目領域を含む文書をキーワードにより検索する点が上述の実施形態と異なる。ユーザのマーキングがされた注目領域からキーワードを検索することで、ユーザの要求に沿った情報を提供することができる。
第3の実施形態に係る注目領域推定装置を図11のブロック図を参照して説明する。
第3の実施形態に係る注目領域推定装置1100は、閲覧情報取得部101、ストローク取得部102、位置変換部103、注目領域推定部104、判定部801、領域修正部802、注目キーワード抽出部1101、注目領域格納部1102、検索部1103および表示部1104を含む。なお、第3の実施形態に係る注目領域推定装置1100は、判定部801および領域修正部802を含まない構成でもよい。
閲覧情報取得部101、ストローク取得部102、位置変換部103、注目領域推定部104、判定部801および領域修正部802については、第2の実施形態に係る注目領域推定装置100の構成と同様の動作を行うため、ここでの説明を省略する。
第3の実施形態に係る注目領域推定装置1100は、閲覧情報取得部101、ストローク取得部102、位置変換部103、注目領域推定部104、判定部801、領域修正部802、注目キーワード抽出部1101、注目領域格納部1102、検索部1103および表示部1104を含む。なお、第3の実施形態に係る注目領域推定装置1100は、判定部801および領域修正部802を含まない構成でもよい。
閲覧情報取得部101、ストローク取得部102、位置変換部103、注目領域推定部104、判定部801および領域修正部802については、第2の実施形態に係る注目領域推定装置100の構成と同様の動作を行うため、ここでの説明を省略する。
注目キーワード抽出部1101は、注目領域推定部104から注目領域を受け取り、注目領域に含まれる文字列からキーワードを抽出する。キーワードの抽出は、形態素解析処理、固有表現抽出処理、予め登録された辞書に含まれる単語とのマッチングによる抽出処理などの一般的なキーワード抽出方法を用いればよく、ここでの説明を省略する。
注目領域格納部1102は、注目キーワード抽出部1101からキーワードと、注目領域に対応する構造化文書中の要素と、表示範囲に対応する構造化文書中の要素とを受け取って格納する。
注目領域格納部1102は、注目キーワード抽出部1101からキーワードと、注目領域に対応する構造化文書中の要素と、表示範囲に対応する構造化文書中の要素とを受け取って格納する。
検索部1103は、ユーザから検索対象とされる文字列である検索ワードの入力を受け取り、注目領域格納部1102に格納されるキーワードから、検索ワードと一致するキーワードを検索し、一致するキーワードとそのキーワードが含まれる注目領域を検索結果として得る。また、検索ワードと一致するキーワードが表示される表示範囲を検索結果としてもよい。
表示部1104は、検索部1103から検索対象とされる文字列、キーワード、および注目領域を受け取り、優先度に応じて画面に表示する。
表示部1104は、検索部1103から検索対象とされる文字列、キーワード、および注目領域を受け取り、優先度に応じて画面に表示する。
なお、検索結果を得る際、キーワードを含む領域が、注目領域であるか、表示範囲であるか、または注目領域および表示範囲以外であるかに応じて、ユーザに提示するキーワードの優先度を設定してもよい。
例えば、図6を参照すれば、注目領域604に含まれるキーワードの優先度を最も高くし、表示範囲602に含まれるキーワードの優先度を2番目に高くし、注目領域および表示範囲以外で、表示範囲602に一部が表示されるwebページの段落603に含まれるキーワードの優先度を3番目に高くし、上記以外のページ全体601に含まれるキーワードの優先度を4番目に設定してもよい。
例えば、図6を参照すれば、注目領域604に含まれるキーワードの優先度を最も高くし、表示範囲602に含まれるキーワードの優先度を2番目に高くし、注目領域および表示範囲以外で、表示範囲602に一部が表示されるwebページの段落603に含まれるキーワードの優先度を3番目に高くし、上記以外のページ全体601に含まれるキーワードの優先度を4番目に設定してもよい。
また、第3の実施形態に係る注目領域推定装置1100に注目領域格納部1102を含まず、外部にある記憶装置にキーワードと、注目領域に対応する構造化文書中の要素と、表示範囲に対応する構造化文書中の要素とを格納してもよい。
次に、第3の実施形態に係るキーワード検索の一例について図12を参照して説明する。
図12は、検索された注目領域を含む文書をキーワードにより検索する例である。本実施形態では、検索は手書きタブレット端末の内部ストレージまたは外部のweb文書を検索することを示す。図12の例では、キーワード「実施」で検索した場合、注目領域として、ユーザが「実施」という単語をマーキングした注目領域の文書1201および文書1202が検索結果の上位として表示される。また、マーキングした範囲は異なるが表示画面の注目領域にキーワード「実施」を含む文書1203が表示される。すなわち、文書1203では、特許法第67条第1項の「特許出願の日から二十年」をマーキングしているが、文書1203中の特許法第67条第2項に「実施」という文言があるため、検索結果として、特許法第67条第1項および第2項を合わせて表示される。
図12は、検索された注目領域を含む文書をキーワードにより検索する例である。本実施形態では、検索は手書きタブレット端末の内部ストレージまたは外部のweb文書を検索することを示す。図12の例では、キーワード「実施」で検索した場合、注目領域として、ユーザが「実施」という単語をマーキングした注目領域の文書1201および文書1202が検索結果の上位として表示される。また、マーキングした範囲は異なるが表示画面の注目領域にキーワード「実施」を含む文書1203が表示される。すなわち、文書1203では、特許法第67条第1項の「特許出願の日から二十年」をマーキングしているが、文書1203中の特許法第67条第2項に「実施」という文言があるため、検索結果として、特許法第67条第1項および第2項を合わせて表示される。
このようにすることで、例えば手書きタブレット端末を利用した学習において、検索したキーワードに関連した部分の文書も合わせて表示することができ、ユーザの学習効率を向上させることができる。
次に、閲覧内容に関連する文書の表示例について図13を参照して説明する。
図13(a)の例では、文書閲覧画面において、「公然実施」という単語がマーキングされた文書を閲覧している場合を示す。ユーザが閲覧している文書の内容に関連する情報を知りたい場合、関連資料検索ボタン1301を押すと、図13(b)に示すように、現在閲覧している文書と関連する内容の文書が「関連資料一覧」として表示される。
なお、現在閲覧している文書中の「公然実施」を含む文書が上位に表示されるが、マーキングされていない文書中のキーワードに関連する語を表示してもよい。例えば、「関連資料一覧」の右側にあるスクロールバー1302を下にスクロールさせることにより、現在の閲覧文書とつながりがある文書を順次表示させる。これによって、注目領域推定装置を含むタブレット端末などを利用するユーザの学習効率を向上させることができる。
図13(a)の例では、文書閲覧画面において、「公然実施」という単語がマーキングされた文書を閲覧している場合を示す。ユーザが閲覧している文書の内容に関連する情報を知りたい場合、関連資料検索ボタン1301を押すと、図13(b)に示すように、現在閲覧している文書と関連する内容の文書が「関連資料一覧」として表示される。
なお、現在閲覧している文書中の「公然実施」を含む文書が上位に表示されるが、マーキングされていない文書中のキーワードに関連する語を表示してもよい。例えば、「関連資料一覧」の右側にあるスクロールバー1302を下にスクロールさせることにより、現在の閲覧文書とつながりがある文書を順次表示させる。これによって、注目領域推定装置を含むタブレット端末などを利用するユーザの学習効率を向上させることができる。
以上に示した第3の実施形態に係る注目領域推定装置によれば、蓄積された注目領域からキーワードを検索することで、ユーザがマーキングした、自身が興味がある注目領域からキーワードを提示し、さらに関連する注目領域の文書も提示することができるので、ユーザの関心項目を拡げ、学習の場合は学習効率を向上させることができる。
上述の実施形態の中で示した処理手順に示された指示は、ソフトウェアであるプログラムに基づいて実行されることが可能である。汎用の計算機システムが、このプログラムを予め記憶しておき、このプログラムを読み込むことにより、上述した注目領域推定装置による効果と同様な効果を得ることも可能である。上述の実施形態で記述された指示は、コンピュータに実行させることのできるプログラムとして、磁気ディスク(フレキシブルディスク、ハードディスクなど)、光ディスク(CD−ROM、CD−R、CD−RW、DVD−ROM、DVD±R、DVD±RW、Blu−ray(登録商標)Discなど)、半導体メモリ、又はこれに類する記録媒体に記録される。コンピュータまたは組み込みシステムが読み取り可能な記録媒体であれば、その記憶形式は何れの形態であってもよい。コンピュータは、この記録媒体からプログラムを読み込み、このプログラムに基づいてプログラムに記述されている指示をCPUで実行させれば、上述した実施形態の注目領域推定装置と同様な動作を実現することができる。もちろん、コンピュータがプログラムを取得する場合又は読み込む場合はネットワークを通じて取得又は読み込んでもよい。
また、記録媒体からコンピュータや組み込みシステムにインストールされたプログラムの指示に基づきコンピュータ上で稼働しているOS(オペレーティングシステム)や、データベース管理ソフト、ネットワーク等のMW(ミドルウェア)等が本実施形態を実現するための各処理の一部を実行してもよい。
さらに、本実施形態における記録媒体は、コンピュータあるいは組み込みシステムと独立した媒体に限らず、LANやインターネット等により伝達されたプログラムをダウンロードして記憶または一時記憶した記録媒体も含まれる。
また、記録媒体は1つに限られず、複数の媒体から本実施形態における処理が実行される場合も、本実施形態における記録媒体に含まれ、媒体の構成は何れの構成であってもよい。
また、記録媒体からコンピュータや組み込みシステムにインストールされたプログラムの指示に基づきコンピュータ上で稼働しているOS(オペレーティングシステム)や、データベース管理ソフト、ネットワーク等のMW(ミドルウェア)等が本実施形態を実現するための各処理の一部を実行してもよい。
さらに、本実施形態における記録媒体は、コンピュータあるいは組み込みシステムと独立した媒体に限らず、LANやインターネット等により伝達されたプログラムをダウンロードして記憶または一時記憶した記録媒体も含まれる。
また、記録媒体は1つに限られず、複数の媒体から本実施形態における処理が実行される場合も、本実施形態における記録媒体に含まれ、媒体の構成は何れの構成であってもよい。
なお、本実施形態におけるコンピュータまたは組み込みシステムは、記録媒体に記憶されたプログラムに基づき、本実施形態における各処理を実行するためのものであって、パソコン、マイコン等の1つからなる装置、複数の装置がネットワーク接続されたシステム等の何れの構成であってもよい。
また、本実施形態におけるコンピュータとは、パソコンに限らず、情報処理機器に含まれる演算処理装置、マイコン等も含み、プログラムによって本実施形態における機能を実現することが可能な機器、装置を総称している。
また、本実施形態におけるコンピュータとは、パソコンに限らず、情報処理機器に含まれる演算処理装置、マイコン等も含み、プログラムによって本実施形態における機能を実現することが可能な機器、装置を総称している。
本発明のいくつかの実施形態を説明したが、これらの実施形態は、例として提示したものであり、発明の範囲を限定することは意図していない。これら新規な実施形態は、その他の様々な形態で実施されることが可能であり、発明の要旨を逸脱しない範囲で、種々の省略、置き換え、変更を行なうことができる。これら実施形態やその変形は、発明の範囲や要旨に含まれるとともに、特許請求の範囲に記載された発明とその均等の範囲に含まれる。
100,800,1100・・・注目領域推定装置、101・・・閲覧情報取得部、102・・・ストローク取得部、103・・・位置変換部、104・・・注目領域推定部、301・・・ストロークID、302・・・ストローク情報、401,501・・・ストローク、402,502・・・対応点、403,404・・・要素、601・・・ページ全体、602・・・表示範囲、603・・・段落、604・・・注目領域、801・・・判定部、802・・・領域修正部、1101・・・注目キーワード抽出部、1102・・・注目領域格納部、1103・・・検索部、1104・・・表示部、1201,1202,
1203・・・文書、1301・・・関連資料検索ボタン、1302・・・スクロールバー。
1203・・・文書、1301・・・関連資料検索ボタン、1302・・・スクロールバー。
Claims (11)
- 複数の要素により構成される文書を取得する第1取得部と、
画面に表示される前記文書へのストロークの入力を受け付け、前記画面上の座標値で表される前記ストロークのサンプリング点を得る第2取得部と、
前記サンプリング点を、前記画面に表示された部分に対応する前記文書中での位置または該位置を含む前記文書中の要素を示す、対応点に変換する変換部と、
前記対応点に応じて、ユーザが関心を持つ領域である注目領域を前記要素から推定する推定部と、を具備することを特徴とする注目領域推定装置。 - 前記第1取得部は、複数の要素を含む構造化文書を取得し、
前記推定部は、前記構造化文書において、前記座標値を該構造化文書中の対応する位置にマッピングすることで前記対応点を得、該対応点を含む前記要素ごとのブロック領域を注目領域として推定することを特徴とする請求項1に記載の注目領域推定装置。 - 第2取得部は、前記座標値と前記座標値を取得した時刻とを対応付けたストローク情報を得、
前記推定部は、前記ストローク情報に基づいて、前記ストロークの入力時間が短くかつ前記サンプリング点の隣接する密度が閾値未満である場合は、最も多くの対応点を含む要素に含まれるブロック領域を注目領域として推定し、前記ストロークの入力時間が長くかつ前記サンプリング点の隣接する密度が前記閾値以上である場合は、前記要素に含まれる文字列を文字単位で注目領域として推定することを特徴とする請求項1または請求項2に記載の注目領域推定装置。 - 前記推定部は、前記画面全体に表示される前記文書の一部分である表示範囲と、前記注目領域とを抽出し、該注目領域は、前記表示範囲よりも優先度が高くなるように重み付けることを特徴とする請求項1から請求項3までのいずれか1項に記載の注目領域推定装置。
- 新たに取得したストロークが、既存の注目領域を拡大するものであるか、既存の注目領域の一部または全てを削除するものであるか、別のストロークであるかを判定する判定部と、
前記新たに取得したストロークが、既存の注目領域を拡大するものである場合または既存の注目領域の一部または全てを削除するものである場合、前記注目領域の範囲を修正する修正部と、をさらに具備することを特徴とする請求項1から請求項4のいずれか1項に記載の注目領域推定装置。 - 前記注目領域に含まれる文字列に対し、形態素解析および固有表現抽出処理を行ない、キーワードを抽出するキーワード抽出部をさらに具備することを特徴とする請求項1から請求項5のいずれか1項に記載の注目領域推定装置。
- ユーザにより入力された文字列を検索ワードとして、キーワードの検索を行なう検索部をさらに具備し、
前記検索部は、前記検索ワードと一致するキーワードを抽出した領域が前記注目領域であれば、該キーワードを前記ユーザに提示する優先度を最も高く設定し、該キーワードを抽出した領域が前記表示範囲であれば、該優先度を該注目領域よりも低く設定し、該キーワードを抽出した領域が該注目領域および該表示範囲以外であれば、該優先度を該表示範囲よりも低く設定して、ことを特徴とする請求項6に記載の注目領域推定装置。 - 前記表示範囲に対応する前記文書中の要素と、前記注目領域に対応する該文書中の要素とを格納する格納部をさらに具備することを特徴とする請求項4または請求項7に記載の注目領域推定装置。
- 前記表示範囲に対応する前記文書中の要素と、前記注目領域に対応する該文書中の要素とは、外部に存在する記憶装置に格納されることを特徴とする請求項4または請求項7に記載の注目領域推定装置。
- 複数の要素により構成される文書を取得し、
画面に表示される前記文書へのストロークの入力を受け付け、前記画面上の座標値で表される前記ストロークのサンプリング点を得、
前記サンプリング点を、前記画面に表示された部分に対応する前記文書中での位置または該位置を含む前記文書中の要素を示す、対応点に変換し、
前記対応点に応じて、ユーザが関心を持つ領域である注目領域を前記要素から推定することを特徴とする注目領域推定方法。 - コンピュータを、
複数の要素により構成される文書を取得する文書取得手段と、
画面に表示される前記文書へのストロークの入力を受け付け、前記画面上の座標値で表される前記ストロークのサンプリング点を得るストローク取得手段と、
前記サンプリング点を、前記画面に表示された部分に対応する前記文書中での位置または該位置を含む前記文書中の要素を示す、対応点に変換する変換手段と、
前記対応点に応じて、ユーザが関心を持つ領域である注目領域を前記要素から推定する推定手段として機能させるための注目領域推定プログラム。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013094511A JP2014215911A (ja) | 2013-04-26 | 2013-04-26 | 注目領域推定装置、方法およびプログラム |
US14/197,950 US20140325350A1 (en) | 2013-04-26 | 2014-03-05 | Target area estimation apparatus, method and program |
CN201410092451.2A CN104123074A (zh) | 2013-04-26 | 2014-03-13 | 关注区域推定装置、方法及程序 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013094511A JP2014215911A (ja) | 2013-04-26 | 2013-04-26 | 注目領域推定装置、方法およびプログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2014215911A true JP2014215911A (ja) | 2014-11-17 |
Family
ID=51768505
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013094511A Pending JP2014215911A (ja) | 2013-04-26 | 2013-04-26 | 注目領域推定装置、方法およびプログラム |
Country Status (3)
Country | Link |
---|---|
US (1) | US20140325350A1 (ja) |
JP (1) | JP2014215911A (ja) |
CN (1) | CN104123074A (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101824360B1 (ko) * | 2017-04-14 | 2018-01-31 | 한국 한의학 연구원 | 얼굴 특징점 위치정보 생성 장치 및 방법 |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10423706B2 (en) | 2014-10-31 | 2019-09-24 | Xiaomi Inc. | Method and device for selecting information |
CN104461348B (zh) * | 2014-10-31 | 2018-09-04 | 小米科技有限责任公司 | 信息选取方法及装置 |
CN106708910A (zh) * | 2015-11-18 | 2017-05-24 | 北大方正集团有限公司 | 划线题目处理方法和装置 |
CN111859052B (zh) * | 2020-07-20 | 2023-10-17 | 杭州今奥信息科技股份有限公司 | 实地调查成果的分级展示方法及系统 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7551187B2 (en) * | 2004-02-10 | 2009-06-23 | Microsoft Corporation | Systems and methods that utilize a dynamic digital zooming interface in connection with digital inking |
US7574048B2 (en) * | 2004-09-03 | 2009-08-11 | Microsoft Corporation | Freeform digital ink annotation recognition |
CN101063975A (zh) * | 2007-02-15 | 2007-10-31 | 刘二中 | 电子文本处理与检索的方法和系统 |
US8407589B2 (en) * | 2007-04-20 | 2013-03-26 | Microsoft Corporation | Grouping writing regions of digital ink |
US9262390B2 (en) * | 2010-09-02 | 2016-02-16 | Lexis Nexis, A Division Of Reed Elsevier Inc. | Methods and systems for annotating electronic documents |
-
2013
- 2013-04-26 JP JP2013094511A patent/JP2014215911A/ja active Pending
-
2014
- 2014-03-05 US US14/197,950 patent/US20140325350A1/en not_active Abandoned
- 2014-03-13 CN CN201410092451.2A patent/CN104123074A/zh active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101824360B1 (ko) * | 2017-04-14 | 2018-01-31 | 한국 한의학 연구원 | 얼굴 특징점 위치정보 생성 장치 및 방법 |
Also Published As
Publication number | Publication date |
---|---|
US20140325350A1 (en) | 2014-10-30 |
CN104123074A (zh) | 2014-10-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5159772B2 (ja) | 文書検索装置及び文書検索方法 | |
JP6462970B1 (ja) | 分類装置、分類方法、生成方法、分類プログラム及び生成プログラム | |
US20160026858A1 (en) | Image based search to identify objects in documents | |
US20130339840A1 (en) | System and method for logical chunking and restructuring websites | |
JP5832980B2 (ja) | 手書き入力支援装置、方法およびプログラム | |
CN102902697A (zh) | 用于生成结构化文档导视图的方法和系统 | |
JP5025808B1 (ja) | 情報処理装置及び情報処理プログラム | |
JP2014215911A (ja) | 注目領域推定装置、方法およびプログラム | |
US20170322913A1 (en) | Stylizing text by replacing glyph with alternate glyph | |
JP5869179B2 (ja) | 電子機器および手書き文書処理方法 | |
JP2015094978A (ja) | 電子機器および方法 | |
JP5694236B2 (ja) | 文書検索装置、方法およびプログラム | |
JP5687312B2 (ja) | デジタル情報分析システム、デジタル情報分析方法、及びデジタル情報分析プログラム | |
JP6157965B2 (ja) | 電子機器、方法、およびプログラム | |
JP5345987B2 (ja) | 文書検索装置、文書検索方法および文書検索プログラム | |
JP2008262506A (ja) | 情報抽出システム、情報抽出方法および情報抽出用プログラム | |
US20150178289A1 (en) | Identifying Semantically-Meaningful Text Selections | |
US20180330156A1 (en) | Detection of caption elements in documents | |
US20130226619A1 (en) | Input support device and input support method | |
US20140289247A1 (en) | Annotation search apparatus and method | |
US20150347376A1 (en) | Server-based platform for text proofreading | |
JP2010117941A (ja) | Web文書主要コンテンツ抽出装置及びプログラム | |
JP6655331B2 (ja) | 電子機器及び方法 | |
JP2014067303A (ja) | 文字認識装置、方法およびプログラム | |
JP5162215B2 (ja) | データ処理装置、データ処理方法、および、プログラム |