JP2014241034A - 文を検索する装置、方法およびプログラム - Google Patents

文を検索する装置、方法およびプログラム Download PDF

Info

Publication number
JP2014241034A
JP2014241034A JP2013122805A JP2013122805A JP2014241034A JP 2014241034 A JP2014241034 A JP 2014241034A JP 2013122805 A JP2013122805 A JP 2013122805A JP 2013122805 A JP2013122805 A JP 2013122805A JP 2014241034 A JP2014241034 A JP 2014241034A
Authority
JP
Japan
Prior art keywords
sentence
document
importance
unit
extracted
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2013122805A
Other languages
English (en)
Other versions
JP2014241034A5 (ja
JP6099046B2 (ja
Inventor
ハレンドラ バンダリ
Bhandari Harendra
ハレンドラ バンダリ
勘作 中倉
Kansaku Nakakura
勘作 中倉
連子 文
Lianzi WEN
連子 文
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Priority to JP2013122805A priority Critical patent/JP6099046B2/ja
Priority to US14/275,994 priority patent/US9767186B2/en
Publication of JP2014241034A publication Critical patent/JP2014241034A/ja
Publication of JP2014241034A5 publication Critical patent/JP2014241034A5/ja
Application granted granted Critical
Publication of JP6099046B2 publication Critical patent/JP6099046B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/3332Query translation
    • G06F16/3334Selection or weighting of terms from queries, including natural language queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/31Indexing; Data structures therefor; Storage structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/338Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】検索キーとして指定した文字列を含む文の検索において、検索された文の出力順を調整することにより、使用者の利便性を向上させる。【解決手段】検索キーを取得する受け付け部110と、検索対象の文書に含まれる各文の重要度を算出する重要度計算部130と、受け付け部110により取得された検索キーに基づき、検索対象の文書から検索キーを含む文を抽出し、抽出された文の文書における位置の情報を取得する文書処理部120と、この文書処理部120により抽出された各文に関して、文書処理部120により得られた検索対象の文書中における文の位置に基づき、重要度計算部130により算出された文の重要度の値を修正して修正重要度を算出する検索結果処理部140と、この修正重要度に基づく順番にしたがって、文書処理部120により抽出された文を出力する表示制御部150と、を備える。【選択図】図1

Description

本発明は、文書に対して検索キーによる検索を行い、その検索キーを含む文を出力する装置、方法およびプログラムに関する。
電子化された文書(電子文書)の処理システムでは、様々な検索が行われる。例えば、特許文献1に開示される従来技術は、検索キーとしてキーワードを入力し、そのキーワードの表すトピックに適合する文書を文書集合から検索するものである。また、特許文献2に開示される従来技術は、文書を検索キーにしてその文書と類似した文書を複数の検索対象文書から抽出するものである。
また、キーワードに基づいて、文書中の特定の文を抽出することも行われる。例えば、特許文献3に開示される従来技術は、設定したキーワードに基づいて、検索対象の文書の中から、そのキーワードを含む文字列を検索するものである。また、特許文献4に開示される従来技術は、文中の単語の単語重要度に基づいて文重要度を計算し、重要度の高い文を選択し、選択した文を元文書内での出現順に並べ要約文書を作成するものである。
特開2012−118657号公報 特開2004−62806号公報 特開2002−108887号公報 特開平11−184865号公報
文書を読む際に、特定の語句についての文書内における他の記述を参照したい場合がある。例えば、小説を読んでいるときに登場人物について紹介した文を読み返したり、論文等において特定の用語の定義的な記載を参酌したりする場合等である。このような場合、電子文書の閲覧装置においては、データ検索(文字列検索)の機能を用いて、文書中における所望の文字列の検索を行うことができる。さらに、文書に含まれる全ての文の中から所望の文字列を含む文を検索することも可能である。
しかし、文書中に検索した文字列(キーワード)が大量に存在すると、検索結果として得られる文字列や文の数が膨大となる。そのため、結局は目的の文を見つけることが困難となる。
本発明は、このような課題に鑑み、検索キーとして指定した文字列を含む文の検索において、検索された文の出力順を調整することにより、使用者の利便性を向上させることを目的とする。
上記の目的を達成するため、本発明は、次のような装置として実現される。この装置は、文書中に含まれる特定の文を検索して出力する装置であって、検索対象の文書の検索に用いられる検索キーを取得する検索キー取得部と、検索対象の文書に含まれる各文の重要度を算出する重要度計算部と、検索キー取得部により取得された検索キーを用いて検索対象の文書に対して検索を行い、検索対象の文書から検索キーを含む文を抽出し、抽出された文の文書における位置の情報を取得する抽出部と、この抽出部により抽出された各文に関して、抽出部により得られた検索対象の文書中における文の位置に基づき、重要度計算部により算出された文の重要度の値を修正して修正重要度を算出する重要度修正部と、この重要度修正部により算出された修正重要度に基づく順番にしたがって、抽出部により抽出された文を出力する検索結果出力部と、を備える。
より詳細には、重要度計算部は、検索対象の文書に含まれる各文に対して、文に含まれる単語の文書全体における出現数に基づき、重要度を算出する。さらに詳細には、重要度計算部は、検索対象の文書に含まれる単語に関するtf-idf(term frequency-inverse document frequency)に基づいて、当該文書に含まれる各文の重要度を算出する。
また、より詳細には、重要度修正部は、重要度計算部により算出された各文の重要度に対して、検索対象の文書中における文の位置が前方であるほど大きい重み付けを行って修正する。または、検索キー取得部は、検索対象の文書に含まれる一の文の一部または全部を指定することによって特定された部分を検索キーとして取得し、重要度修正部は、重要度計算部により算出された各文の重要度に対して、検索対象の文書中における文の位置が検索キーとして特定された部分を有する文に近いほど大きい重み付けを行って修正する。
また、上記の目的を達成する他の発明は、次のような装置として実現される。この装置は、文書中に含まれる特定の文を検索して出力する装置であって、文書を表示する表示部と、この表示部に表示された文書における特定の部分の指定を受け付ける受け付け部と、この受け付け部により受け付けた文書における特定の部分を検索キーとして、文書に対して検索を行い、検索対象の文書から検索キーを含む文を抽出し、抽出された文の文書における位置の情報を取得する抽出部と、表示部に表示された文書に含まれる各文に関して、文に含まれる単語の文書全体における出現数に基づいて求められた重要度と、抽出部により抽出された文に関する位置の情報とに基づいて、抽出部により抽出された文の表示順を決定する検索結果処理部と、この検索結果処理部により決定された表示順にしたがって、抽出部により抽出された文を表示部に表示させる表示制御部と、を備える。
さらにまた、上記の目的を達成する他の発明は、次のような方法としても実現される。この方法は、文書を表示する表示部を備えたコンピュータにおける、文書中から特定の文を検索して表示部に表示させる方法であって、検索キーの入力を受け付けるステップと、受け付けた検索キーに基づいて、文書に対して検索を行い、検索対象の文書から検索キーを含む文を抽出し、抽出された文の文書における位置の情報を取得するステップと、表示部に表示された文書に含まれる各文に関して、文に含まれる単語の文書全体における出現数に基づいて求められた重要度と、検索キーに基づいて抽出された文に関する位置の情報とに基づいて、検索キーに基づいて抽出された文の表示順を決定するステップと、決定された表示順にしたがって、検索キーに基づいて抽出された文を表示部に表示させるステップと、を含む。
さらにまた、本発明は、コンピュータを制御して上述した装置の各機能を実現するプログラム、あるいは、コンピュータに上記の各ステップに対応する処理を実行させるプログラムとしても実現される。このプログラムは、磁気ディスクや光ディスク、半導体メモリ、その他の記録媒体に格納して配布したり、ネットワークを介して配信したりすることにより、提供することができる。
本発明によれば、検索キーとして指定した文字列を含む文の検索において、検索された文の出力順を調整することにより、使用者の利便性を向上させることが可能となる。
本実施形態が適用される情報処理装置の機能構成の一例を示す図である。 本実施形態における文の関連度を説明する図である。 図2に示したグラフに基づく隣接行列を示す図である。 本実施形態による文の抽出を説明する図である。 検索結果処理部による修正前の各文の重要度の例を示す図である。 文の重要度の修正における重み付けの例を示す図である。 文の重要度の修正における重み付けの他の例を示す図である。 表示制御部により制御された表示部の表示画面の例を示す図であり、検索処理の実行中の表示例を示す図である。 表示制御部により制御された表示部の表示画面の例を示す図であり、検索処理の実行後の表示例を示す図である。 本実施形態の処理部の動作を説明するフローチャートである。 本実施形態の情報処理装置を構成するのに好適なハードウェア構成例を示す図である。
以下、添付図面を参照して、本発明の実施形態について詳細に説明する。
<装置構成>
図1は、本実施形態が適用される情報処理装置の機能構成の一例を示す図である。本実施形態が適用される情報処理装置は、電子文書を閲覧するための装置であり、パーソナルコンピュータや、タブレット型情報端末装置、いわゆるスマートフォン等の携帯型情報端末装置等を用いることができる。図1に示す情報処理装置は、処理部100と、記憶部200と、表示部300と、入力操作部400とを備える。処理部100は、処理対象である電子文書に対する処理を行う。本実施形態における処理部100の具体的な機能については後述する。記憶部200は、処理部100による処理の対象である電子文書を記憶する。また、処理部100の処理により得られたデータを記憶する。
表示部300は、液晶ディスプレイ等の表示装置で実現され、処理部100の制御により、処理対象である電子文書を表示する。また、表示部300は、処理部100により行われた処理の結果を表示する。
入力操作部400は、使用者が入力操作を行うための操作デバイスである。具体的には、入力操作部400としては、マウス等のポインティング・デバイスやキーボード等が用いられる。また、表示部300の表示画面に重ねて設けられたタッチ・パネルを入力操作部400として用いることもできる。
図1に示すように、処理部100は、使用者による入力操作を受け付けるための受け付け部110と、処理手段としての文書処理部120、重要度計算部130および検索結果処理部140と、表示部300の表示を制御する表示制御部150とを備える。
受け付け部110は、入力操作部400を用いて行われた入力を受け付ける。本実施形態では、例えば、電子文書を指定して表示部300に表示させる指示、検索キーによる検索やその他の各種の処理の実行指示等が入力され、受け付け部110により受け付けられる。また、受け付け部110は、入力操作部400を用いて行われた検索キー(キーワード)の入力も受け付ける。すなわち、受け付け部110は、検索キーを取得する検索キー取得部としても機能する。検索キーの入力は、例えば、キーボードを打鍵する操作や、表示部300に表示された電子文書中の適当な範囲(文字列)をポインティング・デバイスにより指定する操作により行われる。
文書処理部120は、受け付け部110により受け付けた指示やデータに基づいて、各種の処理を実行する。例えば、文書処理部120は、指定された電子文書を記憶部200から読み出し、表示部300に表示させる。また、文書処理部120は、重要度計算部130に、記憶部200から読み出した電子文書に含まれる各文の重要度を計算させる。また、文書処理部120は、入力された検索キー(文字列)に基づいて、記憶部200から読み出した電子文書に含まれる文のうち、検索キーを含む文を抽出する抽出部としても機能する。このとき、文書処理部120は、抽出した文の相対的な位置の情報(検索キーを含む文のうちで何番目の文かを示す情報、以下、位置情報)も取得する。また、文書処理部120は、抽出した文を検索結果処理部140に送り、処理を実行させる。
重要度計算部130は、処理対象の電子文書に含まれる各文に関して、各々の文に含まれる単語の出現数に基づき、その電子文書における各文の重要度を計算する。算出される文の重要度は、記憶部200に格納され保持される。そして、検索キーに基づく文の検索が行われた場合に、検索結果を出力する処理において用いられる。この文の重要度の計算は、計算量が多く、計算を行う際の負荷が大きい。そこで、検索の実行指示を受け付けてから行うのではなく、文書処理部120により電子文書が読み出された際、検索の実行指示を待たずにバックグラウンドで計算を行っても良い。また、本実施形態の情報処理装置がインターネット等のネットワークに接続可能である場合は、ネットワーク上のサーバに計算を依頼し、計算結果を取得するようにしても良い。重要度計算部130による文の重要度の計算方法の詳細については後述する。
検索結果処理部140は、文書処理部120により検索キーに基づいて抽出された文に関する、重要度計算部130により計算された重要度を修正する重要度修正部として機能する。本実施形態では、検索結果処理部140は、文書処理部120が文を抽出した際に取得した文の位置情報に基づいて、その文の重要度の値を変更する。検索結果処理部140による処理の詳細については後述する。
表示制御部150は、表示部300の表示を制御する。具体的には、例えば、表示制御部150は、文書処理部120から取得した表示対象の電子文書を表示部300に表示させる。また、表示制御部150は、電子文書を表示部300に表示させた状態で受け付け部110が受け付けた指示に基づき、表示内容のページ送りやスクロール等の表示制御を行う。また、表示制御部150は、検索結果処理部140による処理の結果に基づいて、文書処理部120により抽出された文を、検索結果として表示部300に表示させる検索結果出力部としても機能する。表示制御部150による検索結果の表示制御の詳細については後述する。
<文の重要度の計算>
次に、重要度計算部130による文の重要度の計算について詳細に説明する。上述したように本実施形態では、単語の出現数に基づいて、電子文書における各文の重要度が計算される。具体的には、重要度計算部130は、まず、tf−idfと呼ばれる既存のアルゴリズムを用いて電子文書に存在する各単語の重みを求める。tf−idfは、tf(term frequency)という指標と、idf(inverse document frequency)という指標の2つの指標を用いて求められる。ここで、tfとは、電子文書中における各単語の出現頻度を示す指標である。これは、電子文書中に高い頻度で出現する単語は重要な単語であるという考えに基づいている。また、idfとは、電子文書中において、ある単語が含まれる文の数を示す指標である。これは、多くの文で使用されている単語よりも、少ない文で使用されている単語の方が、その文の特徴をよく表すという考えに基づいている。
本実施形態において、重要度計算部130は、電子文書に存在する各単語について順次着目する。そして、着目した単語に関して、上記のtf−idfに基づく値(以下、tf−idf値)を求める。これにより、電子文中に存在する単語ごとのtf−idf値が求まる。
次に、重要度計算部130は、上記のように求めた電子文書中の各単語の重要度(tf−idf値)に基づいて、電子文書中の各文の関連性を特定する。具体的には、電子文書を、その電子文書に含まれる各文をノードとするグラフで表現する。そして、グラフにおける各ノード間のエッジに、そのエッジの属性として、そのエッジの両端のノードに対応する二つの文の間の関連性を表す値(以下、関連度)を付与する。具体例を挙げて、さらに説明する。
ここでは、s1:「A cat is sitting on a mat.」、s2:「A dog is sitting on a mat.」、s3:「A cat and a dog are sitting on a mat.」という三つの文(s1〜s3)からなる文書を例として、各文の関連度の求め方について説明する。まず、これらの文に含まれる単語の集合(ワード空間)を求める。なお、上記の文における「A(a)」、「is」、「on」「are」等の単語は、いわゆるストップ・ワードとして、ワード空間から除外する。ストップ・ワードとされる単語は、本実施形態が適用されるシステムの仕様等に応じて適宜設定される。
図2は、上記のs1〜s3の文における関連度を説明する図である。図2に示すように、s1〜s3から得られるワード空間には、[cat,sitting,mat,dog]の四つの単語が含まれる。そして、各文(s1〜s3)を構成する単語のうち、ワード空間に含まれる各単語にポイントを付与し、各文(s1〜s3)のスコアを求める。このとき、実際には、各単語に対してその単語のtf−idf値がポイントとして与えられるが、ここでは簡単のため、一つの単語ごとに1ポイントを付与することにする。例えば、s1では、ワード空間に含まれる単語のうち「cat」が一つ、「sitting」が一つ、「mat」が一つ存在し、各々の単語に1ポイントずつが付与されるので、s1のスコアv1は、図2に示すように、v1:(cat:1,sitting:1,mat:1,dog:0)となる。同様に、s2のスコアv2は、v2:(cat:0,sitting:1,mat:1,dog:1)となり、s3のスコアv3は、v3:(cat:1,sitting:1,mat:1,dog:1)となる。
次に、上記のスコア(v1〜v3)に基づき、各文の関連度を求める。上記の例では三つの文(s1〜s3)が存在するので、s1とs2との間の関連度、s1とs3との間の関連度、s2とs3との間の関連度が、それぞれ求まる。s1とs2との間の関連度について、具体的に考える。s1には、三つの単語(「cat」、「sitting」、「mat」)が存在し、このうち二つの単語(「sitting」、「mat」)がs2と共通している。一方、s2には、三つの単語(「sitting」、「mat」、「dog」)が存在し、このうち二つの単語(「sitting」、「mat」)がs1と共通している。そこで、s1とs2との間の関連度(v1:v2)を、二つの文(s1、s2)における単語の総数に対する、共通する単語の数の割合で表し、(2+2)/(3+3)≒0.66とする。
また、s1とs3との間の関連度(v1:v3)について考えると、s1には、三つの単語(「cat」、「sitting」、「mat」)が存在し、その全てがs3と共通している。一方、s3には、四つの単語(「cat」、「sitting」、「mat」、「dog」)が存在し、このうち三つの単語(「cat」、「sitting」、「mat」)がs1と共通している。したがって、s1とs3との間の関連度(v1:v3)は、(3+3)/(3+4)≒0.86となる。同様に、s2とs3との間の関連度(v2:v3)は、(3+3)/(3+4)≒0.86となる。
電子文書を表すグラフにおいて、各文(s1〜s3)に対応するノードs1〜ノードs3の間にそれぞれ張られたエッジには、上記のようにして算出された各文の間の関連度が属性として付与される。図2を参照すると、ノードs1とノードs2との間のエッジには、値「0.66」が付与されており、ノードs1とノードs3との間のエッジには、値「0.86」が付与されており、ノードs2とノードs3との間のエッジには、値「0.86」が付与されている。なお、上述したように、上記の例では、各文におけるワード空間に含まれる単語ごとに1ポイントを与えて各文のスコアおよび関連度を計算したが、実際には、各単語に対してtf−idf値がポイントとして付与される。したがって、各文のスコアおよび関連度についても、実際には、各単語のtf−idf値を用いて計算が行われる。
次に、重要度計算部130は、上記のようにして求めた各文の間の関連度に基づき、各文に対して固有ベクトル中心性(Eigenvector centrality)に基づいて各文の重要度を計算する。重要度計算部130は、まず、上記のようにして各文の間の関連度を付与された電子文書を表すグラフに基づき、隣接行列を作成する。
図3は、図2に示したグラフに基づく隣接行列を示す図である。図3において、行列Aの各要素のうち、図2に示したグラフの各エッジに対応する要素には、各々のエッジに付与された関連度の値が記載されている。重要度計算部130は、このような行列Aに関して、最大固有値に対応する固有ベクトルを計算し、算出された固有ベクトルの要素(値)を各文の重要度の値とする。また、重要度計算部130は、この固有ベクトルの要素(値)の大きさの順に各文の重要度に基づく順位付け(ranking)を行う。行列Aのような電子文書を表すグラフに基づく隣接行列の最大固有値および固有ベクトルを計算する手法としては、既存の手法を用いることができる。
以上のように、本実施形態における文の重要度の計算は、処理対象である電子文書に含まれる情報のみに基づいて(すなわち閉じた環境において)行われる処理である。算出された電子文書における各文の重要度は、記憶部200に格納される。
<文の検索処理>
次に、文書処理部120による文の検索処理について説明する。本実施形態において、文書処理部120は、受け付け部110により受け付けた検索キー(キーワード)に基づき、その検索キーを含む文を処理対象の電子文書中から抽出する。また、文書処理部120は、抽出した文の位置情報を取得する。
図4は、本実施形態による文の抽出を説明する図である。図4に示す電子文書Dは、最初の文である「文1」から最後の文である「文N」まで、N個の文で構成される。また、文nは、電子文書Dにおいて、検索キーを含む文のうちで最初に出現する文である。すなわち、文nよりも前にある文には検索キーは含まれておらず、抽出対象外となる。また、文n+aは、検索キーを含み、文nよりも後方に位置する文である。文n+kは、検索キーを含む最後の文である。図4においては、文n+kよりも後の文が示されていないが、検索キーを含まない文が後続する場合もある。
次に、文書処理部120は、検索キーに基づいて抽出した文nから文n+kまでの各文の位置情報[n,n+k]を正規化する。すなわち、[n,n+k]の値が[0,1]となるように位置情報を変換する。これにより、具体的な文n+aの位置x(n+a)は、x(n+a)=a×(1/k)で表されることになる。
<文の位置情報に基づく重要度の修正>
次に、検索結果処理部140による文の重要度の修正について説明する。本実施形態において、検索結果処理部140は、文書処理部120により抽出された文の重要度を記憶部200から読み出す。そして、検索結果処理部140は、文書処理部120により取得された検索キーを含む各文の位置情報に基づいて、該当する各文の重要度を修正する。
図5は、検索結果処理部140による修正前の各文の重要度の例を示す図である。図5において、横軸は、文書処理部120により抽出された各文の位置情報を示す。すなわち、値「0」の地点(グラフの左端)が、検索キーを含む最初の文であり、値「1」の地点(グラフの右端)が、検索キーを含む最後の文である。また、縦軸は、[0,1]における各文の重要度を示す。
本実施形態では、文の重要度の修正処理として、(1)前方にある文ほど大きい重みを付与する処理、または(2)検索キーの特定に用いられた文に近い位置にある文ほど大きい重みを付与する処理を行う。前者は、「前方にある文ほど重要度が高い」という仮定(仮定1)に基づいている。また、後者は、「検索キーの特定に用いられた文に近い位置にある文ほど重要度が高い」という仮定(仮定2)に基づいている。
仮定1について説明する。電子文書中の特定の語句(登場人物や場所等)についての情報を得たい場合を考える。電子文書の内容が小説等の物語である場合、物語の鍵となるような語句については、最初にその語句が登場した文等、前方に位置する文で紹介的な説明がなされる場合が多い。また、電子文書の内容が論文である場合、論旨の鍵となる語句については、最初にその語句が登場した文において定義的な記載がなされる場合が多い。そのため、特定の語句を含む文のうち、前方にある文ほど、その語句についての説明や定義が記載された重要度の高い文である可能性が大きいという仮定が成り立つ。そこで、文の重要度に対する修正処理として、仮定1に基づく重み付けを行う。
図6は、仮定1に基づく重み付けの例を示す図である。図6において、横軸は、図5に示したグラフと同様に、文書処理部120により抽出された各文の位置情報を示す。また、縦軸は、各文に付与される重み値を示す。図6に示す例では、左方の文(電子文書において前方に出現する文)ほど、重み値が大きくなっている。また、図示の例において、重み値の最大値は「1」である。なお、仮定1に基づく重み付けは、前方の文ほど付与される重み値が大きくなっていれば良く、具体的な文ごとの重みの値は、電子文書の種類等に応じて適宜設定される。すなわち、図6に示すグラフの曲線自体は例示に過ぎない。
検索結果処理部140は、文書処理部120により抽出された各文について、記憶部200から読み出した重要度の値と、図6に示す例のように定義された重み値とに基づいて、検索結果の出力に反映させる最終的な重要度の値を計算する。具体的には、例えば文n+aについて、記憶部200から読み出した重要度の値をs(n+a)とし、図6のように定義される重み値をb(n+a)とすると、最終的な重要度の値W(n+a)は、次式W(n+a)=s(n+a)+s(n+a)×b(n+a)により求める。なお、この重み付けの計算式は例示に過ぎず、この計算式に限定するものではない。実際には、電子文書の内容等に応じて適宜に計算式を設定することができる。
次に、仮定2について説明する。電子文書の閲覧者が電子文書中のある文を読んだときに、その文中の語句について、その文の近辺においてどのような記載があるかを参照したい場合がある。例えば、ある語句について少し前にどのような記載があったかを確認したい場合や、ある語句が現在読んでいる文を含む特定の範囲(章や節など)でどのように説明されているかを知りたい場合等である。そのため、上記の仮定1とは別に、特定の語句を含む文のうち、特定の文に近い位置にある文ほど、閲覧者が読みたいと欲する重要度の高い文である可能性が大きいという仮定が成り立つ。そこで、文の重要度に対する修正処理として、仮定2に基づく重み付けを行う。
図7は、仮定2に基づく重み付けの例を示す図である。図7において、横軸は、図5に示したグラフと同様に、文書処理部120により抽出された各文の位置情報を示す。また、縦軸は、各文に付与される重み値を示す。図7に示す例では、特定された文(文n+a)に近い位置の文ほど、重み値が大きくなっている。また、図示の例において、重み値の最大値は「1」である。なお、仮定2に基づく重み付けは、特定された文に近い位置の文ほど付与される重み値が大きくなっていれば良く、具体的な文ごとの重みの値は、電子文書の種類等に応じて適宜設定される。すなわち、図7に示すグラフの曲線自体は例示に過ぎない。
検索結果処理部140は、文書処理部120により抽出された各文について、記憶部200から読み出した重要度の値と、図7に示す例のように定義された重み値とに基づいて、検索結果の出力に反映させる最終的な重要度の値を計算する。具体的な計算方法は、図6を参照して説明した仮定1の場合と同様である。
上記のように、仮定1と仮定2とは、各文の重要度に付与される重みの根拠が異なっている。そのため、仮定1に基づく重要度の修正と、仮定2に基づく重要度の修正は、通常は別個に用いられる。実際の運用においては、例えば、受け付け部110が検索の実行指示を受け付ける際に、どちらの修正を行うかについての選択指示を受け付け、この選択指示に応じて修正方法を切り替えるようにすれば良い。また、原則的に仮定1に基づく修正を行い、特に指示を受け付けた場合にのみ仮定2に基づく修正を行うようにしても良い。
ところで、仮定2に基づく重み付けは、上記のように、最初に特定された文の位置に基づいて決定される。言い換えれば、最初に特定された文が異なると、図7に示したグラフの形状が変わる。したがって、仮定2に基づく重要度の修正を行う場合、まず一つの文を特定する必要がある。具体的には、受け付け部110が検索キーの指定を受け付ける際に、特定の文に含まれる語句を検索キーとして受け付けるようにする。例えば、処理対象の電子文書が表示部300に表示された状態で、表示されている文の特定の範囲(文の一部または全部)の指定を受け付け、指定された範囲の文字列を検索キーとして受け付けると共に、指定された文字列を含む文を特定するようなインターフェイスを考えることができる。
一方、仮定1に基づく重み付けは、検索キーを含む各文の位置にのみ基づいており、図6に示したグラフは変動することがない。すなわち、指定された検索キーがいずれの文に含まれる語句であるかは問わない。そこで、例えば、キーボード等のデバイスを用いて、電子文書中の文とは関係なく入力された文字列を、検索キーとして受け付けても良い。
以上のようにして、文書処理部120により抽出された各文の位置情報に基づいて、各文の重要度が修正された。ここで、検索結果処理部140により重要度が修正されることにより、重要度計算部130により付与された各文の重要度に基づく順位も変更される場合がある。変更後の順位は、検索キーを含む各文の位置を反映させたものとなっている。
<検索結果の出力>
表示制御部150は、検索結果処理部140により修正された重要度(修正重要度)に基づく順位にしたがって、文書処理部120により抽出された文(検索キーを含む文)を表示部300に表示させる。具体的には、例えば、表示部300の表示画面に検索結果を表示するための領域を形成し、この領域に、修正後の順位の上位から順に、文を表示させる。
図8および図9は、表示制御部150により制御された表示部300の表示画面の例を示す図である。図8を参照すると、表示部300の表示画面310には、処理対象の電子文書が表示されている。これは、受け付け部110により受け付けた表示指示に従って、文書処理部120が記憶部200から読み出した電子文書を表示したものである。表示画面310には、指定された検索キーを表示するための検索キー表示領域311が形成されている。図8に示す検索キー表示領域311には、検索処理の実行中であることを示す「Search」の文字と検索キー「Watson」が表示されている。また、図8に示す例において、検索キー「Watson」は、表示画面310に表示されている電子文書のうち、本文(タイトルの「THE ADVENTURES OF SHERLOK HOLMES」を除いた部分)の10行目にある文字列「Watson」を指定して入力されたものである。図8に示す表示例において、指定された文字列「Watson」は、反転表示されており、指定された箇所が視覚的に識別できるように表示制御されている。
文書処理部120による検索が完了し、抽出された検索キー「Watson」を含む各文に関して、検索結果処理部140において修正重要度に基づく順位が決定されると、決定された順位にしたがって検索結果が表示される。図9を参照すると、表示部300の表示画面310に、新たに検索結果表示領域312が形成されている。そして、この検索結果表示領域312に、修正後の重要度に基づく順位が上位の文が表示されている。図9に示す検索結果表示領域312には、二つの文が表示されているが、表示される文の数は図示の例に限られず、検索結果表示領域312のサイズと表示される文の長さに応じて定まる。また、検索結果表示領域312の表示内容をスクロールしたり更新したりすることにより、修正後の重要度に基づく順位が下位の文を表示可能とすることができる。なお、図9に示す例では、検索キー「Watson」を含む文の検索が完了しているので、検索キー表示領域311には、「Search」の文字に代わり、検索処理が済んだことを示す「Find about」の文字が表示されている。
上記の例では、表示部300の表示画面310に表示された電子文書中の文字列を指定して検索キーを指定することとしたが、キーボード等を用いて検索キーとなる文字列を直接入力しても良い。ただし、この場合は、特定の文に含まれる文字列を検索キーとして指定するのではないため、「前方にある文ほど重要度が高い」という仮定(仮定1)に基づく重要度の修正のみが適用可能となる。
<処理部の動作>
図10は、上記のように構成された情報処理装置により検索キーに基づく文の検索を行う際の処理部100の動作を説明するフローチャートである。ここでは、検索処理の実行指示が行われる前に、バックグラウンド等にて、重要度計算部130による電子文書の各文の重要度の計算が完了しているものとする。検索処理が行われる場合、まず、受け付け部110が、検索キーの入力を受け付ける(ステップ1001)。次に、受け付けた検索キーに基づいて、文書処理部120が、この検索キーを含む文を処理対象の電子文書から抽出する。また、文書処理部120は、抽出した文の位置情報を取得する(ステップ1002)。
次に、検索結果処理部140が、文書処理部120により取得された位置情報に基づいて、文書処理部120により抽出された文の重要度を修正する(ステップ1003)。そして、修正した重要度に基づき、文書処理部120により抽出された各文の順位付けを行う(ステップ1004)。この後、表示制御部150が、ステップ1004で決定された順位(表示順)にしたがって、各文を表示部300に表示させる(ステップ1005)。
<ハードウェア構成例>
図11は、本実施形態の情報処理装置を構成するのに好適なハードウェア構成例を示す図である。ここでは、コンピュータに適用する場合について説明する。図11に示すコンピュータは、演算手段であるCPU(Central Processing Unit)10aと、主記憶手段であるメモリ10cを備える。また、外部デバイスとして、磁気ディスク装置(HDD:Hard Disk Drive)10g、ネットワーク・インターフェイス10f、ディスプレイ装置を含む表示機構10d、音声機構10h、キーボードやマウス等の入力デバイス10i等を備える。
図11に示す構成例では、メモリ10cおよび表示機構10dは、システム・コントローラ10bを介してCPU10aに接続されている。また、ネットワーク・インターフェイス10f、磁気ディスク装置10g、音声機構10hおよび入力デバイス10iは、I/Oコントローラ10eを介してシステム・コントローラ10bと接続されている。各構成要素は、システム・バスや入出力バス等の各種のバスによって接続される。
なお、図11は、本実施形態が適用されるのに好適なコンピュータのハードウェア構成を例示するに過ぎない。本実施形態は、電子文書を表示して閲覧可能とし、検索キーに基づく文の検索を行うことが可能な情報処理装置に広く適用できるものであり、図示の構成においてのみ本実施例が実現されるのではない。
図11において、磁気ディスク装置10gにはOSのプログラムやアプリケーション・プログラムが格納されている。そして、これらのプログラムがメモリ10cに読み込まれてCPU10aに実行されることにより、本実施形態における処理部100の各機能が実現される。また、記憶部200は、メモリ10cや磁気ディスク装置10g等の記憶手段により実現される。また、表示部300は、表示機構10dにより構成される。また、入力操作部400は、入力デバイス10iに相当する。
なお、上記の構成例では、処理対象である電子文書を予め装置内の記憶部200に格納しておき、文書処理部120が読み出すこととしたが、外部記憶装置に保持されている電子文書を取得し、処理対象としても良い。この場合、例えば図11に示すネットワーク・インターフェイス10fを介して、ネットワーク上に設けられた外部記憶装置から閲覧しようとする電子文書を取得することができる。その他、上記の実施形態に、種々の変更または改良を加えたものも、本発明の技術的範囲に含まれる。
100…処理部、110…受け付け部、120…文書処理部、130…重要度計算部、140…検索結果処理部、150…表示制御部、200…記憶部、300…表示部、400…入力操作部

Claims (10)

  1. 文書中に含まれる特定の文を検索して出力する装置であって、
    検索対象の文書の検索に用いられる検索キーを取得する検索キー取得部と、
    検索対象の文書に含まれる各文の重要度を算出する重要度計算部と、
    前記検索キー取得部により取得された検索キーを用いて検索対象の文書に対して検索を行い、検索対象の当該文書から当該検索キーを含む文を抽出し、抽出された当該文の当該文書における位置の情報を取得する抽出部と、
    前記抽出部により抽出された各文に関して、当該抽出部により得られた検索対象の前記文書中における当該文の位置に基づき、前記重要度計算部により算出された当該文の重要度の値を修正して修正重要度を算出する重要度修正部と、
    前記重要度修正部により算出された修正重要度に基づく順番にしたがって、前記抽出部により抽出された文を出力する検索結果出力部と、
    を備える、装置。
  2. 前記重要度計算部は、検索対象の前記文書に含まれる各文に対して、当該文に含まれる単語の当該文書全体における出現数に基づき、重要度を算出する、請求項1に記載の装置。
  3. 前記重要度修正部は、前記重要度計算部により算出された各文の重要度に対して、検索対象の前記文書中における当該文の位置が前方であるほど大きい重み付けを行って修正する、請求項1または請求項2に記載の装置。
  4. 前記検索キー取得部は、検索対象の前記文書に含まれる一の文の一部または全部を指定することによって特定された部分を検索キーとして取得し、
    前記重要度修正部は、前記重要度計算部により算出された各文の重要度に対して、検索対象の前記文書中における当該文の位置が前記検索キーとして特定された部分を有する文に近いほど大きい重み付けを行って修正する、請求項1または請求項2に記載の装置。
  5. 前記重要度計算部は、検索対象の前記文書に含まれる単語に関するtf-idf(term frequency-inverse document frequency)に基づいて、当該文書に含まれる各文の重要度を算出する、請求項1に記載の装置。
  6. 文書中に含まれる特定の文を検索して出力する装置であって、
    文書を表示する表示部と、
    前記表示部に表示された文書における特定の部分の指定を受け付ける受け付け部と、
    前記受け付け部により受け付けた前記文書における前記特定の部分を検索キーとして、当該文書に対して検索を行い、検索対象の当該文書から当該検索キーを含む文を抽出し、抽出された当該文の当該文書における位置の情報を取得する抽出部と、
    前記表示部に表示された前記文書に含まれる各文に関して、当該文に含まれる単語の当該文書全体における出現数に基づいて求められた重要度と、前記抽出部により抽出された文に関する前記位置の情報とに基づいて、当該抽出部により抽出された文の表示順を決定する検索結果処理部と、
    前記検索結果処理部により決定された表示順にしたがって、前記抽出部により抽出された文を前記表示部に表示させる表示制御部と、
    を備える、装置。
  7. 前記検索結果処理部は、前記抽出部により抽出された各文の重要度に対して、前記位置の情報に基づき、前記文書中における当該文の位置が前方であるほど大きい重み付けを行って得られた値に基づき、当該抽出部により抽出された文の表示順を決定する、請求項6に記載の装置。
  8. 前記検索結果処理部は、前記抽出部により抽出された各文の重要度に対して、前記位置の情報に基づき、前記文書中における当該文の位置が前記検索キーを指定された文に近いほど大きい重み付けを行って得られた値に基づき、当該抽出部により抽出された文の表示順を決定する、請求項6に記載の装置。
  9. 文書を表示する表示部を備えたコンピュータにおける、当該文書中から特定の文を検索して当該表示部に表示させる方法であって、
    検索キーの入力を受け付けるステップと、
    受け付けた前記検索キーに基づいて、前記文書に対して検索を行い、検索対象の当該文書から当該検索キーを含む文を抽出し、抽出された当該文の当該文書における位置の情報を取得するステップと、
    前記表示部に表示された前記文書に含まれる各文に関して、当該文に含まれる単語の当該文書全体における出現数に基づいて求められた重要度と、前記検索キーに基づいて抽出された文に関する前記位置の情報とに基づいて、当該検索キーに基づいて抽出された文の表示順を決定するステップと、
    決定された表示順にしたがって、前記検索キーに基づいて抽出された文を前記表示部に表示させるステップと、
    を含む、方法。
  10. コンピュータを、
    検索対象の文書の検索に用いられる検索キーとして取得する検索キー取得手段と、
    検索対象の文書に含まれる各文の重要度を算出する重要度計算手段と、
    前記検索キー取得手段により取得された検索キーを用いて検索対象の文書に対して検索を行い、検索対象の当該文書から当該検索キーを含む文を抽出し、抽出された当該文の当該文書における位置の情報を取得する抽出手段と、
    前記抽出手段により抽出された各文に関して、当該抽出手段により得られた検索対象の前記文書中における当該文の位置に基づき、前記重要度計算手段により算出された当該文の重要度の値を修正して修正重要度を算出する重要度修正手段と、
    前記重要度修正手段により算出された修正重要度に基づく順番にしたがって、前記抽出手段により抽出された文を出力する検索結果出力手段として機能させる、プログラム。
JP2013122805A 2013-06-11 2013-06-11 文を検索する装置および方法 Expired - Fee Related JP6099046B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2013122805A JP6099046B2 (ja) 2013-06-11 2013-06-11 文を検索する装置および方法
US14/275,994 US9767186B2 (en) 2013-06-11 2014-05-13 Retrieving a specific sentence from a document

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2013122805A JP6099046B2 (ja) 2013-06-11 2013-06-11 文を検索する装置および方法

Publications (3)

Publication Number Publication Date
JP2014241034A true JP2014241034A (ja) 2014-12-25
JP2014241034A5 JP2014241034A5 (ja) 2016-03-31
JP6099046B2 JP6099046B2 (ja) 2017-03-22

Family

ID=52006359

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013122805A Expired - Fee Related JP6099046B2 (ja) 2013-06-11 2013-06-11 文を検索する装置および方法

Country Status (2)

Country Link
US (1) US9767186B2 (ja)
JP (1) JP6099046B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019106878A1 (ja) * 2017-11-28 2019-06-06 桂太 杉原 情報処理システム、情報処理方法、及びコンピュータプログラム

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2007062254A2 (en) 2005-11-28 2007-05-31 Commvault Systems, Inc. Systems and methods for data management
US20200257596A1 (en) 2005-12-19 2020-08-13 Commvault Systems, Inc. Systems and methods of unified reconstruction in storage systems
US8370442B2 (en) 2008-08-29 2013-02-05 Commvault Systems, Inc. Method and system for leveraging identified changes to a mail server
US8892523B2 (en) 2012-06-08 2014-11-18 Commvault Systems, Inc. Auto summarization of content
CN107077465A (zh) * 2015-02-20 2017-08-18 惠普发展公司,有限责任合伙企业 引用解释
US10353994B2 (en) 2015-11-03 2019-07-16 Commvault Systems, Inc. Summarization of email on a client computing device based on content contribution to an email thread using classification and word frequency considerations
US10540516B2 (en) 2016-10-13 2020-01-21 Commvault Systems, Inc. Data protection within an unsecured storage environment
CN109062895B (zh) * 2018-07-23 2022-06-24 挖财网络技术有限公司 一种智能语义处理方法
US11397776B2 (en) 2019-01-31 2022-07-26 At&T Intellectual Property I, L.P. Systems and methods for automated information retrieval
CN110399477A (zh) * 2019-06-20 2019-11-01 全球能源互联网研究院有限公司 一种文献摘要提取方法、设备及可存储介质
US11557284B2 (en) * 2020-01-03 2023-01-17 International Business Machines Corporation Cognitive analysis for speech recognition using multi-language vector representations
KR20210102617A (ko) * 2020-02-12 2021-08-20 삼성전자주식회사 전자 장치 및 그 제어 방법
US11461539B2 (en) * 2020-07-29 2022-10-04 Docusign, Inc. Automated document highlighting in a digital management platform
US11494417B2 (en) 2020-08-07 2022-11-08 Commvault Systems, Inc. Automated email classification in an information management system
US11841891B2 (en) * 2022-04-29 2023-12-12 Content Square SAS Mapping webpages to page groups

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000112967A (ja) * 1998-10-02 2000-04-21 Nippon Telegr & Teleph Corp <Ntt> 記事要約装置および記事要約処理方法および当該方法を記述したプログラムを記録した記録媒体
JP2005234635A (ja) * 2004-02-17 2005-09-02 Fuji Xerox Co Ltd 文書要約装置および方法
JP2009217802A (ja) * 2008-03-06 2009-09-24 Sharp Corp 文書処理装置、文書処理プログラムおよび記録媒体
JP2010266971A (ja) * 2009-05-12 2010-11-25 Ntt Data Corp 端末装置
US20100332498A1 (en) * 2009-06-26 2010-12-30 Microsoft Corporation Presenting multiple document summarization with search results

Family Cites Families (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3691844B2 (ja) * 1990-05-21 2005-09-07 株式会社東芝 文書処理方法
JP2729356B2 (ja) 1994-09-01 1998-03-18 日本アイ・ビー・エム株式会社 情報検索システム及び方法
JP3579204B2 (ja) 1997-01-17 2004-10-20 富士通株式会社 文書要約装置およびその方法
JPH11184865A (ja) 1997-12-19 1999-07-09 Matsushita Electric Ind Co Ltd 文書要約装置
JP3705917B2 (ja) 1998-03-03 2005-10-12 シャープ株式会社 文書処理装置
JP3429184B2 (ja) * 1998-03-19 2003-07-22 シャープ株式会社 テキスト構造解析装置および抄録装置、並びにプログラム記録媒体
JP3597697B2 (ja) * 1998-03-20 2004-12-08 富士通株式会社 文書要約装置およびその方法
JP2000222427A (ja) 1999-02-02 2000-08-11 Mitsubishi Electric Corp 関連語抽出装置、関連語抽出方法及び関連語抽出プログラムが記録された記録媒体
JP3791879B2 (ja) * 1999-07-19 2006-06-28 富士通株式会社 文書要約装置およびその方法
JP2002108887A (ja) 2000-09-29 2002-04-12 Canon Inc 文書検索装置、その装置へのキーワード追加方法、文書検索方法及びコンピュータ読み取り可能な記憶媒体
JP2002251394A (ja) 2001-02-22 2002-09-06 Nec Corp 全文検索システム
JP3746233B2 (ja) 2001-12-26 2006-02-15 株式会社東芝 知識分析システムおよび知識分析方法
JP2004062806A (ja) 2002-07-31 2004-02-26 Toshiba Corp 類似文書検索装置及び類似文書検索方法
US7505907B2 (en) 2002-09-27 2009-03-17 International Business Machines Corporation System and method for enhancing live speech with information accessed from the World Wide Web
US7395256B2 (en) 2003-06-20 2008-07-01 Agency For Science, Technology And Research Method and platform for term extraction from large collection of documents
JP2005250762A (ja) 2004-03-03 2005-09-15 Mitsubishi Electric Corp 辞書生成装置、辞書生成方法および辞書生成プログラム
JP4769005B2 (ja) 2005-03-31 2011-09-07 株式会社日立製作所 情報処理支援システム及び情報処理支援プログラム
JP2007200248A (ja) 2006-01-30 2007-08-09 Nippon Telegr & Teleph Corp <Ntt> 方法説明抽出方法及び装置及びプログラム及びコンピュータ読み取り可能な記録媒体
JP2008269086A (ja) 2007-04-17 2008-11-06 Fuji Xerox Co Ltd 情報推薦装置及び情報推薦システム
JP5416680B2 (ja) 2010-11-30 2014-02-12 日本電信電話株式会社 文書分割検索装置及び方法及びプログラム

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000112967A (ja) * 1998-10-02 2000-04-21 Nippon Telegr & Teleph Corp <Ntt> 記事要約装置および記事要約処理方法および当該方法を記述したプログラムを記録した記録媒体
JP2005234635A (ja) * 2004-02-17 2005-09-02 Fuji Xerox Co Ltd 文書要約装置および方法
JP2009217802A (ja) * 2008-03-06 2009-09-24 Sharp Corp 文書処理装置、文書処理プログラムおよび記録媒体
JP2010266971A (ja) * 2009-05-12 2010-11-25 Ntt Data Corp 端末装置
US20100332498A1 (en) * 2009-06-26 2010-12-30 Microsoft Corporation Presenting multiple document summarization with search results

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019106878A1 (ja) * 2017-11-28 2019-06-06 桂太 杉原 情報処理システム、情報処理方法、及びコンピュータプログラム

Also Published As

Publication number Publication date
US9767186B2 (en) 2017-09-19
JP6099046B2 (ja) 2017-03-22
US20140365475A1 (en) 2014-12-11

Similar Documents

Publication Publication Date Title
JP6099046B2 (ja) 文を検索する装置および方法
JP6480925B2 (ja) 識別されたエンティティーに基づく属性値の取り出し
JP7171438B2 (ja) ユーザインタフェース方法及び装置
US10346478B2 (en) Extensible search term suggestion engine
JP6062929B2 (ja) ツールバー上における関連検索の提示
US9721006B2 (en) Systems and methods for enabling searches of a document corpus and generation of search queries
CN106462630B (zh) 用于搜索视频内容的方法、系统和介质
EP3074888B1 (en) Contextual information lookup and navigation
US10691655B2 (en) Generating tables based upon data extracted from tree-structured documents
US9519703B2 (en) Refining search results for a compound search query
US10409882B2 (en) Method and apparatus for navigation in webpage
KR20110099225A (ko) 제안된 미세 조정 용어 및 버티컬 검색의 검색 결과 미리보기
US9092509B2 (en) Search query user interface
JP2015204105A (ja) 推薦情報を提供するための方法および装置
US20150178289A1 (en) Identifying Semantically-Meaningful Text Selections
US20210406268A1 (en) Search result annotations
JP6157965B2 (ja) 電子機器、方法、およびプログラム
US20190347295A1 (en) Display apparatus and display method
CN116467432A (zh) 展示查词结果的方法及相关产品
JP5703244B2 (ja) トレース支援装置、トレース支援システム、トレース支援方法、およびトレース支援プログラム
US11150871B2 (en) Information density of documents
JP2001092842A (ja) 情報探索方法および探索プログラムを記録した記録媒体
JP2022054015A (ja) 出力装置、出力プログラム及び出力方法
JP2015022654A (ja) 電子機器および方法、プログラム
WO2023069176A1 (en) Knowledge attributes and passage information based interactive next query recommendation

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20151127

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160216

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20161014

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20161018

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20161226

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20170124

RD14 Notification of resignation of power of sub attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7434

Effective date: 20170124

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20170214

R150 Certificate of patent or registration of utility model

Ref document number: 6099046

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees