JP2008269069A - 情報処理システム及び情報処理方法 - Google Patents

情報処理システム及び情報処理方法 Download PDF

Info

Publication number
JP2008269069A
JP2008269069A JP2007108282A JP2007108282A JP2008269069A JP 2008269069 A JP2008269069 A JP 2008269069A JP 2007108282 A JP2007108282 A JP 2007108282A JP 2007108282 A JP2007108282 A JP 2007108282A JP 2008269069 A JP2008269069 A JP 2008269069A
Authority
JP
Japan
Prior art keywords
block
document
display
search
label
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2007108282A
Other languages
English (en)
Other versions
JP5103051B2 (ja
Inventor
Masakazu Fujio
正和 藤尾
Minenobu Seki
峰伸 関
Katsumi Marukawa
勝美 丸川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP2007108282A priority Critical patent/JP5103051B2/ja
Publication of JP2008269069A publication Critical patent/JP2008269069A/ja
Application granted granted Critical
Publication of JP5103051B2 publication Critical patent/JP5103051B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Information Transfer Between Computers (AREA)
  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Abstract

【課題】文書中の検索クエリと関連の高い領域のみをコンパクトに圧縮して表示するとともに、閲覧漏れのリスクを抑える。
【解決手段】検索キーと関連度の高い部分領域を表示するために、文書を部分領域(ブロック)に分割し、ブロック単位の検索を行い、検索結果のブロック集合から特徴度を持った特徴ベクトルを生成し、その特徴ベクトルとの類似度が高いブロックを追加表示する。非表示ブロックの内容を表すラベルを生成するために、文字列もしくは文字列の種類を表すタグごとに、表示ブロックにおける文特徴度と、非表示ブロックにおける特徴度の和を重要度とし、重要度の高いものを非表示ブロックのラベルとして表示する。
【選択図】図1

Description

本発明は、情報配信に用いることのできる情報処理システム及び情報処理方法に関する。
企業、官公庁等の機関は、顧客獲得や安心・安全な生活実現のための情報の提供を行っている。しかし膨大なコンテンツが存在する中、エンドユーザや知的労働者の多くは、必要な情報の取捨選択に多大な時間を費やし、途中で断念する場合が起きている。その結果、各機関はビジネスチャンスを逃し、調査などを行う知的労働者は必要な情報を得る機会を損ねるという問題が生じている。
そのため非特許文献1は、約款・マニュアル等の長い文書の場合や、スクロールが必要となる縦長のホームページについて、検索キーを含まない領域を省いて圧縮表示するインタフェースを提案している。また、モバイル端末等にコンテンツを配信する際に、既存のWebページをモバイル端末向けに変換して配信する技術が知られている(非特許文献3−6)。これらの技術では、ロゴやバナー広告、ナビゲーションバーを省略したり、文字情報を含む画像から文字を認識し、文字のみを送信する(非特許文献4)などの研究がなされている。
特開2003-288334号公報 特開2000-155758号公報 品川「ユーザプロファイルに基づくビューページの動的生成によるWWW閲覧支援」情報処理学会論文誌、データベース、Vol.41, No.SIG 6 (TOD7), pp.22-36 関「構造要約化による情報提供システム」FIT2006、I-047 Xiao-Dong Gu, Jinlin Chen, Wei-Ying Ma, Guo-Liang Chen, "Visual Based Content Understanding towards Web Adaptation", In Proceedings of AH-2002, pp164-173 Jianying Hu, Amit Bagga, "Functionality-Based Web Image Categorization", Proc. of the 10th International World Wide Web Conference 2001, 587-596 塚本修一, 増田英孝, 中川裕志「携帯端末表示を目指したHTMLの表形式データの構造認識と変換」情報処理学会, 2003年情報学シンポジウム, pp.5-8 工藤 拓、松本 裕治「チャンキングの段階適用による日本語係り受け解析」情報処理学会論文誌、Vol.43,No.6,pp.1834-1842
しかし非特許文献1では、上記手法はいずれもキーワードを含むブロックもしくはキーワードと類似するブロックを元に表示する領域を決定しているため、適切なキーワードを与えられない場合は必要な情報が要約表示に含まれない。そのため個別にページを開いて内容を把握する手間は従来と変わらず、情報探索効率の低下は避けられない。
また、非特許文献3−5では、個別のWebページをどうコンパクトに変換して表示するかに焦点が絞られており、大量の検索結果をどう処理するかについては考慮されていない。特に携帯端末で情報を得る場合には、無駄なパケット送信を減らすことが、スピード及び価格面での通信コスト削減に繋がる。通信途中においても、要、不要が判断できれば、途中で無駄なパケット送信を止めることができる。
検索結果の文書中には、検索内容と無関係な情報も多く含まれている。そのため、欲しい内容のみを簡便に把握し、かつ閲覧漏れの危険を減らす手段として、検索キーと関連度が高い部分領域を表示し、非表示ブロックについては内容を表すラベルを表示することができるシステムを提供する。
検索キーと関連度の高い部分領域を表示するには、文書を部分領域(ブロック)に分割し、ブロック単位の類似検索を行う(一次検索)。次に、検索結果のブロック集合から、出現単語による特徴ベクトルを生成し、その特徴ベクトルと類似するブロックを追加検索する(二次検索)。二次検索結果のブロックは、ブロック全体の特徴度が増加する間、表示領域として順次追加する。
ブロックあるいはブロック集合から特徴度を持った特徴ベクトルを生成するには、検索結果の文書群から特徴用語を特徴度順に抽出する連想検索法(特開2000-155758号公報)が適用できる。
非表示ブロックの内容を表すラベルを生成するために、例えば非特許文献6による方法により、文中の単語や文字列に、その種類を現すラベル(タグ)を付与する。次に、単語、文字列、タグごとに、表示ブロックにおける特徴度と、非表示ブロックにおける特徴度を計算する(特開2000-155758号公報)。そしてその二つの値の和を重要度とし、重要度の高いものを非表示ブロックのラベルとして表示する。表示方法は、重要度ごとに文字のサイズをかえるタグクラウド形式(Flicker, http://www.flickr.com/photos/tags/)などが使える。
ラベルとして、単語bi-gramを用いてもよく、その場合bi-gramの関係は、タイトルと単語のbi-gram、表構造から得られる項目−値関係のbi-gram、文書の係り受け解析から得られる主語、目的語、動詞などの係り受け関係を用いてもよい。
ユーザは、表示されたラベルの組合せにより、要約文章がなくても非表示領域の内容を推測することができる。例えば、“人名”、“年齢”、“性別”、“日付”などのラベルを持つブロックがあれば、ある人物のプロフィールについてかかれているのだろうと推測できる。
携帯端末など表示領域が制限された媒体に文書を送信する際には、最初にラベル情報のみを送信する。ユーザは、ラベルの集合を見ることにより、書かれている内容を推測し、通信途中でも情報の取捨選択が可能となる。
文書内の領域のうち、検索クエリと関連の高い領域のみを表示することで、欲しい内容だけを俯瞰することが容易になる。また、省略された領域については、その領域に含まれるラベル(タグ)の組合せを見ることにより、書かれている内容を推測することができ、閲覧漏れの危険を減らすことができる。
また、携帯端末など表示領域が制限されたデバイスに対しても、コンテンツを全て送信する前にラベルの組合せのみを最初に配信することにより、送信パケット量を少なくしたまま、内容の取捨選択が可能となる。
まず、最初に用語の説明をする。本発明において、タグという表現が何度か出てくる。ここでいうタグとは、単語もしくは文字列の種類を表すラベルを意味する。例えば、“ベートーベン”という単語は“人名”というタグが付与される。また“○○市△△町1丁目1番地”という文字列は、“住所”というタグが付与される。タグの種類は分野依存なため、分野ごとに定義されることが多いが、一般的に使えるものも存在する。例えばDublin Core(DCMS (Dublin Core Metadata Element Set), http://dublincore.org/documents/dcmi-terms/)では、文書で使われることの多い“title”、“creator”、“subject”、“publisher”、“date”などのタグを定義している。また、IREX(NE)(http://nlp.cs.nyu.edu/irex/NE/df990214.txt)では、“ORGANIZATION”、“PERSON”、“LOCATION”、“ARTIFACT”、“DATE”、“TIME”、“MONEY”、“PERCENT”というタグの抽出を課題としている。
次に単語bi-gram、n-gramについて説明する。bi-gramとは、隣接関係や文中の同時出力関係によって定義される2項関係のことを意味する。文字bi-gramといえば、通常隣接する文字のことをいい、単語bi-gramといえば、隣接する単語ペアや、係り受け関係にある単語ペアを指すことが多い。n-gramは、bi-gramの概念を拡張したものであり、同一文書内に出現するn単語、係り受け関係にあるn単語を表すことが多い。
次に、本発明における実施例について述べる。本発明では、文書の論理構造に基づき、文書内の領域のうち、検索クエリと関連の高い領域のみを表示することで、欲しい内容だけを俯瞰することが容易になる。また、省略された領域については、その領域に含まれるラベル(タグ)の組合せを見ることにより、書かれている内容を推測することができ、閲覧漏れの危険を減らすことができる。文書の構造に基づいて要約表示を行うので、自然言語処理によって要約文章を作成する場合に比べて処理速度が速く、また要約精度を気にする必要がない。以降、上記文書構造に基づく要約機能のことを「構造要約」と呼ぶ。
図1は、構造要約機能を閲覧中の文書に対して実行する場合の本発明の閲覧システム構成例を表す。それに付加する形で、全文検索機能と連携するシステム構成が考えられる。全文検索機能と連携する方法には、大きく分けて4パターンのシステム構成(図8A、図10、図13、図16)が考えられる。一つ目のシステム構成(図8A)では、デスクトップ検索機能と連携し、クライアントPC内の文書に対して構造要約表示を実現する。デスクトップ検索とは、クライアントPC内のWord、Excel、PDFなどのファイルを検索する機能を言う。二つ目のシステム構成(図10)では、構造要約機能を提供しているWebサイト内の検索機能と連携し、当該サイトのWeb文書に対して構造要約表示を実現する。三つ目のシステム構成(図13)では、中継サーバに構造要約機能を持たせることで、Google、Yahoo!などの検索サイトで検索した一般のWeb文書に対して構造要約機能を実現する。四つ目のシステム構成(図16)では、構造要約型の検索ポータルサイトを用意することで、当該サイトで検索したユーザに対し、検索結果Web文書の構造要約表示を実現する。四つ目の構成では、通常の検索ポータルサイトよりも集客効果が高い検索サイトを構築できると考えられる。
以下ではまず、個別の文書を構造要約する場合の実施例について述べたあと、上記4パターンのシステム構成について説明する。
本発明における第一の実施形態では、ユーザによって入力されたキーワード(複数可)に基づいて、閲覧中の(長い)文書から関連する領域のみをまとめて表示(構造要約)し、また非表示領域については、その内容に関連するラベルを付与して表示する機能を実現する。これにより、非表示領域の閲覧漏れを防ぎつつ、検索クエリに関連する領域のみを俯瞰することができる。また、表示サイズを減らすことにより、携帯端末に配信する際の通信コストを削減することができる。
以下、図を用いて本発明における構造要約機能の実施例を詳細に説明する。
図1は、閲覧中の長い文書を構造要約する場合のシステム構成の一例である。閲覧システム100は、クエリ入力手段110、ブロック検索手段120、文書構造化手段140、ブロック抽出手段145、類似ブロック追加手段150、ブロック縮約/展開表示手段160、縮約/展開切り替え手段170、非表示ブロックラベル生成手段180から構成される。以下図2Aを参照しながら、図1の各構成要素の機能について説明する。図2Aは、Acrobat Readerのような文書閲覧ソフトで文書を表示している状態を表す。文書構造化手段140は、閲覧中の文書の物理的な構造を解釈し、論理的な階層関係、並列関係を抽出し、木構造を生成する。文書の構造化には既存の構造化手法(特許文献1、非特許文献3等)を用いることができる。
ここで、詳細説明を進める前に、文書構造化処理について説明する。図2Fに、構造化文書の例を示す。221は元文書の例を表す。これらの文書に対し、特許文献1、非特許文献3にある方法などを用いて、文書の構造解析を行い、222のように論理的なまとまりのあるブロック(Q1〜Q5)を抽出する。論理的なまとまりのあるブロックは階層構造を持ち、この例では、223のような論理構造で表現することができる。構造要約表示の単位となるブロックは、このようにして構成された木構造をひとつの切断面で区切ることで得られる。例えば図2Gの例では、切断面230により、ブロックQ1、Q2、Q6、Q7、Q8、Q4、Q5が得られる。この切断面は、例えば各ブロック(Q1...Q13...)の文書量や表示領域サイズの閾値により固定的にきめてもよいし、検索クエリとの類似度の閾値により、動的に変更してもよい。
再び図1の説明に戻る。検索クエリに応じて、このブロック単位で表示、非表示を切り替える。さて、閲覧文書の構造化が行われた状態で、クエリ入力手段110は、ユーザから検索キーワード入力を受けつける。これは、例えば図2Aに示したダイアログボックス201で実現できる。図2Aの例では、“OCR”というキーワードを入力している。キーワードはスペースで区切って複数入力してもよい。ダイアログ内の検索ボタンをクリックすると、ブロック検索手段120は、クエリに類似するブロックを検索する(一次検索)。これには、特許文献2などで示されるベクトル空間モデルの他、キーワード間の関係性に基づく検索を行う。次に、類似ブロック追加手段150は、前述の一次検索結果ブロックに含まれるテキスト中の単語を元に、特徴度付の単語ベクトルを計算する。ブロックあるいはブロック集合から特徴度を持った特徴ベクトルを生成するには、検索結果の文書群から特徴用語を特徴度順に抽出する連想検索法(特開2000-155758号公報)が適用できる。この単語ベクトルを元にして、類似ブロックを検索する(二次検索)。二次検索結果のブロックは、類似度が大きい順に、表示ブロック候補として逐次的に追加する。その際、追加後のブロック全体において、特徴度の減少が見られた場合、ブロック候補の追加をやめる。特徴度の計算方法については、後ほど説明する。以上の仕組みにより、検索クエリと関連度の高い領域を選択することができる。
ブロック縮約/展開表示手段160は、前記判定結果にもとづき、文書中の重要なブロックを展開表示し、そうでないブロックを構造要約表示する。縮約/展開表示切り替え手段170は、表示ブロックあるいは非表示ブロックのクリックと連動し縮約・展開表示を切り替える。図2Aでは、ブロック204が非表示状態となっており、その他の領域が表示状態となっている。
非表示ブロックラベル生成手段180は、表示ブロックと非表示ブロックの内容を表すラベルを生成する。非表示ブロックの内容を表すラベルを生成するために、例えば非特許文献6による方法により、文中の単語や文字列に、その種類を表すラベル(タグ)を付与する。次に、単語、文字列、タグごとに、表示ブロックにおける特徴度と、非表示ブロックにおける特徴度を計算する(特開2000-155758号公報)。そしてその二つの値の和を重要度とし、重要度の高いものを非表示ブロックのラベルとして表示する。表示方法は重要度ごとに文字のサイズをかえるタグクラウド形式などが使える。図2Aのタグクラウド209は、表示ブロック全体のタグクラウドを現し、タグクラウド210は、非表示ブロック全体のタグクラウドを表す。タグクラウドを参照することにより、ユーザが見落としていた別の単語による再検索を支援できる。タグクラウドに表示すべき特徴ラベルの計算方法の一例については後ほど例示する。
ラベルとして、単語bi-gramを用いてもよく、その場合bi-gramの関係は、タイトルと単語のbi-gram、表構造から得られる項目−値関係のbi-gram、文書の係り受け解析から得られる主語(S)、目的語(O)、動詞(V)などの係り受け関係を用いてもよい。例えば、“PCの価格はXXX円。”という文からは、「PC&価格」「価格&XX円」等のbi-gram関係を抽出することができる。また、“A保険は、ガン・生活習慣病による4日以上からの入院を保障する。”という文では、主語(S)が“A保険”、目的語(O)が“入院”、動詞(V)が“保障する”である。この場合、「A保険&保障」「入院&保障」「4日以上&入院」「ガン・生活習慣病&入院」等のbi-gram関係を抽出することができる。
本システム構成により、約款、マニュアル等の長い文書でも、文書内の領域のうち、検索クエリと関連の高い領域のみを表示することで、欲しい内容だけを俯瞰することが容易になる。また、省略された領域については、その領域に含まれるラベル(タグ)の組合せを見ることにより、書かれている内容を推測することができ、閲覧漏れの危険を減らすことができる。
≪関連ブロック検索方法の説明≫
ここで、ブロックの一次検索及び二次検索で用いられる類似検索の原理について説明する。一般に類似文書検索では、文書や単語集合をクエリとして類似文書を検索する。その場合、文書を構成する単語の頻度分布の数学的な類似度(ベクトルとしての角度のコサインなど)を用いて類似度の高い順にソートして必要とされる個数の上位を出力する。検索される対象は単語集合を持つものであればよいので、本発明の例のように、文書の構造により決定されるブロック単位で類似検索を行ってもよい。
また、複数単語を用いたブロック単位検索の方法として、論理関係を用いた検索方法も考えられる。例えば、入力されたキーワードの組み合わせの修飾−非修飾関係、階層関係、並列関係を推定し、同じ関係で単語が現れるブロックを検索することもできる。図2Bに、キーワードの組合せと、推定される関係について3パターンの例を挙げる。例211では、“レアチーズケーキ”と“作り方”というクエリに対して、修飾−非修飾関係を推定している。この場合、図2Cのケース1のように、文中に「レアチーズの作り方」というように、格助詞“の”を伴って修飾関係にある文を含むブロックが適合ブロックとなる。また、図2Cの例に見られるような文書の論理構造を抽出した結果、“レアチーズケーキ”という見出しの下位見出しに“作り方”という文字列が現われていれば、それについても適合ブロックと判断する。例212では、カメラの機種である、“AAA”と“BBB”に対して、並列の関係を推定している。この場合、文書の論理構造を抽出した結果、“AAA”と“BBB”が、同じ階層の見出しに現われていれば適合ブロックと判断する。同様に、あるブロックに存在する表データで、“AAA”、“BBB”が並列項目として現われていれば、適合ブロックと判断する。キーワードの組に対する関係の推定には、京大コーパス(http://nlp.kuee.kyoto-u.ac.jp/nl-resource/corpus.html)などの正解タグ付きコーパスを用いることができる。三つ目の例である213では、“観光”と“温泉”に対して、階層関係を推定している。この場合、文書の論理構造を抽出した結果、“観光”という見出しの下位見出しに“温泉”という文字列が現われているブロックを適合ブロックと判断する。また、あるブロックに存在する表データの、項目−値関係に“観光”と“温泉”が現われていれば、適合ブロックと判断する。以上で、検索キーに対するブロック検索方法の説明を終わる。
≪領域類似度の計算方法≫
以下に、ブロック内の単語の特徴度を元に、ブロック間の類似度を計算する方法の一例を示す。式(1)は、超幾何分布関数に基づき各単語の出現の“珍しさ”を計算する式を表す。
Figure 2008269069
式(1)では、各単語の重みを、超幾何分布関数の対数を用いて表している。これにより、着目しているブロックに特異的に出現する(もしくは特異的に出現しない)単語ほど、重みの値が大きくなる。その他、検索結果の文書群から特徴用語を特徴度順に抽出する連想検索法(特開2000-155758号公報)を適用し、単語及びタグの重みを計算してもよい。
≪領域重要度の計算方法≫
以下に、領域の重要度に従って、類似度に従って、二次検索結果のブロックを追加する手順について説明する。式(2)によって計算されるブロック間類似度の高いブロックから順に表示ブロックを追加する。ブロックの追加は、以下の条件を満たす範囲で行う。
Figure 2008269069
式(3)は、拡張前後のブロックを規準としたときの、各単語の式(1)における重みの総和を計算し、その値が減少する時点でブロックの拡張をとめることを表す。その他、類似度の閾値で区切るなどの手段をとることもできる。
≪表示ラベル重要度の決定方法≫
表示ブロックラベル生成手段180は、前記表示ブロックと非表示ブロックの文字列の分布に従い、各非表示ブロックに特徴的な単語やタグを選択し、要約表示に反映させる。特徴量の計算は、例えば以下のように行う。
Figure 2008269069
式(4)を用いることにより、文書全体と比べて特徴的かつ非表示ブロックの中で特徴的な単語が重視される。これにより、非表示ブロックそれぞれの内容をよく表すラベルを生成できる。また、現在の表示状態と連動して選択されるラベルが変化し得るため、キーワードの不備による検索漏れの可能性を減らすことができる。
以上の類似度検索方法を用いて、上記一次検索と二次検索を実施することができる。図4の模式図で、一次検索と二次検索についてもう少し説明する。クエリ単語410は、検索クエリで指定されたキーワード集合を表す。まず上で説明した関連ブロック検索方法により、構造化済み文書から関連ブロックを抽出する。図4の文書430では、ブロック411、412、413が抽出されている。次に、ブロック411、412、413中の単語の頻度ベクトルに従い、重み付きベクトル420を生成する。このベクトルを元に、上記領域重要度の計算(2次検索)を行う。図4では、2次検索結果として、ブロック414、415、416が抽出されている。矢印421、422、423の線の太さは、類似度の高さを表している。この例では、ブロック414、415を追加するまでは、選択ブロック全体の特徴度が上がったが、ブロック416を追加した時点で特徴度が下がったため、棄却ブロックとされた状態を表す。最後に、1次検索結果と追加ブロック結果を合わせて構造要約文書450を出力する。
≪実際の表示GUIの説明≫
図2Aは、検索キーワード“OCR”により、閲覧中の文書を構造要約した場合の表示例を表す。ブロック202、203、205、206、207、208が展開領域であり、ブロック204が縮約領域である。構造要約表示領域は、段落を代表する文、例えば先頭数行などを表示している。これらの展開、非展開領域は、マウスによるクリック操作で切り替えられる。以上のような表示方法により、展開表示ブロックについては元文書のレイアウトを保持したままで、全体文書量を圧縮する。また、展開領域の特徴単語を表すタグクラウド209及び非展開領域の特徴単語を表すタグクラウド210により、ユーザが見落としていた単語による再検索を支援する。
図3は、図2Aと同じ文書を別のキーワード“カラー”により構造要約した場合の表示例を表す。ブロック315、335、355が展開領域であり、それ以外のブロック325、345、365、375、385は構造要約表示されている。構造要約表示領域は、段落を代表する文、例えば先頭数行などを表示している。
領域395は、構造要約表示領域の一つである。この領域は、構成要素の一つに図を含んでいるため、要約表示の中に縮小した図391を表示している。これらの展開、非展開領域は、マウスによるクリック操作で切り替えられる。以上のような表示方法により、展開表示ブロックについては元文書のレイアウトを保持したままで、全体文書量を圧縮する。また、展開領域の特徴単語を表すタグクラウド3110及び非展開領域の特徴単語を表すタグクラウド3120により、ユーザが見落としていた単語による再検索を支援する。
以上の表示方法により、約款、マニュアル等の長い文書でも、文書内の領域のうち、検索クエリと関連の高い領域のみを表示することで、欲しい内容だけを俯瞰することが容易になる。また、省略された領域については、その領域に含まれるラベル(タグ)の組合せを見ることにより、書かれている内容を推測することができ、閲覧漏れの危険を減らすことができる。
この他、ラベル(タグ)の生成及びタグクラウド表示を、ブロックごとに行ってもよい。図5は、タグクラウドをブロック別に生成した場合の構造要約表示例を表す。非表示ブロックである511、531、541、551のそれぞれに対して、タグクラウド560、570、580、590を表示している。境界510、520、530、540は、ブロック間の境界を表す。以上のように、非表示領域の特徴を表すラベルを併記することにより、閲覧漏れの危険を減らしつつ、欲しい内容だけを俯瞰することが容易になる。また、省略された領域については、その領域に含まれるラベル(タグ)の組合せを見ることにより、書かれている内容を推測することができ、閲覧漏れの危険を減らすことができる。
図6は、携帯端末などの表示領域が限られた媒体向けの構造要約表示例をあらわす。図2Fの文書221に対し、主要な領域についてラベルの集合で置き換えた様子を表す。携帯端末などに文書を配信する際、初期段階は元の文書をラベルで置き換えたデータを配信し、後から中身を配信する手段が考えられる。これにより、全体の送信データ量が削減できるだけでなく、ラベルの集合を見て書かれている内容を推測し、通信途中でも情報の取捨選択ができる。
図7は、ページ内検索操作と構造要約表示の関係を時系列に沿って示した説明図である。左のラインがユーザ操作の流れ、右のラインが閲覧装置の処理の流れを表す。まず、文書閲覧装置に文書が読み込まれると、閲覧文書の構造化(E705)を実行する。あらかじめ構造化した文書をデータベースに蓄積しておき、開いたファイルのIDに基づいて構造化文書を読み込んでもよい。次に、構造化された文書を基に、ブロックの抽出(E706)を行う。これには既に図2Gで説明した方法に基づき行う。特定のクエリに関係した領域を構造要約表示したいユーザは、ページ内検索操作を実行する(E700)。閲覧装置は、入力されたクエリを元に、ブロック検索(一次検索)(E710)を実行する。次に、一次検索結果のブロックから生成された重み付き単語ベクトルを基に、類似ブロック追加処理(E720)を実行する。そして、先に説明した方法により、ブロックラベルの生成(E730)を行う。そして、クエリとの関連度判定結果に基づき、ブロック単位で表示/非表示を切り替え(E740)、必要に応じてラベルを付与する。ユーザは、構造要約表示されたページの閲覧操作を行う(E750)。以上が、検索から構造要約表示までの操作の流れを表す。
以上の一連の操作により、約款、マニュアル等の長い文書でも、文書内の領域のうち、検索クエリと関連の高い領域のみを表示することで、欲しい内容だけを俯瞰することが容易になる。また、省略された領域については、その領域に含まれるラベル(タグ)の組合せを見ることにより、書かれている内容を推測することができ、閲覧漏れの危険を減らすことができる。
図8Aは、デスクトップ検索機能と連携し、クライアントPC内の文書に対して構造要約表示を実現する場合のシステム構成例を表す。デスクトップ検索とは、クライアントPC内のWord、Excel、PDFなどのファイルを検索する機能を言う。閲覧システム100は、クエリ入力手段110、ブロック検索手段120、文書構造化手段140、ブロック抽出手段145、類似ブロック追加手段150、ブロック縮約/展開表示手段160、縮約/展開切り替え手段170、非表示ブロックラベル生成手段180に加えて、検索結果の文書を選択する文書選択手段105を持ち、またデスクトップ検索装置側に文書検索手段130を持つ。図1との違いは、クエリ入力に対し、まずデスクトップ検索を実行する点である。検索結果の文書が取得されたあとは、図7で説明した構造要約フローと同様である。
以上の一連の操作により、検索結果文書が長い場合でも、文書内の領域のうち、検索クエリと関連の高い領域のみを表示することで、欲しい内容だけを俯瞰することが容易になる。また、省略された領域については、その領域に含まれるラベル(タグ)の組合せを見ることにより、書かれている内容を推測することができ、閲覧漏れの危険を減らすことができる。
図8B、C、Dは、デスクトップ検索と組み合わせて構造要約を実行する場合のユーザインタフェース画面遷移例を表す。図8Bは、情報閲覧装置の全文検索用ダイアログボックス810に検索クエリ“カラー”を入力した状態を表す。全文検索ボタン811を押すと、検索結果812が得られる。図8Cは、検索結果文書813を選択した状態を表し、ボタン814を押すことで、選択文書に対し構造要約が実行され、構造要約文書、図8Dが得られる。
以上の一連の操作により、検索結果文書が長い場合でも、文書内の領域のうち、検索クエリと関連の高い領域のみを表示することで、欲しい内容だけを俯瞰することが容易になる。また、省略された領域については、その領域に含まれるラベル(タグ)の組合せを見ることにより、書かれている内容を推測することができ、閲覧漏れの危険を減らすことができる。
図9は、ユーザ操作と構造要約表示の関係を時間軸に沿って示した説明図である。左のラインがユーザの操作の流れ、真ん中のラインが文書閲覧装置の流れ、右側のラインが全文検索用データベース処理の流れを表す。構造要約の基本的な流れは図7と同じである。全文検索機能と連携するフローが新たに加わる形となる。まず、ユーザは操作(E900)により、検索クエリを入力する。入力されたクエリはキーワード情報などの形式で文書閲覧装置に送られる。キーワードを受け取った文書閲覧装置は、キーワードによるデスクトップ検索処理(E910)を実行する。全文検索用データベースは、検索用インデックスの参照処理(E920)を行い、結果文書の出力処理(E930)を行う。文書閲覧装置は、受け取った文書とキーワードを基に、図7のフローに従い構造要約(E940)を行う。構造要約表示された文書はユーザ側に送られ、操作950によりユーザに閲覧される。以上が、検索から構造要約表示までの時間軸上の操作系列を表す。
次に、構造要約表示された文書の表示状態を自由に切り替える場合の操作系列を説明する。ユーザは、縮約・展開表示を切り替えたい領域をクリック操作(E960)する。クリック情報は、座標情報として情報提供サーバに送られる。情報提供サーバは、クリック座標位置を含む領域の表示状態(構造要約表示か展開表示か)の判定(E970)を行う。そして、縮約・展開表示の切り替え処理(E980)を行う。ユーザは、表示状態が変更された構造要約文書の閲覧操作(E990)を行う。
以上の一連の操作により、検索結果文書が長い場合でも、文書内の領域のうち、検索クエリと関連の高い領域のみを表示することで、欲しい内容だけを俯瞰することが容易になる。また、省略された領域については、その領域に含まれるラベル(タグ)の組合せを見ることにより、書かれている内容を推測することができ、閲覧漏れの危険を減らすことができる。
図10は、Webサイトを立ち上げているサイトで構造要約機能を実現する場合のシステム構成の一例である。図1、図8Aにおける文書閲覧装置のかわりに、Webブラウザ1000が閲覧装置として用いられる。Webサーバ1010は、ホームページを提供しており、ネットワークを介してユーザから参照できる状態にあるものとする。図8Aのシステム構成において、文書閲覧装置側にあった、ブロック検索手段120、文書構造化手段140、ブロック抽出手段145、類似ブロック追加手段150、非表示ブロックラベル生成手段180がWebサーバ側に移動しているが、機能については図1、図8Aと変わらない。あらたにWebサーバ側に加わった文書検索手段130はWebサイト内の文書検索機能を提供する。また、文書生成手段190は、構造要約結果のWeb文書を生成し、クライアント側に送信するHTMLデータを作成する。構造要約自体の処理フローは、図7と同様である。
以上のシステム構成により、公開Webサイトを検索したユーザに対し、検索結果文書が長い場合でも、文書内の領域のうち、検索クエリと関連の高い領域のみを表示することで、欲しい内容だけを俯瞰する機能を提供できる。また、省略された領域については、その領域に含まれるラベル(タグ)の組合せを見ることにより、書かれている内容を推測することができ、閲覧漏れの危険を減らすことができる。
このタイプのシステム構成では、ユーザが直接Webサイトに訪れて、サイト内の検索機能を用いて構造要約を実行する場合の処理フロー(図11)と、Google、Yahoo!などの一般の検索サイトの検索結果として、Webサイトを訪れる場合の処理フロー(図12)が考えられる。以下にそれぞれのフローについて説明する。
図11は、Webサイトに設置されているサイト内検索処理と構造要約表示処理の流れの説明図である。左のラインはユーザ操作の流れ、真ん中のラインはWebサーバ処理の流れ、右のラインは文書データベース処理の流れを表す。
ユーザは、まず検索クエリを入力してサイト内検索操作を実行する(E1100)。入力されたクエリはキーワードなどの形式で、サーバに送信される。キーワードを受け取ったサーバは、サイト内検索処理を実行する(E1110)。データベースは、検索用インデックス121を参照し(E1120)、検索結果を出力する(E1130)。サーバは、受け取ったWebページ・文書とキーワードを基に、構造要約を実行する(E1140)。キーワードリストと文書が渡されるので、構造要約フローそのものは、図7と同じフローで行える。構造要約表示されたWebページ・文書はユーザ側に送られ、ユーザが閲覧する(E1150)。
以上の一連の操作により、公開Webサイトのサイト内検索機能を利用するユーザに対し、構造要約機能を提供できる。すなわち、検索結果文書が長い場合でも、文書内の領域のうち、検索クエリと関連の高い領域のみを表示することで、欲しい内容だけを俯瞰する機能を提供できる。また、省略された領域については、その領域に含まれるラベル(タグ)の組合せを見ることにより、書かれている内容を推測することができ、閲覧漏れの危険を減らすことができる。
図12は、Google、Yahoo!等の一般のWeb検索サイトの検索結果から、Webサイトを訪問する場合の構造要約フローを時系列に沿って示した説明図である。左のラインはユーザ操作の流れ、真ん中のラインは一般のWeb検索サイトの流れ、右側のラインは訪問サイト処理の流れを表す。
まず、ユーザは検索クエリを入力してWeb検索サイトからWebページ・文書の検索を行う(E1200)。Web検索サイトは、当該サイトの持つ検索機能により、検索を実行し(E1210)、検索結果を出力する(E1220)。ユーザも通常のWeb検索と同じ操作により、参照文書を選択し(E1230)、訪問サイトに文書の取得要求を通知する。訪問サイトでは、参照元情報から検索キーワード情報を抽出し(E1240)、構造要約を実行する(E1250)。キーワードリストが分かっているので、図7と同じフローで構造要約が実行できる。構造要約表示されたWebページはユーザ側に送信される(E1260)。ユーザは、構造要約表示されたWebページ・文書を閲覧する(E1270)。
以上の一連の操作により、一般のWeb検索サイトから特定のWebサイトに到達したユーザに対し、構造要約機能を提供できる。すなわち、検索結果文書が長い場合でも、文書内の領域のうち、検索クエリと関連の高い領域のみを表示することで、欲しい内容だけを俯瞰する機能を提供できる。また、省略された領域については、その領域に含まれるラベル(タグ)の組合せを見ることにより、書かれている内容を推測することができ、閲覧漏れの危険を減らすことができる。
図13は、中継サーバにより任意のWebページに対して構造要約機能を提供する場合のシステム構成の一例である。図1、図8Aにおける文書閲覧装置のかわりに、Webブラウザ1300が閲覧装置として用いられる。検索サイト1310は、一般のWeb検索サイトを表す。中継サーバ1330は、Webブラウザ1300と、検索サイト1310もしくは訪問サイト1320とのHTTP通信を中継するサーバを表す。中継サーバ1330は、図1、図8Aにおける文書閲覧装置の機能のうち、文書構造化手段140、ブロック抽出手段145、ブロック検索手段120、類似ブロック追加手段150、非表示ブロックラベル生成手段180に加えて、文書生成手段190を持つ。中継サーバにより、Webブラウザ1300とWebサイト間の通信をフィルタリングすることが可能となり、通信内容に応じて、オリジナルWebサイトの内容を書き換えてWebブラウザに提示することが可能となる。文書生成手段190は、オリジナルWebページを書き換えて別の文書を生成する。中継サーバは、Webブラウザ側の設定で指定することができる。システム構成は、図10においてWebサイト側に存在していた、ブロック検索手段120、文書構造化手段140、ブロック抽出手段145、類似ブロック追加手段150、非表示ブロックラベル生成手段180、文書生成手段190がそのまま中継サーバ側に移った形となっている。図10においては、Webサーバ側にあった検索手段130の代わりに、一般の検索サイトの検索機能を用いている。
以上のシステム構成により、例えば、社内のWebブラウザから社外の任意のページにアクセスした場合においても構造要約機能を提供可能となる。例えば、GoogleやYahoo!などで検索した結果ページが長い場合でも、検索クエリと関連の高い領域のみを表示することで、欲しい内容だけを俯瞰することができる。また、省略された領域については、その領域に含まれるラベル(タグ)の組合せを見ることにより、書かれている内容を推測することができ、閲覧漏れの危険を減らすことができる。
図14は、一般のWeb検索サイトから、各々のWebサイトを参照する場合の、従来の表示例と、図13のシステム構成による表示例を示したものである。検索サイト1400、1420は、一般のWeb検索サイトを表す。従来の表示では、リンク1401をクリックすると、オリジナルのWebページ・文書1410がそのまま表示される。しかし、図13のシステム構成では、リンク1421をクリックすると、オリジナルのWebページ・文書のかわりに、検索キーワード1422による構造要約ページ・文書1430が表示される。
図15は、図13のシステム構成に基づいて、一般のWebサイトを構造要約表示する際の、Webブラウザと中継サーバと検索サイトと訪問サイトの間の処理の流れを示した説明図である。一番左のラインがユーザ操作の流れ、左から2番目のラインが中継サーバ処理の流れ、右から2番目のラインが一般の検索サイトの処理の流れ、一番右のラインが訪問サイトの処理の流れを表す。
まず、Webブラウザは、検索クエリを入力してWebページ・文書の検索(E1500)を行う。Web検索サイトは、当該サイトの持つ検索機能によって、検索を実行し(E1510)、検索結果を出力する(E1520)。送信されたWebページ・文書は、Webブラウザに表示する前に、まず中継サーバにより受信される。中継サーバは、Webブラウザへの送信ページをフィルタリングする(E1525)。送信ページが検索サイトの場合、変更を加えずにWebブラウザに送信する。また、検索に用いられたキーワードを記録しておく(E1547)。Webブラウザは、検索結果ページの中から参照したい文書を選択し(E1530)、訪問サイトに文書の取得要求を通知する。訪問サイトは、Webページ・文書を送信する(E1540)。送信されたWebページ・文書は、Webブラウザに表示する前に、まず中継サーバにより受信される。中継サーバは、Webブラウザへの送信ページをフィルタリングする(E1545)。送信ページが検索サイトでない場合、受信Webページ・文書を構造化し(E1550)、縮約・展開表示の単位となるブロックを決定する。次に検索キーワードに基づき、Webページ・文書の構造要約を行う(E1560)。処理E1547でキーワードリストを抽出しているので、構造要約処理E1560は、図7と同じ処理フローで実施できる。最後にユーザは、構造要約されたWebページ・文書を閲覧する(E1570)。
以上の一連の操作により、例えば、社内のWebブラウザから社外の任意のページにアクセスした場合においても構造要約機能を提供可能となる。例えば、GoogleやYahoo!などで検索した結果ページが長い場合でも、検索クエリと関連の高い領域のみを表示することで、欲しい内容だけを俯瞰することができる。また、省略された領域については、その領域に含まれるラベル(タグ)の組合せを見ることにより、書かれている内容を推測することができ、閲覧漏れの危険を減らすことができる。
図16は、ポータルサイトにより、構造要約機能を実現する場合のシステム構成の一例である。図1、図8Aにおける文書閲覧装置のかわりに、Webブラウザ1600が閲覧装置として用いられる。ポータルサイト1610は、文書検索手段130、ブロック検索手段120、文書構造化手段140、ブロック抽出手段145、類似ブロック追加手段150、ブロック縮約/展開表示手段160、非表示ブロックラベル生成手段180、文書生成手段190に加えて、機能的には図10におけるものと同様である。
ユーザはまずポータルサイトにアクセスし、文書検索手段130によりWebページ・文書の検索を実行する。ポータルサイト1610は、検索結果の各Webページ・文書について、図7と同様の処理フローにより構造要約文書を作成する。文書整列表示手段1620は、構造要約表示した各ページ・文書を2次元的に並べて一覧表示する。
以上のシステム構成により、検索結果の複数ページに対して同時に構造要約を実行し一覧表示することが可能となる。また、省略された領域については、その領域に含まれるラベル(タグ)の組合せを見ることにより、書かれている内容を推測することができ、閲覧漏れの危険を減らすことができる。
図17は、図16によるシステム構成を持つ構造要約検索ポータルサイトの画面例である。Webページ・文書1710は、検索クエリを入力した直後の構造要約ポータルサイト画面である。構造要約済みWebページ1720は、文書検索サーバ1631による検索結果文書の各々の構造要約結果を表す。検索結果一覧画面1730は、前記構造要約文書を一覧表示した画面を表す。
以上の画面遷移に従い、検索結果の複数ページに対して同時に構造要約を実行し一覧表示することが可能となる。また、省略された領域については、その領域に含まれるラベル(タグ)の組合せを見ることにより、書かれている内容を推測することができ、閲覧漏れの危険を減らすことができる。
図18は、ユーザ、ポータルサイト、訪問サイト間の処理の流れを示した説明図である。左のラインが、ユーザ操作の流れ、真ん中のラインがポータルサイト処理の流れ、右側のラインが訪問サイト処理の流れを表す。
ユーザは、ポータルサイトに検索要求を発行する(E1800)。ポータルサイトは、入力されたキーワードに基づき、Webページ・文書検索を実行する(E1810)。次に、ポータルサイトは、訪問サイトにオリジナルのWebページ・文書を要求する(E1820)。訪問サイトは要求に応じてWebページ・文書を送信する(E1830)。ポータルサイトは、それぞれのオリジナルのWebページ・文書を構造要約化する(E1850)。入力キーワードはポータルサイト側に保持しているため、図7の処理フローに従い、構造要約を実施できる。そして、構造要約化されたWebページ・文書を2次元状に配置し、検索結果ページを生成する(E1860)。ユーザは、構造要約検索結果ページを閲覧する(E1870)。
以上の一連の操作により、検索結果の複数ページに対して同時に構造要約を実行し一覧表示することが可能となる。また、省略された領域については、その領域に含まれるラベル(タグ)の組合せを見ることにより、書かれている内容を推測することができ、閲覧漏れの危険を減らすことができる。
情報提示機能を持つ、Acrobat、Word、Excelなどの文書ビューアー、携帯端末、Webブラウザ、Webサーバ等での利用が見込まれる。
本発明による閲覧システムの構成例を示す図。 構造要約文書の画面例を示す図。 キーワードペアに対して推定される関係の例 適合文書のパターン例を示す図。 適合文書のパターン例を示す図。 適合文書のパターン例を示す図。 文書構造化の例を示す図。 文書の構造化結果からブロック集合を決定する方法の説明図。 構造要約文書の画面例を示す図。 一次検索及び二次検索フローの説明図。 ブロックごとにラベル付与を行った場合の構造要約表示パターンの例を示す図。 元の文書を全てラベル情報で置き換えた場合の表示例を示す図。 ユーザ操作と構造要約表示の関係を時間軸に沿って示した説明図。 デスクトップ検索と組み合わせて構造要約を実行する場合のシステム構成例を示す図。 デスクトップ検索時の画面遷移例を示す図。 デスクトップ検索時の画面遷移例を示す図。 デスクトップ検索時の画面遷移例を示す図。 デスクトップ検索と組み合わせる場合の時系列処理フロー図。 Webサイトと構造要約を組み合わせる場合の構成例を示す図。 サイト内検索処理と構造要約表示の処理の流れの説明図。 検索サイトから構造要約可能なWebサイトを訪問した場合の構造要約処理フロー図。 中継サーバにより任意のWebページに構造要約機能を実現する場合のシステム構成例を示す図。 一般のWeb検索サイトから、各々のWebサイトを参照する場合の、従来と本システムの表示例の説明図。 中継サーバにより任意のWebページ・文書を構造要約表示する際の、クライアントPCと中継サーバと検索サイトと訪問サイトの間の処理の流れを示した説明図。 ポータルサイトにより、構造要約機能を実現する場合のシステム構成例を示す図。 構造要約検索ポータルサイトの画面例を示す図。 クライアントPC、ポータルサイト、訪問サイト間の処理の流れを示した説明図。
符号の説明
100:閲覧システム、110:クエリ入力手段、120:ブロック検索手段、130:文書検索手段、140:文書構造化手段、145:ブロック抽出手段、150:類似ブロック追加手段、160:ブロック縮約/展開表示手段、170:縮約/展開切り替え手段、180:非表示ブロックラベル生成手段、190:文書生成手段

Claims (10)

  1. 複数のブロックに領域分けされた文書に対してブロック単位に検索を行い、入力された検索キーに類似するブロックを検索するブロック検索手段と、
    前記検索されたブロックから特徴度を持った特徴ベクトルを生成し、その特徴ベクトルと類似するブロックを類似度が高い順に出力し、ブロック全体の特徴度が増加する間、前記検索されたブロックに前記出力された類似ブロックを追加して表示ブロックを決定する類似ブロック追加手段と、
    文字列もしくは文字列の種類を表すタグごとに、前記表示ブロックにおける特徴度と非表示ブロックにおける特徴度の和を重要度とし、重要度の高いものを非表示ブロックのラベルとする非表示ブロックラベル生成手段と、
    前記表示ブロックについてはその内容を表示し、前記非表示ブロックについては前記ラベルを表示するブロック縮約/展開表示手段と、
    を有することを特徴とする情報処理システム。
  2. 請求項1記載の情報処理システムにおいて、文書の構造解析を行い論理的なまとまりのあるブロックを抽出する文書構造化手段を有することを特徴とする情報処理システム。
  3. 請求項1記載の情報処理システムにおいて、前記ラベルの表示をブロック毎に行うことを特徴とする情報処理システム。
  4. 請求項1記載の情報処理システムにおいて、前記ラベルとして、タイトルと単語のbi-gram、表構造から得られる項目−値関係のbi-gram、文書の係り受け解析から得られるS(主語)−V(動詞)関係を用いることを特徴とする情報処理システム。
  5. 請求項2記載の情報処理システムにおいて、サーバ内に前記ブロック検索手段、前記類似ブロック追加手段、前記非表示ブロックラベル生成手段、前記文書構造化手段、及びページ内検索手段を備え、前記表示ブロックについてはその内容を表示し前記非表示ブロックについては前記ラベルを表示した文書をクライアントに配信することを特徴とする情報処理システム。
  6. 請求項2記載の情報処理システムにおいて、サーバもしくは中継サーバにより、配信中の文書中に、ページ内検索手段、前記文書構造解析手段、前記ブロック選択手段及び縮約/展開表示手段を埋め込み、クライアント側に送信することを特徴とする情報処理システム。
  7. 請求項2記載の情報処理システムにおいて、クライアント側にページ内検索手段、前記ブロック選択手段、縮約/展開表示手段のうち少なくとも一つを持ち、サーバ側に少なくとも前記文書構造解析手段を持つことを特徴とする情報処理システム。
  8. 検索キーの入力を受け付ける工程と、
    文書の構造解析を行って論理的なまとまりのあるブロックを抽出し、前記文書を複数のブロックに領域分けする工程と、
    前記複数のブロックに領域分けされた文書に対してブロック単位に検索を行い、前記入力された検索キーに類似するブロックを検索する工程と、
    前記検索されたブロックから特徴度を持った特徴ベクトルを生成し、その特徴ベクトルと類似するブロックを類似度が高い順に出力し、ブロック全体の特徴度が増加する間、前記検索されたブロックに前記出力された類似ブロックを追加して表示ブロックを決定する工程と、
    文字列もしくは文字列の種類を表すタグごとに、前記表示ブロックにおける特徴度と非表示ブロックにおける特徴度の和を重要度とし、重要度の高いものを非表示ブロックのラベルとする工程と、
    前記表示ブロックについてはその内容を表示し、前記非表示ブロックについては前記ラベルを表示する工程と、
    を有することを特徴とする情報処理方法。
  9. 請求項8記載の情報処理方法において、前記ラベルの表示はブロック毎に行うことを特徴とする情報処理方法。
  10. 請求項8記載の情報処理方法において、
    ブロックの選択を受け付ける工程と、
    前記選択されたブロックの表示・非表示を切り換える工程を有することを特徴とする情報処理方法。
JP2007108282A 2007-04-17 2007-04-17 情報処理システム及び情報処理方法 Expired - Fee Related JP5103051B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2007108282A JP5103051B2 (ja) 2007-04-17 2007-04-17 情報処理システム及び情報処理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007108282A JP5103051B2 (ja) 2007-04-17 2007-04-17 情報処理システム及び情報処理方法

Publications (2)

Publication Number Publication Date
JP2008269069A true JP2008269069A (ja) 2008-11-06
JP5103051B2 JP5103051B2 (ja) 2012-12-19

Family

ID=40048520

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007108282A Expired - Fee Related JP5103051B2 (ja) 2007-04-17 2007-04-17 情報処理システム及び情報処理方法

Country Status (1)

Country Link
JP (1) JP5103051B2 (ja)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010122823A (ja) * 2008-11-18 2010-06-03 Nec Corp テキスト処理システム、情報処理装置、テキストおよび情報の処理方法ならびに処理プログラム
JP2011048730A (ja) * 2009-08-28 2011-03-10 Nippon Telegr & Teleph Corp <Ntt> ウェブページ閲覧アシスト方法
JP2012248129A (ja) * 2011-05-31 2012-12-13 Casio Comput Co Ltd ユーザー探索システム、ユーザー探索装置並びにプログラム
WO2014196191A1 (ja) * 2013-06-04 2014-12-11 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ 情報表示方法およびプログラム
US9054066B2 (en) 2012-08-30 2015-06-09 Kabushiki Kaisha Toshiba Semiconductor device
US9740930B2 (en) 2014-04-17 2017-08-22 Fujitsu Limited Read determining device and method
JP2018124914A (ja) * 2017-02-03 2018-08-09 日本電信電話株式会社 パッセージ型質問応答装置、方法、及びプログラム

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106959958B (zh) * 2016-01-11 2020-04-07 阿里巴巴集团控股有限公司 地图兴趣点简称获取方法和装置

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003030178A (ja) * 2001-05-10 2003-01-31 Oki Electric Ind Co Ltd 電子メール装置および電子メールシステム
JP2004118721A (ja) * 2002-09-27 2004-04-15 Toshiba Corp メッセージのツリー表示装置、メッセージのツリー表示方法、プログラム及び記録媒体
JP2004126770A (ja) * 2002-09-30 2004-04-22 Toshiba Corp 構造化文書検索方法、構造化文書検索システム及び構造化文書データベース管理装置
JP2004295712A (ja) * 2003-03-28 2004-10-21 Hitachi Ltd 類似文書検索方法および類似文書検索装置
JP2004334803A (ja) * 2003-05-12 2004-11-25 Shin Etsu Polymer Co Ltd 文書検索装置
JP2006072744A (ja) * 2004-09-02 2006-03-16 Canon Inc 文書処理装置、その制御方法、プログラム、及び記憶媒体

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003030178A (ja) * 2001-05-10 2003-01-31 Oki Electric Ind Co Ltd 電子メール装置および電子メールシステム
JP2004118721A (ja) * 2002-09-27 2004-04-15 Toshiba Corp メッセージのツリー表示装置、メッセージのツリー表示方法、プログラム及び記録媒体
JP2004126770A (ja) * 2002-09-30 2004-04-22 Toshiba Corp 構造化文書検索方法、構造化文書検索システム及び構造化文書データベース管理装置
JP2004295712A (ja) * 2003-03-28 2004-10-21 Hitachi Ltd 類似文書検索方法および類似文書検索装置
JP2004334803A (ja) * 2003-05-12 2004-11-25 Shin Etsu Polymer Co Ltd 文書検索装置
JP2006072744A (ja) * 2004-09-02 2006-03-16 Canon Inc 文書処理装置、その制御方法、プログラム、及び記憶媒体

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010122823A (ja) * 2008-11-18 2010-06-03 Nec Corp テキスト処理システム、情報処理装置、テキストおよび情報の処理方法ならびに処理プログラム
JP2011048730A (ja) * 2009-08-28 2011-03-10 Nippon Telegr & Teleph Corp <Ntt> ウェブページ閲覧アシスト方法
JP2012248129A (ja) * 2011-05-31 2012-12-13 Casio Comput Co Ltd ユーザー探索システム、ユーザー探索装置並びにプログラム
US9054066B2 (en) 2012-08-30 2015-06-09 Kabushiki Kaisha Toshiba Semiconductor device
US9324815B2 (en) 2012-08-30 2016-04-26 Kabushiki Kaisha Toshiba Semiconductor device
WO2014196191A1 (ja) * 2013-06-04 2014-12-11 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ 情報表示方法およびプログラム
CN104584014A (zh) * 2013-06-04 2015-04-29 松下电器(美国)知识产权公司 信息显示方法及程序
JPWO2014196191A1 (ja) * 2013-06-04 2017-02-23 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America 情報表示方法およびプログラム
CN104584014B (zh) * 2013-06-04 2018-11-20 松下电器(美国)知识产权公司 信息显示方法及记录介质
US9740930B2 (en) 2014-04-17 2017-08-22 Fujitsu Limited Read determining device and method
JP2018124914A (ja) * 2017-02-03 2018-08-09 日本電信電話株式会社 パッセージ型質問応答装置、方法、及びプログラム

Also Published As

Publication number Publication date
JP5103051B2 (ja) 2012-12-19

Similar Documents

Publication Publication Date Title
US7715625B2 (en) Image processing device, image processing method, and storage medium storing program therefor
JP5103051B2 (ja) 情報処理システム及び情報処理方法
CN105706080B (zh) 扩增并呈现捕获的数据
US9323827B2 (en) Identifying key terms related to similar passages
US8464158B2 (en) Method and arrangement for sharing information search results
CN101877004B (zh) 直接导航至目标文档特定部分的系统和方法
US9183281B2 (en) Context-based document unit recommendation for sensemaking tasks
US9195754B2 (en) Expansion of search result information
US8954839B2 (en) Contract authoring system and method
US9639627B2 (en) Method to search a task-based web interaction
US20090222298A1 (en) Data Mining Method for Automatic Creation of Organizational Charts
JP5516918B2 (ja) 画像要素検索
JP6840597B2 (ja) 検索結果要約装置、プログラム及び方法
Xiao et al. Browsing on small displays by transforming web pages into hierarchically structured subpages
Liu et al. Main content extraction from web pages based on node characteristics
KR20020075359A (ko) 디지털 소스로부터 정보를 포착하고 관리하기 위한 시스템및 방법
JP5484113B2 (ja) 文書画像関連情報提供装置、及び文書画像関連情報取得システム
CN101593187A (zh) 用于管理书签的方法和系统
KR20120020558A (ko) 폭소노미 기반 개인화 웹 검색 방법 및 이를 수행하는 시스템
JP7081155B2 (ja) 選択プログラム、選択方法、及び選択装置
Baldauf et al. Getting context on the go: mobile urban exploration with ambient tag clouds
US8832082B2 (en) Presentation of search results with diagrams
JP2017204054A (ja) 相性算出装置、相性算出方法、およびコンピュータプログラム
JP5870036B2 (ja) ページの遷移管理システム、遷移管理用サーバ装置および遷移管理用プログラム
JP2009110506A (ja) 情報処理装置及び情報処理プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20100212

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20120228

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120306

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120502

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120904

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20121001

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20151005

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20151005

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees