JP6840597B2 - 検索結果要約装置、プログラム及び方法 - Google Patents
検索結果要約装置、プログラム及び方法 Download PDFInfo
- Publication number
- JP6840597B2 JP6840597B2 JP2017069536A JP2017069536A JP6840597B2 JP 6840597 B2 JP6840597 B2 JP 6840597B2 JP 2017069536 A JP2017069536 A JP 2017069536A JP 2017069536 A JP2017069536 A JP 2017069536A JP 6840597 B2 JP6840597 B2 JP 6840597B2
- Authority
- JP
- Japan
- Prior art keywords
- information
- content
- search result
- important
- search
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 28
- 238000000605 extraction Methods 0.000 claims description 39
- 230000005540 biological transmission Effects 0.000 claims description 16
- 230000010365 information processing Effects 0.000 claims description 10
- 230000006870 function Effects 0.000 description 23
- 239000000463 material Substances 0.000 description 15
- 238000012545 processing Methods 0.000 description 13
- 239000000284 extract Substances 0.000 description 11
- 238000004891 communication Methods 0.000 description 4
- 238000007906 compression Methods 0.000 description 4
- 230000000877 morphologic effect Effects 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 3
- 238000013519 translation Methods 0.000 description 3
- 230000006835 compression Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 239000013598 vector Substances 0.000 description 2
- VYZAMTAEIAYCRO-UHFFFAOYSA-N Chromium Chemical compound [Cr] VYZAMTAEIAYCRO-UHFFFAOYSA-N 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000013144 data compression Methods 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000007639 printing Methods 0.000 description 1
- 239000012925 reference material Substances 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
Landscapes
- Machine Translation (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
インターネット上には、大量(無数)の情報、所謂コンテンツが、コンテンツサイト(WEBサイト)として機能する情報処理装置により提供・公開されており、インターネットに接続された端末・装置等を介して、任意のコンテンツにアクセスして種々の情報を閲覧・参照等することができる。
ただ、検索エンジンサイトで得られる情報の検索結果は、検索キーワード等が含まれるコンテンツのタイトルやテキストの一部などが、一覧形式で羅列して出力・表示されるだけである。このため、個々のコンテンツの内容を参照するには、検索結果として一覧形式で表示されている各コンテンツサイトのインターネット上のリソース(資源)を特定するURL(Uniform Resource Locator)にリンクされたタイトルやサマリ等を一つずつ選択(クリック)して、該当するコンテンツサイトにアクセスする必要があり、操作や作業が煩瑣な面があった。
このようなことから、インターネット検索において、簡易かつ効率的に複数のコンテンツの内容を閲覧・参照でき、必要に応じてコンテンツ内容を引用できるような技術が望まれていた。
特許文献1には、ユーザ単位でインターネット上の閲覧履歴情報を収集・分類して閲覧履歴のサマリを生成し、当該ユーザのユーザ端末に送信する技術が開示されている。
特許文献2には、検索エンジンで抽出された検索結果となる各コンテンツのURLにアクセスして、各コンテンツのHTMLドキュメント等を例えば10行未満のテキストに要約して検索結果の表示用レイアウトを作成し、ユーザにメール送信したりプリントアウトして出力する技術が開示されている。
また、特許文献2に開示されているのは、検索エンジンの検索結果として、該当するコンテンツに含まれるテキスト文などを数行に要約して表示・出力するというもので、これは検索エンジンの検索結果そのものであり、その結果がメール送信やプリントアウトされたとしても、上述したインターネット検索における課題を解決することにはならなかった。
このため、例えば大量に検索・抽出されたコンテンツの内容を、機械的・一括的にまとめて全体の概念整理や把握のために有効な資料等を作成する、というようなことを実現することはできなかった。
さらに、本発明は、上記のような本発明に係る検索結果要約装置及びプログラムによって実施可能な検索結果要約装置方法として構成することもできる。
これにより、複数のコンテンツの内容を容易かつ迅速に把握することができ、また、要約情報を情報参照用の資料等としてそのまま活用することも可能となる。
したがって、例えばインターネット検索の結果をプレゼンテーション用の資料などに利用する場合にも、検索結果を簡易かつ効率よく、閲覧・参照・発表などに用いる有用な資料等として活用することができるようになる。
ここで、以下に示す本発明の検索結果要約装置は、プログラム(ソフトウェア)の命令によりコンピュータで実行される処理,手段,機能によって実現される。プログラムは、コンピュータの各構成要素に指令を送り、以下に示す本発明に係る所定の処理や機能等を行わせることができる。すなわち、本発明における各処理や手段,機能は、プログラムとコンピュータとが協働した具体的手段によって実現される。
図1に、本発明の一実施形態に係る検索結果要約サーバ10を備えた検索結果要約システム1の構成を模式的に示す。
また、図2に、図1に示す検索結果要約システム1における各装置の機能構成を示す。
これらの図に示すように、本発明の一実施形態に係る検索結果要約システム1は、検索結果要約サーバ10と、一又は二以上のユーザ端末20(20a〜20n)と、検索サーバ30と、一又は二以上のコンテンツサイトサーバ40(40a〜40n)とを備えて構成されている。
そして、これら検索結果要約サーバ10・ユーザ端末20・検索サーバ30・コンテンツサイトサーバ40は、LAN・WAN等を含むインターネット100を介して接続され、それぞれ相互にネットワーク通信が可能となっている。
検索結果要約サーバ10は、インターネット100を介して、ユーザ端末20から送信される検索要求情報に対して検索サーバ30で生成される検索結果情報に基づいて、所定の検索結果要約情報を生成する情報処理装置であり、本発明の検索結果要約装置を構成している。
この検索結果要約サーバ10は、例えば、1又は2以上のサーバコンピュータやパーソナルコンピュータ、クラウドコンピューティングサービス上に構築された1又は2以上の仮想サーバからなるサーバシステム等、所定のプログラム(ソフトウェア)が実装された情報処理装置によって構成することができる。
URLリスト受信部11は、検索サーバ30で生成された検索結果情報に含まれる、一又は二以上のコンテンツ情報を特定する識別情報を受信する手段であり、本発明に係る識別情報受信手段を構成している。
具体的には、URLリスト受信部11は、ユーザ端末20において抽出され送信されてくる、検索サーバ30の検索結果情報に含まれる一又は二以上のコンテンツ情報を特定する識別情報となる一又は二以上のURL(URLリスト)を受信する。
具体的には、URLサイトアクセス部12は、ユーザ端末20から送信されるURLリストに示される複数のコンテンツサイトに対応した複数のURLにそれぞれアクセスを実行する。
これにより、検索サーバ30で検索された複数のコンテンツサイトについて、ユーザ端末20に代わって検索結果要約サーバ10がアクセスすることで、各コンテンツサイトで提供されるコンテンツ情報が、検索結果要約サーバ10において一括して自動的に取得されることになる。
具体的には、コンテンツ情報抽出部13は、コンテンツ情報に含まれる各種の情報・データのうち、「タイトル」を示すテキストデータと、「本文」に含まれるテキストデータ及び画像データを、各コンテンツサイト毎のコンテンツ情報として識別・抽出する。
なお、このようなコンテンツ情報からの「タイトル」及び「本文」の抽出は、コンテンツ情報を構成するHTMLデータに含まれるタグ(識別子)に基づいて行うことができる。
例えば、「タイトル」については「<title>〜</title>」のタグで区分されたデータを、また「本文」については「<body>〜</body>」のタグで区分されたデータを抽出した上で、記述されているテキストの長さやタグ情報等に基づき本文分を推定することができる。
具体的には、重要情報抽出部14は、本文データに含まれるテキスト情報及び画像情報の中から、重要情報として、所定数のセンテンスと画像を、重要文・重要画像として抽出する。本実施形態では、3つのセンテンスと、本文データ中に含まれる全ての画像を、重要情報として抽出するようになっている(図6参照)。
なお、抽出するセンテンス及び画像の数は、特に限定されるものではなく、例えば2つ以下や4つ以上のセンテンスや、所定数の画像のみを、重要情報として抽出することは勿論可能である。また、本文データ中に含まれるセンテンスが3つ以下であれば、全てのセンテンスが重要文として抽出され、また、本文データ中に画像が含まれない場合には、重要画像は抽出されない。
また、外国語で抽出・生成された重要文を日本語に翻訳することもできる(図8(b)参照)。
なお、外国語の日本語への翻訳は、例えばインターネット上で提供されている翻訳機能を用いることで実現することができる。
例えば、本文データに含まれるテキストを形態素解析して、句読点を含む文節に分解してセンテンス単位に分割・抽出して、各センテンスにおける特定の語やキーワードの出現頻度や位置、類似度などに基づいて、各センテンスに特徴ベクトルを付与し、より異なる複数方向(例えば3方向)の特徴ベクトルが付与された複数のセンテンス(例えば3センテンス)を、重要文として抽出することができる。
また、抽出された複数の重要文センテンスに対して、最も近い位置に配置された画像や、最もデータ容量が大きい画像を、そのコンテンツの主要画像と推定することができ、その画像を重要画像として抽出することができる。
また、「形態素解析」は、自然言語で書かれた文を形態素(言語で意味を持つ最小単位)に分割する、コンピュータによる自然言語処理技術である。このような形態素解析についても、公知の技術を用いることができる。
本実施形態では、検索結果要約サーバ10が、形態素解析を含む重要文抽出処理の機能を備えたサーバコンピュータ等により構成されることで実現できるものである。
具体的には、要約情報生成部15は、重要情報抽出部14により重要情報として抽出されたテキスト情報及び画像情報を、所定のプレゼンテーション用ソフトウェアに入力して、コンテンツサイト毎のスライド形式の情報として生成する。
また、要約情報生成部15は、コンテンツサイト毎に生成した要約情報を、複数のコンテンツサイトの要約情報を示す一覧形式の情報として生成することができる。
このように要約情報として生成されるスライド形式や一覧形式の情報は、使用するプレゼンテーション用ソフトウェアの機能として実現することができる。
この種のプレゼンテーション用ソフトウェアは、任意の情報をスライド形式のファイル情報として生成・出力することができ、また、複数のスライド形式の情報を一覧形式にして出力することができ、必要な情報を、見やすく・分かりやすく・使いやすくまとめることができることから、打合せや会議、講演、授業、説明会などの参照資料として広く活用されている。
具体的には、本実施形態では、各コンテンツサイト毎にスライド2ページのファイルで構成される要約情報を生成するようにし、1ページ目は、当該コンテンツの「タイトル」と、重要情報として抽出された「本文」中の重要文及び重要画像と、当該コンテンツサイト(引用元)のURLを、所定のレイアウトで配置(貼り付け)して表示した「サマリーページ」とし、2ページ目は、「本文」に含まれるテキストデータを全て配置(貼り付け)して表示した「全文ページ」として生成するようになっている(図6参照)。
さらに、上記のようにコンテンツサイト単位で2ページ1ファイルに生成されたスライド形式のデータを、複数のコンテンツサイトの全データを一覧形式の情報として生成することができる(図7参照)。これによって、複数のコンテンツサイトの一覧の中から、所望のコンテンツサイトを選択して、上述した要約情報を参照させたり、当該コンテンツサイト自体へのアクセスを行わせることができるようになり、より利便性の高い情報の提供が可能となる。
また、要約情報の生成に用いるプレゼンテーション用ソフトウェアとしては、既存の利用可能なソフトウェアであればよく、特定のプレゼンテーション用ソフトウェアに限定さるものではない。
さらに、プレゼンテーション用ソフトウェアのみに限らず、本実施形態に係る要約情報として生成・出力できるものであれば、例えば、文書作成用ソフトウェア(ワープロソフト)、表計算用ソフトウェア(表計算ソフト)、図面作成用ソフトウェア(作図ソフト)など、他の用途・機能のソフトウェアを用いることもできる。
具体的には、要約情報送信部16は、上述したプレゼンテーション用ソフトウェアのファイル形式(スライド形式・一覧形式)で生成された要約情報を、一つの送信用ファイルデータとして結合・圧縮して、検索結果の送信元となるユーザ端末20にダウンロードデータとして送信するようになっている(図5参照)。
このようなファイルの結合・圧縮処理を行うことで、ユーザ端末20に送信するデータ容量をできる限り少なくすることができ、ネットワーク負荷やユーザ端末20での処理負担を減らすことができるとともに、複数のコンテンツサイトに対応した複数の要約情報を、単一の圧縮ファイルとして処理することができ、ユーザ端末20における取り扱いを容易化することができるようになる。
以上のような本実施形態に係る検索結果要約サーバ10で実現される各手段の具体的な機能・動作については、ユーザ端末20に出力・表示される表示画面例も参照しつつ後述する(図3〜9参照)。
ユーザ端末20(20a〜20n)は、インターネットの閲覧・検索等が可能なWEBブラウザ21が実装された、例えばPC、タブレット端末、スマートフォン等で構成される情報処理装置であり、インターネット100を介して、検索結果要約サーバ10や検索サーバ30・コンテンツサイトサーバ40に接続可能なウェブクライアントとして機能する、本発明に係るユーザ端末を構成している。
各ユーザ端末20は、WEBブラウザ21を介して所望のキーワード等を入力した検索要求を検索サーバ30に送信することができ、検索サーバ30で生成された検索結果を受信できるようになっている。
このようなWEBブラウザ21により、検索サーバ30で提供される検索サイト(検索エンジン)を表示し、任意のキーワード等を入力して検索要求情報を検索サーバ30に送信することができ、その検索要求に対する検索結果情報を検索サーバ30から受信できるようなっている。
具体的には、WEBブラウザ21は、検索サーバ30から検索結果情報を受信すると、その検索結果に含まれる各コンテンツサイトのURLを抽出して、一又は二以上のURLを列挙・羅列したURLリストを生成する。
本実施形態に係るWEBブラウザ21では、そのような検索結果に含まれるURLのみを抽出して抜き出し、一又は二以上のURLを列挙したURLリストとして生成できるようになっている。
URLは、例えば「http」等の特定のスキーム名を含む所定形式の文字列によって構成されており、WEBブラウザ21では、そのような特定の文字列を識別することで、検索結果情報からURLのみを抽出することができるようになっている。
そして、このようにWEBブラウザ21で抽出・生成された検索結果のURLリスト情報が、検索結果要約サーバ10に送信されてURLリスト受信部11で受信され、上述したように、URLリストに対応するコンテンツサイトへのアクセスと、アクセス結果に基づく要約情報の生成処理が実行されるようになる。
検索サーバ30は、通信網となるインターネット100を介して、ユーザ端末20に対して検索エンジンサイトを利用可能に提供する情報処理装置であり、例えば検索エンジンサイトを含むコンテンツサイトを提供するサービス提供事業者等が管理・運営するPCやサーバ群等によって構成される。
検索サーバ30が提供する検索エンジンサイトは、インターネット経由でアクセス可能な様な情報(コンテンツ)を検索する機能及びそのプログラムであり、例えば、「Google」や「Yahoo」,「BING」(いずれも登録商標)などの検索エンジンサイトが知られている。
そして、このような検索サーバ30が、本発明に係る検索サーバを構成している。
この検索サーバ30から送信される検索結果に基づいて、ユーザ端末20におけるURLリストの生成と、検索結果要約サーバ10における要約情報の生成が実行されることになる。
なお、図1では、一つの検索サーバ30のみが示してあるが、これは図示・説明の便宜上であり、本実施形態において、複数の検索サーバ30を備えることができることは言うまでもない。
コンテンツサイトサーバ40(40a〜40n)は、通信網となるインターネット100を介して、ユーザ端末20に対してコンテンツサイト(WEBサイト)などを提供する情報処理装置であり、例えばコンテンツサイト等を提供するサービス提供事業者等のデータセンタやオフィスなどに設置されるPCやサーバ群等によって構成される。
本実施形態では、図2に示すように、各コンテンツサイトサーバ40a,40b・・・40nが、それぞれ独自の情報等を提供するコンテンツサイトA,コンテンツサイトB・・・コンテンツサイトNを管理・運営している。
このコンテンツサイトサーバ40が、本発明に係るコンテンツ情報を提供する手段を構成している。
次に、以上のような構成からなる本実施形態に係る検索結果要約サーバ10を備える検索結果要約システム1の具体的な処理・動作(検索結果要約方法)について、図3〜9を参照しつつ説明する。
図3は、本実施形態に係る検索結果要約システム1における処理動作を示すフローチャートである。
まず、前提として、インターネット検索を行おうとするユーザは、ユーザ端末20を操作して、検索サーバ30が提供する検索エンジンサイトにアクセスし、任意の検索要求を行い、検索結果を受信する。
生成されたURLリストは、インターネット100を介して検索結果要約サーバ10に送信される(ステップ02)。
アクセスされた各コンテンツサイトからは、コンテンツ情報抽出部13により、当該コンテンツサイトで提供されているコンテンツ情報に含まれる「タイトル」及び「本文」のテキスト情報・画像情報が抽出される(ステップ04)。
本実施形態では、本文データに含まれるテキスト情報及び画像情報の中から、3つのセンテンスと、本文データ中に含まれる全画像が、重要文・重要画像として抽出される(図6参照)。
重要文・重要画像が抽出されると、要約情報生成部15により、プレゼンテーション用ソフトウェアを用いて要約情報が生成される(ステップ06)。
また、要約情報生成部15は、コンテンツサイト単位で2ページ1ファイルに生成されたスライド形式のデータを、複数のコンテンツサイトの全データを一覧形式の情報として生成することができる(図7参照)。
これにより、ユーザ端末20では、送信されたダウンロードデータを受信して(図5参照)、WEBブラウザ21により結合・圧縮されたデータを解凍・展開することにより、プレゼンテーション用ソフトウェアのファイル形式(スライド形式・一覧形式)で生成された要約情報が利用可能となり、必要な要約情報をWEBブラウザ21に出力・表示・編集等することができるようになる(ステップ08)。
特に、本実施形態では、要約情報が、コンテンツサイト毎に2ページ1ファイルのスライド形式で生成され、1ページ目には当該コンテンツサイトのサマリーページが、2ページ目にはコンテンツの全文ページが提供されるようになっており、検索結果に多数のコンテンツサイトが含まれていても、各コンテンツの内容を容易かつ迅速に把握することができるようになる。
これにより、インターネット検索の結果をプレゼンテーション用の資料などに利用したい場合にも、迅速かつ効率よく、閲覧・参照・発表などの資料として用いることができるようになる。
例えば、上述した実施形態では、ユーザ端末20にWEBブラウザ21が、検索エンジンサイトの検索結果に含まれるURLを抜き出してURLリストを生成するURLリスト抽出部22(識別情報抽出手段)を構成するようになっており(図2参照)、そのURLリストが検索結果要約サーバ10で受信されるようになっていた。
しかしながら、検索結果に含まれるURLを抽出して検索結果要約サーバ10で受信できるようにする構成としては、URLリスト抽出部22に対応する構成・機能を、検索結果要約サーバ10に持たせることもできる。
この場合には、図9に示すように、ユーザ端末20(WEBブラウザ21)は、検索要求を検索結果要約サーバ10に送信し、検索結果要約サーバ10のURLリスト受信部(URLリスト抽出部)11が、その検索要求を検索サーバ30に送信し、検査結果を受信する。
このような構成によれば、ユーザ端末20(WEBブラウザ21)は、任意の検索要求を検索結果要約サーバ10に送信するだけで、検索結果に基づく要約情報を取得することができ、ユーザが要約情報をより簡易に取得することが可能となり、また、WEBブラウザ21にURLリスト抽出部22としての機能・構成を備える必要がなくなり、ユーザ端末20(WEBブラウザ21)の汎用性を高めることができるようになる。
10 検索結果要約サーバ
11 URLリスト受信部
12 URLサイトアクセス部
13 コンテンツ情報抽出部
14 重要情報抽出部
15 要約情報生成部
16 要約情報送信部
20 ユーザ端末
22 URLリスト抽出部
30 検索サーバ
40 コンテンツサイトサーバ
Claims (4)
- ユーザ端末から送信される検索要求情報に対して検索サーバで生成される検索結果情報に基づいて、所定の検索結果要約情報を生成する情報処理装置であって、
前記検索サーバで生成された検索結果情報に含まれる、一又は二以上のコンテンツ情報を特定する識別情報を受信する識別情報受信手段と、
前記識別情報に基づいて、対応するコンテンツ情報にアクセスするコンテンツ情報アクセス手段と、
アクセスした前記コンテンツ情報から、所定の重要情報を抽出する重要情報抽出手段と、
抽出された前記重要情報を、所定の要約情報として生成する要約情報生成手段と、
前記コンテンツ情報に対応する一又は二以上の前記要約情報を、該当するユーザ端末に送信する要約情報送信手段と、を備え、
前記重要情報抽出手段が、
前記コンテンツ情報に含まれるテキスト情報及び画像情報の中から、前記重要情報を抽出し、
前記要約情報生成手段が、
前記要約情報として、
抽出された前記テキスト情報及び画像情報を、所定のプレゼンテーション用ソフトウェアに入力して、コンテンツサイト毎に2ページ1ファイルのスライド情報にするとともに、それらを結合して一つの送信用ファイルを生成し、
前記スライド情報は、1ページ目を、当該コンテンツ情報のタイトルと、前記重要情報として抽出されたテキスト情報及び画像情報と、当該コンテンツ情報を特定する情報を表示した所定の要約ページとし、2ページ目を、当該コンテンツ情報に含まれるテキスト情報を全て表示した所定の全文ページとした情報からなる
ことを特徴とする検索結果要約装置。 - 前記ユーザ端末が、
前記検索サーバで生成された検索結果情報に含まれる、一又は二以上のコンテンツ情報を特定する識別情報を抽出する識別情報抽出手段を備え、
前記識別情報受信手段が、
前記ユーザ端末で抽出された前記識別情報を当該ユーザ端末から受信する
ことを特徴とする請求項1記載の検索結果要約装置。 - ユーザ端末から送信される検索要求情報に対して検索サーバで生成される検索結果情報に基づいて、所定の検索結果要約情報を生成する情報処理装置を構成するコンピュータを、
前記検索サーバで生成された検索結果情報に含まれる、一又は二以上のコンテンツ情報を特定する識別情報を受信する識別情報受信手段、
前記識別情報に基づいて、対応するコンテンツ情報にアクセスするコンテンツ情報アクセス手段、
アクセスした前記コンテンツ情報から、所定の重要情報を抽出する重要情報抽出手段と、
抽出された前記重要情報を、所定の要約情報として生成する要約情報生成手段、
前記コンテンツ情報に対応する一又は二以上の前記要約情報を、該当するユーザ端末に送信する要約情報送信手段、として機能させ、
前記重要情報抽出手段に、
前記コンテンツ情報に含まれるテキスト情報及び画像情報の中から、前記重要情報を抽出させ、
前記要約情報生成手段に、
前記要約情報として、
抽出された前記テキスト情報及び画像情報を、所定のプレゼンテーション用ソフトウェアに入力して、コンテンツサイト毎に2ページ1ファイルのスライド情報にするとともに、それらを結合して一つの送信用ファイルを生成させ、
前記スライド情報は、1ページ目を、当該コンテンツ情報のタイトルと、前記重要情報として抽出されたテキスト情報及び画像情報と、当該コンテンツ情報を特定する情報を表示した所定の要約ページとし、2ページ目を、当該コンテンツ情報に含まれるテキスト情報を全て表示した所定の全文ページとした情報からなる
ことを特徴とする検索結果要約プログラム。 - プログラムされたコンピュータによって、ユーザ端末から送信される検索要求情報に対して検索サーバで生成される検索結果情報に基づいて、所定の検索結果要約情報を生成する方法であって、
コンピュータが、
前記検索サーバで生成された検索結果情報に含まれる、一又は二以上のコンテンツ情報を特定する識別情報を受信する識別情報受信手順、
前記識別情報に基づいて、対応するコンテンツ情報にアクセスするコンテンツ情報アクセス手順、
アクセスした前記コンテンツ情報から、所定の重要情報を抽出する重要情報抽出手順と、
抽出された前記重要情報を、所定の要約情報として生成する要約情報生成手順、
前記コンテンツ情報に対応する一又は二以上の前記要約情報を、該当するユーザ端末に送信する要約情報送信手順、とを実行し、
前記重要情報抽出手順が、
前記コンテンツ情報に含まれるテキスト情報及び画像情報の中から、前記重要情報を抽出し、
前記要約情報生成手順が、
前記要約情報として、
抽出された前記テキスト情報及び画像情報を、所定のプレゼンテーション用ソフトウェアに入力して、コンテンツサイト毎に2ページ1ファイルのスライド情報にするとともに、それらを結合して一つの送信用ファイルを生成し、
前記スライド情報は、1ページ目を、当該コンテンツ情報のタイトルと、前記重要情報として抽出されたテキスト情報及び画像情報と、当該コンテンツ情報を特定する情報を表示した所定の要約ページとし、2ページ目を、当該コンテンツ情報に含まれるテキスト情報を全て表示した所定の全文ページとした情報からなる
ことを特徴とする検索結果要約方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017069536A JP6840597B2 (ja) | 2017-03-31 | 2017-03-31 | 検索結果要約装置、プログラム及び方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017069536A JP6840597B2 (ja) | 2017-03-31 | 2017-03-31 | 検索結果要約装置、プログラム及び方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2018173681A JP2018173681A (ja) | 2018-11-08 |
JP6840597B2 true JP6840597B2 (ja) | 2021-03-10 |
Family
ID=64106568
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017069536A Active JP6840597B2 (ja) | 2017-03-31 | 2017-03-31 | 検索結果要約装置、プログラム及び方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6840597B2 (ja) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2020106988A (ja) * | 2018-12-26 | 2020-07-09 | Jcc株式会社 | 公開情報の配信告知方法、サーバ装置、公開情報の配信告知システム |
JP7171480B2 (ja) * | 2019-03-20 | 2022-11-15 | 株式会社野村総合研究所 | プレゼンテーションデータ作成支援システム |
JP7317198B1 (ja) | 2022-12-28 | 2023-07-28 | 真太郎 上田 | 情報検索装置 |
JP7356612B1 (ja) * | 2023-03-31 | 2023-10-04 | 住友化学株式会社 | コンピュータプログラム、情報処理方法及び情報処理装置 |
-
2017
- 2017-03-31 JP JP2017069536A patent/JP6840597B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2018173681A (ja) | 2018-11-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Soratto et al. | Thematic content analysis using ATLAS. ti software: Potentialities for researchs in health | |
KR101120301B1 (ko) | 지속 저장 포탈 | |
US9135341B2 (en) | Method and arrangement for paginating and previewing XHTML/HTML formatted information content | |
JP6840597B2 (ja) | 検索結果要約装置、プログラム及び方法 | |
US20150033116A1 (en) | Systems, Methods, and Media for Generating Structured Documents | |
US20050182755A1 (en) | Systems and methods for analyzing documents over a network | |
US20050232484A1 (en) | Image processing device, image processing method, and storage medium storing program therefor | |
JP2008234658A (ja) | テキスト検索エンジンにより検索されたページ番号付き文書全体を通してのコースツーファイン・ナビゲーション | |
JP2010073114A6 (ja) | 画像情報検索装置、画像情報検索方法およびそのコンピュータプログラム | |
US8458187B2 (en) | Methods and systems for visualizing topic location in a document redundancy graph | |
WO2004097675A1 (en) | Digital library system | |
JP5103051B2 (ja) | 情報処理システム及び情報処理方法 | |
US20120046937A1 (en) | Semantic classification of variable data campaign information | |
US8904272B2 (en) | Method of multi-document aggregation and presentation | |
JP2022187507A (ja) | 技術調査支援装置、技術調査支援方法、および技術調査支援プログラム | |
US7480855B2 (en) | Apparatus and method of highlighting parts of web documents based on intended readers | |
US11645472B2 (en) | Conversion of result processing to annotated text for non-rich text exchange | |
JP2010113730A (ja) | 検索サーバ及びコンピュータプログラム | |
JP2021120790A (ja) | 文章構造描画装置 | |
Kásler et al. | Framework for semi automatically generating topic maps | |
Khatavkar et al. | Use of noun phrases in identification of a website | |
Hostetter et al. | Using standardized lexicons for report template validation with LexMap, a web-based application | |
Broda et al. | Tools for plWordNet Development. Presentation and Perspectives. | |
US8832082B2 (en) | Presentation of search results with diagrams | |
NL2025417B1 (en) | Intelligent Content Identification and Transformation |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20191128 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20200911 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20200929 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20201127 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20210209 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20210217 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6840597 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |