JP4806773B2 - 対話型複数文書要約装置 - Google Patents
対話型複数文書要約装置 Download PDFInfo
- Publication number
- JP4806773B2 JP4806773B2 JP2006256759A JP2006256759A JP4806773B2 JP 4806773 B2 JP4806773 B2 JP 4806773B2 JP 2006256759 A JP2006256759 A JP 2006256759A JP 2006256759 A JP2006256759 A JP 2006256759A JP 4806773 B2 JP4806773 B2 JP 4806773B2
- Authority
- JP
- Japan
- Prior art keywords
- document
- sentence
- word
- target
- attention
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
複数の文書を記憶する文書データベースから文書を検索する文書検索エンジンと接続する対話型複数文書要約装置であって、以下の要素を有することを特徴とする
(1)検索条件文を入力する検索条件入力部
(2)入力した検索条件文から検索条件式を生成し、文書検索エンジンに検索条件式を転送し、文書検索エンジンから検索結果文書の識別情報を取得し、それらを要約対象文書の識別情報とする要約対象文書選択部
(3)要約対象文書の識別情報を記憶する要約対象文書記憶部
(4)要約対象文書の識別情報により特定される要約対象文書に含まれる文データに含まれる単語の重要度を算出し、当該単語の重要度に基づいて文の重要度を算出し、文の重要度に基づいて重要文を特定し、重要文からなる要約文書を生成する要約文書生成部
(5)要約文書を表示し、操作者に対して要約文書に含まれる重要文から注目文を選択するように促す要約文書画面を生成し、要約文書画面で選択された注目文の出所である注目文書の識別情報を特定する要約文書提示部
(6)要約対象文書記憶部に記憶している要約対象文書の識別情報群を注目文書の識別情報に更新する要約対象文書絞込部。
対話型複数文書要約装置は、注目文字列内単語に1より大きい文字列注目係数を設定し、注目文字列外単語に1より小さい文字列注目係数を設定する文字列注目係数算出部を有し、
要約文書生成部は、単語の重要度に文字列注目係数を乗じ、その積を単語の重要度として用いることを特徴とする。
対話型複数文書要約装置は、更に、注目文書に含まれる注目文書内単語に1より大きい文書注目係数を設定し、非注目文書に含まれる単語であって注目文書内単語以外の注目文書外単語に1より小さい文書注目係数を設定する文書注目係数算出部を有し、
要約対象要約文書生成部は、単語の重要度に文書注目係数を乗じ、その積を単語の重要度として用いることを特徴とする。
検索条件文に含まれる単語の頻度に基づいて初期の検索質問ベクトルを算出し、検索質問ベクトル記憶部に記憶させる初期検索質問ベクトル算出部と、
検索質問ベクトルを記憶する検索質問ベクトル記憶部と、
文書検索エンジンに検索質問ベクトルを転送し、文書検索エンジンから検索結果文書の識別情報を取得し、それらを推薦要約対象文書の識別情報とする推薦要約対象文書抽出部と、
推薦要約対象文書の識別情報により特定される推薦要約対象文書に含まれる文データに含まれる単語の重要度を算出し、当該単語の重要度に基づいて文の重要度を算出し、文の重要度に基づいて重要文を特定し、重要文からなる推薦要約文書を生成する推薦要約文書生成部と、
注目文書の識別情報により特定される文書ベクトルに基づいて加算修正ベクトルを算出し、非注目文書の識別情報により特定される文書ベクトルに基づいて減算修正ベクトルを算出し、検索質問ベクトル記憶部に記憶している検索質問ベクトルに加算修正ベクトルを加算し、減算修正ベクトルを減算し、検索質問ベクトルを更新する検索質問ベクトル更新部を有し、
要約文書提示部は、推薦要約文書を表示し、操作者に対して推薦要約文書に含まれる重要文から注目文を選択するように促す推薦要約文書画面を生成し、推薦要約文書画面で選択された注目文の出所である注目文書の識別情報を特定し、前記要約文書及び当該推薦要約文書について、重要文の出所のうち注目文書以外の非注目文書の識別情報を特定することを特徴とする。
要約対象文書の識別情報を記憶する要約対象文書記憶部を有し、複数の文書を記憶する文書データベースから文書を検索する文書検索エンジンと接続する対話型複数文書要約装置となるコンピュータに、以下の手順を実行させることを特徴とする
(1)検索条件文を入力する検索条件入力手順
(2)入力した検索条件文から検索条件式を生成し、文書検索エンジンに検索条件式を転送し、文書検索エンジンから検索結果文書の識別情報を取得し、それらを要約対象文書の識別情報とする要約対象文書選択手順
(3)要約対象文書の識別情報により特定される要約対象文書に含まれる文データに含まれる単語の重要度を算出し、当該単語の重要度に基づいて文の重要度を算出し、文の重要度に基づいて重要文を特定し、重要文からなる要約文書を生成する要約文書生成手順
(4)要約文書を表示し、操作者に対して要約文書に含まれる重要文から注目文を選択するように促す要約文書画面を生成し、要約文書画面で選択された注目文の出所である注目文書の識別情報を特定する要約文書提示手順
(5)要約対象文書記憶部に記憶している要約対象文書の識別情報群を注目文書の識別情報に更新する要約対象文書絞込手順。
本実施の形態では、表示された要約文書中から操作者が選択した文に基づいて、当該文の出所である文書に要約の対象を絞り込む実施例を説明する。
図22は、要約文書記憶部の構成例を示す図である。要約内文番号の順に従って重要文を記憶している。
図24は、要約文書提示部の内部モジュール構成を示す図である。要約文書提示部504は、要約文書画面生成部2401、要約文書画面記憶部2402、要約文書画面出力部2403、注目部位取得部2404、注目文記憶部2405、及び注目文書判定部2406を有している。
本実施の形態では、表示された要約文書中から操作者が選択した文字列に基づいて、当該文字列に含まれる単語に対して重み付けを施して、要約文書を再生成する実施例について説明する。この例では、単語に対して重み付けとしてBIASw(文字列注目係数)を用いる。
本実施の形態では、表示された要約文書中から操作者が選択した部位(文あるいは文字列)に基づいて、当該部位の出所である要約対象文書に含まれる単語に対して重み付けを施して、要約文書を再生成する実施例について説明する。この例では、単語に対して重み付けとしてBIASd(文書注目係数)を用いる。
実施の形態2の注目文字列内単語係数と実施の形態3の注目文書内単語係数を併せて用いることもできる。
上述の実施例のように検索条件文を変換した検索条件式による文書検索に基づく要約文書を主要約文書とし、更に検索条件文から生成した検索質問ベクトルによる文書検索に基づく推薦要約文書を生成し、両要約文書を同時に提示し、両要約文書画面から前述の注目文や注目文字列の指示の入力を受け付ける実施例について説明する。
実施の形態5に実施の形態2の特徴を加えることも有効である。図71は、実施の形態6に係る全体処理フローを示す図である。
実施の形態5に実施の形態3の特徴を加えることも有効である。図72は、実施の形態7に係る全体処理フローを示す図である。
実施の形態5に実施の形態4の特徴を加えることも有効である。図73は、実施の形態8に係る全体処理フローを示す図である。
前述の例では、主要約文書画面と推薦要約文書画面を同時に表示したが、一方のみを表示し、切換指示を受け付けた場合に他方の画面に切り換えることもできる。図74は、実施の形態9に係る全体処理フローを示す図である。
実施の形態2から要約対象文書絞込の処理を除くこともできる。この場合には、同じ要約対象文書群に基づいて、新たな要約文書が生成される。図77は、実施の形態10に係る全体処理フローを示す図である。
実施の形態3から要約対象文書絞込の処理を除くこともできる。この場合には、同じ要約対象文書群に基づいて、新たな要約文書が生成される。図78は、実施の形態11に係る全体処理フローを示す図である。
実施の形態4から要約対象文書絞込の処理を除くこともできる。この場合には、同じ要約対象文書群に基づいて、新たな要約文書が生成される。図79は、実施の形態12に係る全体処理フローを示す図である。
実施の形態5から主要約文書に関する処理を除くこともできる。この場合には、推薦要約文書のみが生成され、提示される。図80は、実施の形態13に係る全体処理フローを示す図である。
実施の形態6から主要約文書に関する処理を除くこともできる。この場合には、推薦要約文書のみが生成され、提示される。図81は、実施の形態14に係る全体処理フローを示す図である。
実施の形態7から主要約文書に関する処理を除くこともできる。この場合には、推薦要約文書のみが生成され、提示される。図82は、実施の形態15に係る全体処理フローを示す図である。
実施の形態8から主要約文書に関する処理を除くこともできる。この場合には、推薦要約文書のみが生成され、提示される。図83は、実施の形態16に係る全体処理フローを示す図である。
本実施の形態では、検索条件文に含まれる単語に対して重み付けを施して、要約文書を再生成する実施例について説明する。この例では、単語に対して重み付けとしてBIASs(検索キーワード係数)を用いる。
Claims (5)
- 複数の文書を記憶する文書データベースから文書を検索する文書検索エンジンと接続する対話型複数文書要約装置であって、以下の要素を有することを特徴とする対話型複数文書要約装置
(1)検索条件文を入力する検索条件入力部
(2)入力した検索条件文から検索条件式を生成し、文書検索エンジンに検索条件式を転送し、文書検索エンジンから検索結果文書の識別情報を取得し、それらを要約対象文書の識別情報とする要約対象文書選択部
(3)要約対象文書の識別情報を記憶する要約対象文書記憶部
(4)要約対象文書の識別情報により特定される要約対象文書に含まれる文データに含まれる単語の重要度を算出し、当該単語の重要度に基づいて文の重要度を算出し、文の重要度に基づいて重要文を特定し、重要文からなる要約文書を生成する要約文書生成部
(5)要約文書を表示し、操作者に対して要約文書に含まれる重要文から注目文を選択するように促す要約文書画面を生成し、要約文書画面で選択された注目文の出所である注目文書の識別情報を特定する要約文書提示部
(6)要約対象文書記憶部に記憶している要約対象文書の識別情報群を注目文書の識別情報に更新する要約対象文書絞込部。 - 要約文書提示部は、要約文書画面が操作者に対して要約文書から注目文字列を選択するように促すように生成し、要約文書画面で選択された注目文字列に含まれる注目文字列内単語を特定し、更に要約文書に含まれるが注目文字列に含まれない注目文字列外単語を特定し、
対話型複数文書要約装置は、注目文字列内単語に1より大きい文字列注目係数を設定し、注目文字列外単語に1より小さい文字列注目係数を設定する文字列注目係数算出部を有し、
要約文書生成部は、単語の重要度に文字列注目係数を乗じ、その積を単語の重要度として用いることを特徴とする請求項1記載の対話型複数文書要約装置。 - 要約文書提示部は、更に重要文の出所のうち注目文書以外の非注目文書の識別情報を特定し、
対話型複数文書要約装置は、更に、注目文書に含まれる注目文書内単語に1より大きい文書注目係数を設定し、非注目文書に含まれる単語であって注目文書内単語以外の注目文書外単語に1より小さい文書注目係数を設定する文書注目係数算出部を有し、
要約対象要約文書生成部は、単語の重要度に文書注目係数を乗じ、その積を単語の重要度として用いることを特徴とする請求項1記載の対話型複数文書要約装置。 - 対話型複数文書要約装置は、更に、
検索条件文に含まれる単語の頻度に基づいて初期の検索質問ベクトルを算出し、検索質問ベクトル記憶部に記憶させる初期検索質問ベクトル算出部と、
検索質問ベクトルを記憶する検索質問ベクトル記憶部と、
文書検索エンジンに検索質問ベクトルを転送し、文書検索エンジンから検索結果文書の識別情報を取得し、それらを推薦要約対象文書の識別情報とする推薦要約対象文書抽出部と、
推薦要約対象文書の識別情報により特定される推薦要約対象文書に含まれる文データに含まれる単語の重要度を算出し、当該単語の重要度に基づいて文の重要度を算出し、文の重要度に基づいて重要文を特定し、重要文からなる推薦要約文書を生成する推薦要約文書生成部と、
注目文書の識別情報により特定される文書ベクトルに基づいて加算修正ベクトルを算出し、非注目文書の識別情報により特定される文書ベクトルに基づいて減算修正ベクトルを算出し、検索質問ベクトル記憶部に記憶している検索質問ベクトルに加算修正ベクトルを加算し、減算修正ベクトルを減算し、検索質問ベクトルを更新する検索質問ベクトル更新部を有し、
要約文書提示部は、推薦要約文書を表示し、操作者に対して推薦要約文書に含まれる重要文から注目文を選択するように促す推薦要約文書画面を生成し、推薦要約文書画面で選択された注目文の出所である注目文書の識別情報を特定し、前記要約文書及び当該推薦要約文書について、重要文の出所のうち注目文書以外の非注目文書の識別情報を特定することを特徴とする請求項1記載の対話型複数文書要約装置。 - 要約対象文書の識別情報を記憶する要約対象文書記憶部を有し、複数の文書を記憶する文書データベースから文書を検索する文書検索エンジンと接続する対話型複数文書要約装置となるコンピュータに、以下の手順を実行させるためのプログラム
(1)検索条件文を入力する検索条件入力手順
(2)入力した検索条件文から検索条件式を生成し、文書検索エンジンに検索条件式を転送し、文書検索エンジンから検索結果文書の識別情報を取得し、それらを要約対象文書の識別情報とする要約対象文書選択手順
(3)要約対象文書の識別情報により特定される要約対象文書に含まれる文データに含まれる単語の重要度を算出し、当該単語の重要度に基づいて文の重要度を算出し、文の重要度に基づいて重要文を特定し、重要文からなる要約文書を生成する要約文書生成手順
(4)要約文書を表示し、操作者に対して要約文書に含まれる重要文から注目文を選択するように促す要約文書画面を生成し、要約文書画面で選択された注目文の出所である注目文書の識別情報を特定する要約文書提示手順
(5)要約対象文書記憶部に記憶している要約対象文書の識別情報群を注目文書の識別情報に更新する要約対象文書絞込手順。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006256759A JP4806773B2 (ja) | 2006-09-22 | 2006-09-22 | 対話型複数文書要約装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006256759A JP4806773B2 (ja) | 2006-09-22 | 2006-09-22 | 対話型複数文書要約装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2008077459A JP2008077459A (ja) | 2008-04-03 |
JP4806773B2 true JP4806773B2 (ja) | 2011-11-02 |
Family
ID=39349434
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006256759A Active JP4806773B2 (ja) | 2006-09-22 | 2006-09-22 | 対話型複数文書要約装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4806773B2 (ja) |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2749790B2 (ja) * | 1995-03-28 | 1998-05-13 | 株式会社エイ・ティ・アール音声翻訳通信研究所 | 並列テキスト検索システム |
JP3654850B2 (ja) * | 2000-05-17 | 2005-06-02 | 松下電器産業株式会社 | 情報検索システム |
JP2003281159A (ja) * | 2002-03-19 | 2003-10-03 | Fuji Xerox Co Ltd | 文書処理装置及び文書処理方法、文書処理プログラム |
JP2005141428A (ja) * | 2003-11-05 | 2005-06-02 | Nippon Telegr & Teleph Corp <Ntt> | 単語列抽出方法、装置及び単語列抽出プログラムを記録した記録媒体 |
JP2006059082A (ja) * | 2004-08-19 | 2006-03-02 | Yokohama National Univ | 文書要約システム及び文書要約方法及びプログラムを記録したコンピュータ読み取り可能な記録媒体及びプログラム |
JP2006163525A (ja) * | 2004-12-02 | 2006-06-22 | Canon Inc | 文書処理装置、文書処理方法、及びコンピュータプログラム |
-
2006
- 2006-09-22 JP JP2006256759A patent/JP4806773B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2008077459A (ja) | 2008-04-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8250054B2 (en) | Network search engine utilizing client browser favorites | |
US7424476B2 (en) | Categorized web browsing history | |
KR101147470B1 (ko) | 레코멘데이션 정보 생성 장치 및 레코멘데이션 정보 생성 방법 | |
US20110314005A1 (en) | Determining and using search term weightings | |
US20100057717A1 (en) | System And Method For Generating A Search Ranking Score For A Web Page | |
US20060059440A1 (en) | System for organization, display, and navigation of digital information | |
US20090112800A1 (en) | System and method for visual contextual search | |
JP5859606B2 (ja) | オンライン商取引プラットフォームにおける広告ソースおよびキーワードセットの適合 | |
US20120072406A1 (en) | Search processing method and apparatus | |
US6850954B2 (en) | Information retrieval support method and information retrieval support system | |
US20030101286A1 (en) | Inferring relations between internet objects | |
US20060277174A1 (en) | Method and device for searching a data unit in a database | |
US9667505B2 (en) | URL navigation page generation method, device and program | |
CN103678555A (zh) | 进行网页收藏的方法和浏览器 | |
WO2001050346A1 (en) | System and method for displaying results of search | |
CN108197244A (zh) | 一种搜索推荐词的推送方法和装置 | |
US8538941B2 (en) | Visual information search tool | |
JP4806773B2 (ja) | 対話型複数文書要約装置 | |
JP2010181966A (ja) | レコメンド情報評価装置およびレコメンド情報評価方法 | |
Markowetz et al. | Geographic information retrieval | |
Markowetz et al. | Exploiting the internet as a geospatial database | |
CN105243106A (zh) | 一种用于生成查询结果的方法和装置 | |
JP5813560B2 (ja) | 検索条件提示装置、方法、及びプログラム | |
CN108062328A (zh) | 获取网站自然搜索排名的方法和装置 | |
US20160100020A1 (en) | Web presence management system |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20090728 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20110708 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20110719 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R154 | Certificate of patent or utility model (reissue) |
Free format text: JAPANESE INTERMEDIATE CODE: R154 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |