JP2005234635A - 文書要約装置および方法 - Google Patents
文書要約装置および方法 Download PDFInfo
- Publication number
- JP2005234635A JP2005234635A JP2004039510A JP2004039510A JP2005234635A JP 2005234635 A JP2005234635 A JP 2005234635A JP 2004039510 A JP2004039510 A JP 2004039510A JP 2004039510 A JP2004039510 A JP 2004039510A JP 2005234635 A JP2005234635 A JP 2005234635A
- Authority
- JP
- Japan
- Prior art keywords
- role
- document
- sentence
- search
- keyword
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
【解決手段】 ユーザは、文書入力部10を用いて要約したい文書を指定する。さらに、要約のための視点を、キーワード/役割指定部13を用いてキーワードとその役割で指定する。指定された文書は、役割解析部11に送られ、抽出された役割情報が役割情報記憶部12に登録される。役割の抽出が終わると、文書中の各文のスコアをスコア計算部14において計算する。そしてスコア計算部14のスコアに基づいて要約生成部15により要約を合成する。ここでは、文単位でスコアリングしてスコアの高いものを要約として抽出する重要文ピックアップの手法を用いている。生成された要約は表示部16に表示される。
【選択図】 図1
Description
(1)「A社」のスコアに重みづけする(矢印a)
(2)「A社」に重みづけし、役割が一致する場合、さらに重みづけする(矢印b)
などとしてもよい。重みを5とした場合、第五文の「A社」は10.4*5となる。第一文、第三文の「A社」に関しては、キーワードおよび役割の双方が一致しているので、10.4*5*5となる。
(1)コンピュータで解析する→「手段」
(2)有楽町で会う→「場所」
のような役割を抽出するようにしてもよい。また、「XYZの開発」のように、表層的には名詞間の修飾関係であっても、「XYZ」の役割として「対象」を抽出するようにしてもよい。
(1)キーワード:「XYZ」
(2)役割:「を」
を抽出する。
(2)役割解析において、役割は、格助詞などをそのままでもよい。格助詞などの表層表現と、特定の役割を対応づけるようにしてもよい(が−動作主体/で−場所、など)。意味解析などを行って、表層からはわからない役割を特定するようにしてもよい。
(3)要約視点を選択するためにユーザが指定する役割は、役割解析の役割との対応づけが可能なら、どのようなものでもよい。
(4)一般に要約は単独で用いられることは少なく、検索結果に要約を付与するという使われ方をすることが多い。その場合、検索と要約の視点は同じであるのがふつうなので、検索のために指定したキーワードとその役割を、要約の視点として利用してもよい。その場合、実施例3で説明したように、検索部を追加し、要約視点指定手段の代わりに、検索視点指定手段を設ける。
(5)上述の(4)の場合、検索視点指定手段の代わりに検索クエリ入力手段と検索視点抽出手段を設け、検索クエリからキーワードと役割を自動抽出するようにしてもよい。
(6)固有名抽出手段を設け、対象文書または検索クエリに含まれる固有名をキーワードとするようにしてもよい。
(7)キーワードと役割の数は、ひとつのキーワードに対してひとつの役割でもいいし、複数のキーワードに共通の役割でもよい。
(8)指定したキーワードと役割を含む文から、キーワードと役割の前後に所定数の単語や文字列を付加した部分だけを抽出し、それをスコアリングして要約を選択するようにしてもよい。
(9)指定したキーワードと役割を含む文を解析した結果から、キーワードと役割を含む関係を抽出し、この関係に係る必須格等を付与したフレーズを作成して、それをスコアリングして要約を選択するようにしてもよい。
(10)指定した役割をもつキーワードに重み付けすることによって文をスコアリングし、スコアの高い文を要約として選択するようにしてもよい。
11 役割解析部
12 役割情報記憶部
13 役割指定部
14 スコア計算部
15 要約生成部
16 表示部
20 文書登録部
21 文書記憶部
30 検索クエリ入力部
31 検索クエリ役割記憶部
32 検索部
33 検索結果記憶部
111 形態素解析部
112 構文解析部
113 役割情報抽出部
Claims (21)
- 処理対象文書を入力する文書入力手段と、
キーワードと、文におけるキーワードの役割とを指定する要約視点指定手段と、
上記処理対象文書に含まれる各文について当該各文の所定の語句の役割を判別する役割判別手段と、
上記要約視点指定手段により指定されたキーワードおよび役割を上記各文に含まれる所定の語句およびその役割に突き合わせる突き合わせ手段と、
上記突き合わせ手段の突き合わせ結果に基づいて要約を構成すべき文を選択して要約を作成する要約作成手段とを有することを特徴とする文書要約装置。 - 処理対象文書を入力する文書入力手段と、
キーワードと、文におけるキーワードの役割とを指定する要約視点指定手段と、
上記処理対象文書に含まれる各文について当該各文の所定の語句の役割を判別する役割判別手段と、
上記要約視点指定手段により指定されたキーワードおよび役割を上記各文に含まれる所定の語句およびその役割に突き合わせて、上記各文のスコアを計算するスコア計算手段と、
上記各文の上記スコアに基づいて要約を構成すべき文を選択して要約を作成する要約作成手段とを有することを特徴とする文書要約装置。 - 上記役割は、動作、状態、状態変化などの主体、対象、相手、手段、場所、時間などである請求項1または2記載の文書要約装置。
- 上記役割は、表層格により表される請求項1、2または3記載の文書要約装置。
- 上記キーワードは固有表現である請求項1、2、3または4記載の文書要約装置。
- 上記スコア計算手段は、各文に含まれる自立語のスコアを加算し、さらに上記自立語が上記指定されたキーワードで指定された役割を持つときに大きな重みを付ける請求項1〜5のいずれかに記載の文書要約装置。
- 上記スコア計算手段は、各文に含まれる自立語のスコアを加算し、さらに上記自立語が上記指定されたキーワードの場合に所定の重みを付け、さらに上記自立語が上記指定されたキーワードで指定された役割を持つときにより大きな重みを付ける請求項1〜5のいずれかに記載の文書要約装置。
- 上記自立語のスコアはtf*IDFのスコアである請求項7記載の文書要約装置。
- 検索キーワードおよび当該検索キーワードの役割を入力する検索視点入力手段と、
検索対象の各文書に含まれる各文について当該各文の所定の語句の役割を判別する文書役割判別手段と、
少なくとも上記検索キーワードに基づいて文書を検索する検索手段と、
上記検索手段により検索された各文書に対して、当該各文書に含まれる各文の所定の語句およびその役割を、上記検索キーワードおよびその役割に突き合わせて上記各文書に含まれる各文のスコアを計算するスコア計算手段と、
上記各文書に含まれる各文の上記スコアに基づいて上記各文書の要約を構成すべき文を選択して要約を作成する要約作成手段とを有することを特徴とする文書要約装置。 - 上記検索視点入力手段は、
検索クエリを入力する検索クエリ入力手段と、
上記検索クエリからキーワードおよびその役割を抽出するキーワード役割抽出手段とを有する請求項9記載の文書要約装置。 - 上記検索手段は、上記検索キーワードおよびその役割に基づいて文書を検索する請求項9または10記載の文書要約装置。
- 検索クエリを入力する検索クエリ入力手段と、
検索クエリに含まれる語句の役割を判別する役割判別手段と、
上記検索クエリに含まれる語句および上記役割判別手段により判別された役割に基づいて文書を検索する検索手段とを有することを特徴とする検索装置。 - 検索キーワードおよびその役割を入力する検索視点入力手段と、
上記検索キーワードおよびその役割に基づいて文書を検索する検索手段とを有することを特徴とする検索装置。 - 文書入力手段が処理対象文書を入力するステップと、
要約視点指定手段がキーワードと、文におけるキーワードの役割とを指定するステップと、
役割判別手段が上記処理対象文書に含まれる各文について当該各文の所定の語句の役割を判別するステップと、
突き合わせ手段が上記要約視点指定手段により指定されたキーワードおよび役割を上記各文に含まれる所定の語句およびその役割に突き合わせるステップと、
要約作成手段が上記突き合わせ手段の突き合わせ結果に基づいて要約を構成すべき文を選択して要約を作成するステップとを有することを特徴とする文書要約方法。 - 文書入力手段が処理対象文書を入力するステップと、
要約視点指定手段が、キーワードと、文におけるキーワードの役割とを指定するステップと、
役割判別手段が上記処理対象文書に含まれる各文について当該各文の所定の語句の役割を判別するステップと、
スコア計算手段が、上記要約視点指定手段により指定されたキーワードおよび役割を上記各文に含まれる所定の語句およびその役割に突き合わせて、上記各文のスコアを計算するステップと、
要約作成手段が、上記各文の上記スコアに基づいて要約を構成すべき文を選択して要約を作成するステップとを有することを特徴とする文書要約方法。 - 検索視点入力手段が検索キーワードおよび当該検索キーワードの役割を入力するステップと、
文書役割判別手段が検索対象の各文書に含まれる各文について当該各文の所定の語句の役割を判別するステップと、
検索手段が少なくとも上記検索キーワードに基づいて文書を検索するステップと、
スコア計算手段が、上記検索手段により検索された各文書に対して、当該各文書に含まれる各文の所定の語句およびその役割を、上記検索キーワードおよびその役割に突き合わせて上記各文書に含まれる各文のスコアを計算するステップと、
要約合成手段が、上記各文書に含まれる各文の上記スコアに基づいて上記各文書の要約を構成すべき文を選択して要約を合成するステップとを有することを特徴とする文書要約方法。 - 検索視点入力手段が検索キーワードおよびその役割を入力するステップと、
検索手段が上記検索キーワードおよびその役割に基づいて文書を検索するステップとを有することを特徴とする検索方法。 - 文書入力手段が処理対象文書を入力するステップと、
要約視点指定手段がキーワードと、文におけるキーワードの役割とを指定するステップと、
役割判別手段が上記処理対象文書に含まれる各文について当該各文の所定の語句の役割を判別するステップと、
突き合わせ手段が上記要約視点指定手段により指定されたキーワードおよび役割を上記各文に含まれる所定の語句およびその役割に突き合わせるステップと、
要約作成手段が上記突き合わせ手段の突き合わせ結果に基づいて要約を構成すべき文を選択して要約を作成するステップとをコンピュータに実行させるために用いられることを特徴とする文書要約用コンピュータプログラム。 - 文書入力手段が処理対象文書を入力するステップと、
要約視点指定手段が、キーワードと、文におけるキーワードの役割とを指定するステップと、
役割判別手段が上記処理対象文書に含まれる各文について当該各文の所定の語句の役割を判別するステップと、
スコア計算手段が、上記要約視点指定手段により指定されたキーワードおよび役割を上記各文に含まれる所定の語句およびその役割に突き合わせて、上記各文のスコアを計算するステップと、
要約作成手段が、上記各文の上記スコアに基づいて要約を構成すべき文を選択して要約を作成するステップとをコンピュータに実行させるために用いられることを特徴とする文書要約用コンピュータプログラム。 - 検索視点入力手段が検索キーワードおよび当該検索キーワードの役割を入力するステップと、
文書役割判別手段が検索対象の各文書に含まれる各文について当該各文の所定の語句の役割を判別するステップと、
検索手段が少なくとも上記検索キーワードに基づいて文書を検索するステップと、
スコア計算手段が、上記検索手段により検索された各文書に対して、当該各文書に含まれる各文の所定の語句およびその役割を、上記検索キーワードおよびその役割に突き合わせて上記各文書に含まれる各文のスコアを計算するステップと、
要約合成手段が、上記各文書に含まれる各文の上記スコアに基づいて上記各文書の要約を構成すべき文を選択して要約を作成するステップとをコンピュータに実行させるために用いられることを特徴とする文書要約用コンピュータプログラム。 - 検索視点入力手段が検索キーワードおよびその役割を入力するステップと、
検索手段が上記検索キーワードおよびその役割に基づいて文書を検索するステップとを有することをコンピュータに実行させるために用いられることを特徴とする検索用コンピュータプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004039510A JP2005234635A (ja) | 2004-02-17 | 2004-02-17 | 文書要約装置および方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004039510A JP2005234635A (ja) | 2004-02-17 | 2004-02-17 | 文書要約装置および方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2005234635A true JP2005234635A (ja) | 2005-09-02 |
Family
ID=35017560
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004039510A Pending JP2005234635A (ja) | 2004-02-17 | 2004-02-17 | 文書要約装置および方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2005234635A (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012160201A (ja) * | 2005-09-30 | 2012-08-23 | Google Inc | レビュー処理方法およびシステム |
JP2014241034A (ja) * | 2013-06-11 | 2014-12-25 | インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation | 文を検索する装置、方法およびプログラム |
US9367605B2 (en) | 2009-09-23 | 2016-06-14 | Alibaba Group Holding Limited | Abstract generating search method and system |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0991314A (ja) * | 1995-07-14 | 1997-04-04 | Fuji Xerox Co Ltd | 情報探索装置 |
JPH11184865A (ja) * | 1997-12-19 | 1999-07-09 | Matsushita Electric Ind Co Ltd | 文書要約装置 |
JP2001184352A (ja) * | 1999-12-27 | 2001-07-06 | Dainippon Screen Mfg Co Ltd | 要約文自動作成装置および記録媒体 |
JP2002007472A (ja) * | 2000-06-20 | 2002-01-11 | Internet Owners Kk | インターネットにおける検索結果画面の表示方法及び検索条件の入力方法 |
JP2002049632A (ja) * | 2000-08-03 | 2002-02-15 | Nec Corp | 要約システムとその要約方法、及び要約プログラムを記録した記録媒体 |
JP2002259412A (ja) * | 2001-03-02 | 2002-09-13 | Mitsubishi Chemicals Corp | 光学的情報記録媒体の記録再生装置および光学的情報記録媒体を用いた電子化文書要約方法並びに光学的情報記録媒体を用いた要約読み取り方法および光学的情報記録媒体 |
JP2003281183A (ja) * | 2002-03-20 | 2003-10-03 | Fuji Xerox Co Ltd | 文書情報検索装置、文書情報検索方法及び文書情報検索プログラム |
-
2004
- 2004-02-17 JP JP2004039510A patent/JP2005234635A/ja active Pending
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0991314A (ja) * | 1995-07-14 | 1997-04-04 | Fuji Xerox Co Ltd | 情報探索装置 |
JPH11184865A (ja) * | 1997-12-19 | 1999-07-09 | Matsushita Electric Ind Co Ltd | 文書要約装置 |
JP2001184352A (ja) * | 1999-12-27 | 2001-07-06 | Dainippon Screen Mfg Co Ltd | 要約文自動作成装置および記録媒体 |
JP2002007472A (ja) * | 2000-06-20 | 2002-01-11 | Internet Owners Kk | インターネットにおける検索結果画面の表示方法及び検索条件の入力方法 |
JP2002049632A (ja) * | 2000-08-03 | 2002-02-15 | Nec Corp | 要約システムとその要約方法、及び要約プログラムを記録した記録媒体 |
JP2002259412A (ja) * | 2001-03-02 | 2002-09-13 | Mitsubishi Chemicals Corp | 光学的情報記録媒体の記録再生装置および光学的情報記録媒体を用いた電子化文書要約方法並びに光学的情報記録媒体を用いた要約読み取り方法および光学的情報記録媒体 |
JP2003281183A (ja) * | 2002-03-20 | 2003-10-03 | Fuji Xerox Co Ltd | 文書情報検索装置、文書情報検索方法及び文書情報検索プログラム |
Non-Patent Citations (1)
Title |
---|
奥村 明俊: "5W1H情報抽出・分類によるテキスト要約", 自然言語処理, vol. 第6巻 第6号, JPN6009041333, 10 July 1999 (1999-07-10), JP, pages 27 - 44, ISSN: 0001395105 * |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012160201A (ja) * | 2005-09-30 | 2012-08-23 | Google Inc | レビュー処理方法およびシステム |
US9367605B2 (en) | 2009-09-23 | 2016-06-14 | Alibaba Group Holding Limited | Abstract generating search method and system |
JP2014241034A (ja) * | 2013-06-11 | 2014-12-25 | インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation | 文を検索する装置、方法およびプログラム |
US9767186B2 (en) | 2013-06-11 | 2017-09-19 | International Business Machines Corporation | Retrieving a specific sentence from a document |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4654780B2 (ja) | 質問応答システム、およびデータ検索方法、並びにコンピュータ・プログラム | |
US10552467B2 (en) | System and method for language sensitive contextual searching | |
US11379518B2 (en) | Detecting musical references in natural language search input | |
JP2004062893A (ja) | 重み付き編集距離に基づく例文の自動検索用システムおよび方法 | |
JP2014106665A (ja) | 文書検索装置、文書検索方法 | |
KR20100071829A (ko) | 인덱스 분석장치와 인덱스 검색장치 및 그 방법 | |
JP2006099428A (ja) | 文書要約作成システム、方法、及びプログラム | |
JP5302614B2 (ja) | 施設関連情報の検索データベース形成方法および施設関連情報検索システム | |
JP5204203B2 (ja) | 用例翻訳システム、用例翻訳方法及び用例翻訳プログラム | |
JP2006178599A (ja) | 文書検索装置および方法 | |
JP2008117351A (ja) | 検索システム | |
JPH0844771A (ja) | 情報検索装置 | |
KR101835994B1 (ko) | 키워드 맵을 이용한 전자책 검색 서비스 제공 방법 및 장치 | |
JP5285491B2 (ja) | 情報検索システム、方法及びプログラム、索引作成システム、方法及びプログラム、 | |
JP2005234635A (ja) | 文書要約装置および方法 | |
JP5025603B2 (ja) | 機械翻訳装置、機械翻訳プログラム及び機械翻訳方法 | |
JP4378106B2 (ja) | 文書検索装置、文書検索方法及びプログラム | |
JP2003108584A (ja) | 情報検索システム及びプログラム | |
JP2005025418A (ja) | 質問応答装置、質疑応答方法及びプログラム | |
JP2018028732A (ja) | 施設検索装置、施設検索方法、コンピュータプログラム及びコンピュータプログラムを記録した記録媒体 | |
JP5148583B2 (ja) | 機械翻訳装置、方法及びプログラム | |
JP2005234772A (ja) | 文書管理装置および方法 | |
JP2009059290A (ja) | 外国語文書作成支援装置、外国語文書作成支援方法および外国語文書作成支援プログラム | |
JP5378109B2 (ja) | タスクモデル生成装置およびタスクモデル生成方法 | |
JPH1166084A (ja) | 画像検索装置およびその装置の各手段としてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20070119 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20090807 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20090825 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20091016 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20091222 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100217 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20100511 |