JP5810053B2 - 要約生成装置及び方法及びプログラム - Google Patents
要約生成装置及び方法及びプログラム Download PDFInfo
- Publication number
- JP5810053B2 JP5810053B2 JP2012186038A JP2012186038A JP5810053B2 JP 5810053 B2 JP5810053 B2 JP 5810053B2 JP 2012186038 A JP2012186038 A JP 2012186038A JP 2012186038 A JP2012186038 A JP 2012186038A JP 5810053 B2 JP5810053 B2 JP 5810053B2
- Authority
- JP
- Japan
- Prior art keywords
- sentence
- user
- field
- clause
- word
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Machine Translation (AREA)
- Document Processing Apparatus (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
過去のユーザとの対話において、該ユーザが各語を提示した回数と、該語についての修正要求回数をユーザ毎に保持する履歴記憶手段と、
語と該語が属する分野及び該語の難易度を保持する難易度記憶手段と、
入力された利用者IDに基づいて前記履歴記憶手段から得られた語と、提示した回数及び修正要求回数と、該語と入力された分野名に基づいて前記難易度記憶手段から得られた難易度を用いて、分野における利用者の知識の程度を算出する分野知識推定手段と、
入力された要約対象文の分野を決定し、前記分野知識推定手段に前記利用者IDと前記分野名を入力して該分野における知識の程度を取得し、該要約対象文の文節をノードとし、文末を根とする係り受け関係をエッジで表現する係り受け木を作成し、該係り受け木を枝刈りし、短縮文に相当する枝刈りされた全ての木と該分野における知識の程度を用いて期待伝達時間を算出し、該期待伝達時間が最小となる該係り受け木に相当する短縮文を要約文とする文短縮手段と、を有する。
前記文短縮手段は、
前記枝刈りされた全ての木に残っている文節bを根とする部分木について、該部分木に含まれる自立語の集合qに基づいて前記標準難易度記憶手段を参照して取得した標準難易度nq、元の係り受け木において、該文節bの直下あった文節のうち、現在対象としている該部分木に存在しない文節の長さの和lend、該文節bの長さlenb、該文節bを除いた場合に根となる文節cについての伝達可能性Sc、前記利用者の知識の程度kを用いて、該文節bを根とする部分木の部分期待伝達時間S bを算出し、該部分期待伝達時間Sbを前記期待伝達時間とする手段を含む。
前記文短縮手段は、
前記短縮文内での各文節に係っている部分木を連結した文字列を修正要約記憶手段に格納する手段を含み、
前記要約出力手段は、
前記要約文について、ユーザより指示があった場合には、該ユーザが該要約文に対する修正と判断し、指示された文節位置に対応する修正内容で修正要約記憶手段を更新する、または、該ユーザに再出力する手段を含む。
20 履歴管理部
30 分野知識推定部
40 短縮対象文選択部
50 文短縮部
60 要約出力部
70 修正要約記憶部
80 履歴管理表
90 語−分野対応表
Claims (7)
- 提示した要約に対するユーザによる割り込み可能な対話を利用して入力された要約対象文書の要約を生成する要約生成装置であって、
過去のユーザとの対話において、該ユーザが各語を提示した回数と、該語についての修正要求回数をユーザ毎に保持する履歴記憶手段と、
語と該語が属する分野及び該語の難易度を保持する難易度記憶手段と、
入力された利用者IDに基づいて前記履歴記憶手段から得られた語と、提示した回数及び修正要求回数と、該語と入力された分野名に基づいて前記難易度記憶手段から得られた難易度を用いて、分野における利用者の知識の程度を算出する分野知識推定手段と、
入力された要約対象文の分野を決定し、前記分野知識推定手段に前記利用者IDと前記分野名を入力して該分野における知識の程度を取得し、該要約対象文の文節をノードとし、文末を根とする係り受け関係をエッジで表現する係り受け木を作成し、該係り受け木を枝刈りし、短縮文に相当する枝刈りされた全ての木と該分野における知識の程度を用いて期待伝達時間を算出し、該期待伝達時間が最小となる該係り受け木に相当する短縮文を要約文とする文短縮手段と、
を有することを特徴とする要約生成装置。 - 自立語や該自立語の組み合わせについて、分野内での標準難易度を格納した標準難易度記憶手段を更に有し、
前記文短縮手段は、
前記枝刈りされた全ての木に残っている文節bを根とする部分木について、該部分木に含まれる自立語の集合qに基づいて前記標準難易度記憶手段を参照して取得した標準難易度nq、元の係り受け木において、該文節bの直下あった文節のうち、現在対象としている該部分木に存在しない文節の長さの和lend、該文節bの長さlenb、該文節bを除いた場合に根となる文節cについての伝達可能性Sc、前記利用者の知識の程度kを用いて、該文節bを根とする部分木の部分期待伝達時間S bを算出し、該部分期待伝達時間Sbを前記期待伝達時間とする手段を含む
請求項1記載の要約生成装置。 - 前記文短縮手段によって得られた前記短縮文短縮での要約文を出力する要約出力手段を更に有し、
前記文短縮手段は、
前記短縮文内での各文節に係っている部分木を連結した文字列を修正要約記憶手段に格納する手段を含み、
前記要約出力手段は、
前記要約文について、ユーザより指示があった場合には、該ユーザが該要約文に対する修正と判断し、指示された文節位置に対応する修正内容で修正要約記憶手段を更新する、または、該ユーザに再出力する手段を含む
請求項1記載の要約生成装置。 - 提示した要約に対するユーザによる割り込み可能な対話を利用して入力された要約対象文書の要約を生成する要約生成方法であって、
過去のユーザとの対話において、該ユーザが各語を提示した回数と、該語についての修正要求回数をユーザ毎に保持する履歴記憶手段
語と該語が属する分野及び該語の難易度を保持する難易度記憶手段と、
分野知識推定手段、文短縮手段を有する装置において、
前記文短縮手段が、入力された要約対象文の分野を決定する分野決定ステップと、
前記分野知識推定手段が、入力された利用者IDに基づいて前記履歴記憶手段から得られた語と、提示した回数及び修正要求回数と、該語と入力された分野名に基づいて前記難易度記憶手段から得られた難易度を用いて、分野における利用者の知識の程度を算出する
分野知識推定ステップと、
前記文短縮手段が、前記該要約対象文の文節をノードとし、文末を根とする係り受け関係をエッジで表現する係り受け木を作成し、該係り受け木を枝刈りし、短縮文に相当する枝刈りされた全ての木と前記分野における知識の程度を用いて期待伝達時間を算出し、該期待伝達時間が最小となる該係り受け木に相当する短縮文を要約文とする文短縮ステップと、
を行うことを特徴とする要約生成方法。 - 前記装置が、自立語や該自立語の組み合わせについて、分野内での標準難易度を格納した標準難易度記憶手段を更に有し、
前記文短縮ステップにおいて、
前記枝刈りされた全ての木に残っている文節bを根とする部分木について、該部分木に含まれる自立語の集合qに基づいて前記標準難易度記憶手段を参照して取得した標準難易度nq、元の係り受け木において、該文節bの直下あった文節のうち、現在対象としている該部分木に存在しない文節の長さの和lend、該文節bの長さlenb、該文節bを除いた場合に根となる文節cについての伝達可能性Sc、前記利用者の知識の程度kを用いて、該文節bを根とする部分木の部分期待伝達時間S bを算出し、該部分期待伝達時間Sbを前記期待伝達時間とする
請求項4記載の要約生成方法。 - 前記装置が、要約出力手段を更に有し、
前記文短縮ステップにおいて、
前記短縮文内での各文節に係っている部分木を連結した文字列を修正要約記憶手段に格納するステップを更に行い、
前記要約出力手段が、前記文短縮ステップによって得られた前記短縮文短縮での要約文を出力するステップと、
前記要約文について、ユーザより指示があった場合には、該ユーザが該要約文に対する修正と判断し、指示された文節位置に対応する修正内容で修正要約記憶手段を更新する、または、該ユーザに再出力するステップを更に行う
請求項4記載の要約生成方法。 - コンピュータを、
請求項1乃至3のいずれか1項に記載の要約生成装置の各手段として機能させるための要約生成プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012186038A JP5810053B2 (ja) | 2012-08-27 | 2012-08-27 | 要約生成装置及び方法及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012186038A JP5810053B2 (ja) | 2012-08-27 | 2012-08-27 | 要約生成装置及び方法及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2014044539A JP2014044539A (ja) | 2014-03-13 |
JP5810053B2 true JP5810053B2 (ja) | 2015-11-11 |
Family
ID=50395765
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012186038A Expired - Fee Related JP5810053B2 (ja) | 2012-08-27 | 2012-08-27 | 要約生成装置及び方法及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5810053B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2021114184A (ja) * | 2020-01-20 | 2021-08-05 | シャープ株式会社 | 要約生成装置、要約生成方法、及びプログラム |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003281164A (ja) * | 2002-03-20 | 2003-10-03 | Fuji Xerox Co Ltd | 文書要約装置、文書要約方法、及び文書要約プログラム |
JP2004199408A (ja) * | 2002-12-18 | 2004-07-15 | Fuji Xerox Co Ltd | 文書処理方法、情報表示処理方法、情報表示処理システム、管理サーバ、クライアント端末、プログラム |
JP5201727B2 (ja) * | 2008-07-14 | 2013-06-05 | 日本電信電話株式会社 | 文書要約装置、文書要約方法、プログラムおよび記録媒体 |
JP5058221B2 (ja) * | 2008-11-12 | 2012-10-24 | 日本電信電話株式会社 | 文短縮装置、その方法およびプログラム |
JP4931958B2 (ja) * | 2009-05-08 | 2012-05-16 | 日本電信電話株式会社 | テキスト要約方法、その装置およびプログラム |
-
2012
- 2012-08-27 JP JP2012186038A patent/JP5810053B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2014044539A (ja) | 2014-03-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11615791B2 (en) | Voice application platform | |
US10235999B1 (en) | Voice application platform | |
Liu et al. | Unsupervised paraphrasing by simulated annealing | |
US11860914B1 (en) | Natural language database generation and query system | |
CN110930993B (zh) | 特定领域语言模型生成方法及语音数据标注系统 | |
CN106446045B (zh) | 基于对话交互的用户画像的构建方法及系统 | |
US9251474B2 (en) | Reward based ranker array for question answer system | |
US9621601B2 (en) | User collaboration for answer generation in question and answer system | |
JP4580885B2 (ja) | シーン情報抽出方法、シーン抽出方法および抽出装置 | |
US20160328467A1 (en) | Natural language question answering method and apparatus | |
CN103593412B (zh) | 一种基于树形结构问题的应答方法及系统 | |
CN117370190A (zh) | 测试用例生成方法、装置、电子设备和存储介质 | |
US20240242037A1 (en) | Generative text model interface system | |
CN118193704A (zh) | 基于大语言模型的岩土工程知识问答系统 | |
JP5810053B2 (ja) | 要約生成装置及び方法及びプログラム | |
WO2019236444A1 (en) | Voice application platform | |
CN112582073B (zh) | 医疗信息获取方法、装置、电子设备和介质 | |
US12111858B1 (en) | Database system interaction embedding and indexing for text retrieval and generation | |
JP5547254B2 (ja) | 対話的要約生成装置及び方法及びプログラム | |
CN118210487A (zh) | Sql代码补全方法、介质、装置和计算设备 | |
WO2024172897A1 (en) | Text generation interface system | |
CN117874204A (zh) | 一种知识问答方法、系统、存储介质和计算机设备 | |
CN117852549A (zh) | 一种检索增强生成的文本语义切片方法 | |
JP2004348552A (ja) | 音声文書検索装置および方法およびプログラム | |
CN113128202B (zh) | 一种面向物联网服务的智能编排方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20141020 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20150703 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20150714 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20150812 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20150908 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20150914 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5810053 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |