JP2014044539A - 要約生成装置及び方法及びプログラム - Google Patents
要約生成装置及び方法及びプログラム Download PDFInfo
- Publication number
- JP2014044539A JP2014044539A JP2012186038A JP2012186038A JP2014044539A JP 2014044539 A JP2014044539 A JP 2014044539A JP 2012186038 A JP2012186038 A JP 2012186038A JP 2012186038 A JP2012186038 A JP 2012186038A JP 2014044539 A JP2014044539 A JP 2014044539A
- Authority
- JP
- Japan
- Prior art keywords
- sentence
- user
- field
- clause
- word
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Machine Translation (AREA)
- Document Processing Apparatus (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
【解決手段】 本発明は、入力された利用者IDに基づいて履歴記憶手段から得られた語と、提示した回数及び修正要求回数と、該語と入力された分野名に基づいて難易度記憶手段から得られた難易度を用いて、分野における利用者の知識の程度を算出し、入力された要約対象文の分野を決定し、分野知識推定手段に利用者IDと分野名を入力して該分野における知識の程度を取得し、該要約対象文の文節をノードとし、文末を根とする係り受け関係をエッジで表現する係り受け木を作成し、該係り受け木を枝刈りし、短縮文に相当する枝刈りされた全ての木と該分野における知識の程度を用いて期待伝達時間を算出し、該期待値伝達時間が最小となる該係り受け木に相当する短縮文を要約文とする。
【選択図】 図1
Description
過去のユーザとの対話において、該ユーザが各語を提示した回数と、該語についての修正要求回数をユーザ毎に保持する履歴記憶手段と、
語と該語が属する分野及び該語の難易度を保持する難易度記憶手段と、
入力された利用者IDに基づいて前記履歴記憶手段から得られた語と、提示した回数及び修正要求回数と、該語と入力された分野名に基づいて前記難易度記憶手段から得られた難易度を用いて、分野における利用者の知識の程度を算出する分野知識推定手段と、
入力された要約対象文の分野を決定し、前記分野知識推定手段に前記利用者IDと前記分野名を入力して該分野における知識の程度を取得し、該要約対象文の文節をノードとし、文末を根とする係り受け関係をエッジで表現する係り受け木を作成し、該係り受け木を枝刈りし、短縮文に相当する枝刈りされた全ての木と該分野における知識の程度を用いて期待伝達時間を算出し、該期待値伝達時間が最小となる該係り受け木に相当する短縮文を要約文とする文短縮手段と、を有する。
前記文短縮手段は、
前記枝刈りされた全ての木に残っている文節bを根とする部分木について、該部分木に含まれる自立語の集合qに基づいて前記標準難易度記憶手段を参照して取得した標準難易度nq、元の係り受け木において、該文節bの直下あった文節のうち、現在対象としている該部分木に存在しない文節の長さの和lend、該文節bの長さlenb、該文節bを除いた場合に根となる文節cについての伝達可能性Sc、前記利用者の知識の程度kを用いて、該文節bを根とする部分木の部分期待値伝達時間S bを算出し、該部分期待値伝達時間Sbを前記期待伝達時間とする手段を含む。
前記文短縮手段は、
前記短縮文内での各文節に係っている部分木を連結した文字列を修正要約記憶手段に格納する手段を含み、
前記要約出力手段は、
前記要約文について、ユーザより指示があった場合には、該ユーザが該要約文に対する修正と判断し、指示された文節位置に対応する修正内容で修正要約記憶手段を更新する、または、該ユーザに再出力する手段を含む。
20 履歴管理部
30 分野知識推定部
40 短縮対象文選択部
50 文短縮部
60 要約出力部
70 修正要約記憶部
80 履歴管理表
90 語−分野対応表
Claims (7)
- 提示した要約に対するユーザによる割り込み可能な対話を利用して入力された要約対象文書の要約を生成する要約生成装置であって、
過去のユーザとの対話において、該ユーザが各語を提示した回数と、該語についての修正要求回数をユーザ毎に保持する履歴記憶手段と、
語と該語が属する分野及び該語の難易度を保持する難易度記憶手段と、
入力された利用者IDに基づいて前記履歴記憶手段から得られた語と、提示した回数及び修正要求回数と、該語と入力された分野名に基づいて前記難易度記憶手段から得られた難易度を用いて、分野における利用者の知識の程度を算出する分野知識推定手段と、
入力された要約対象文の分野を決定し、前記分野知識推定手段に前記利用者IDと前記分野名を入力して該分野における知識の程度を取得し、該要約対象文の文節をノードとし、文末を根とする係り受け関係をエッジで表現する係り受け木を作成し、該係り受け木を枝刈りし、短縮文に相当する枝刈りされた全ての木と該分野における知識の程度を用いて期待伝達時間を算出し、該期待値伝達時間が最小となる該係り受け木に相当する短縮文を要約文とする文短縮手段と、
を有することを特徴とする要約生成装置。 - 自立語や該自立語の組み合わせについて、分野内での標準難易度を格納した標準難易度記憶手段を更に有し、
前記文短縮手段は、
前記枝刈りされた全ての木に残っている文節bを根とする部分木について、該部分木に含まれる自立語の集合qに基づいて前記標準難易度記憶手段を参照して取得した標準難易度nq、元の係り受け木において、該文節bの直下あった文節のうち、現在対象としている該部分木に存在しない文節の長さの和lend、該文節bの長さlenb、該文節bを除いた場合に根となる文節cについての伝達可能性Sc、前記利用者の知識の程度kを用いて、該文節bを根とする部分木の部分期待値伝達時間S bを算出し、該部分期待値伝達時間Sbを前記期待伝達時間とする手段を含む
請求項1記載の要約生成装置。 - 前記文短縮手段によって得られた前記短縮文短縮での要約文を出力する要約出力手段を更に有し、
前記文短縮手段は、
前記短縮文内での各文節に係っている部分木を連結した文字列を修正要約記憶手段に格納する手段を含み、
前記要約出力手段は、
前記要約文について、ユーザより指示があった場合には、該ユーザが該要約文に対する修正と判断し、指示された文節位置に対応する修正内容で修正要約記憶手段を更新する、または、該ユーザに再出力する手段を含む
請求項1記載の要約生成装置。 - 提示した要約に対するユーザによる割り込み可能な対話を利用して入力された要約対象文書の要約を生成する要約生成方法であって、
過去のユーザとの対話において、該ユーザが各語を提示した回数と、該語についての修正要求回数をユーザ毎に保持する履歴記憶手段
語と該語が属する分野及び該語の難易度を保持する難易度記憶手段と、
分野知識推定手段、文短縮手段を有する装置において、
前記文短縮手段が、入力された要約対象文の分野を決定する分野決定ステップと、
前記分野知識推定手段が、入力された利用者IDに基づいて前記履歴記憶手段から得られた語と、提示した回数及び修正要求回数と、該語と入力された分野名に基づいて前記難易度記憶手段から得られた難易度を用いて、分野における利用者の知識の程度を算出する
分野知識推定ステップと、
前記文短縮手段が、前記該要約対象文の文節をノードとし、文末を根とする係り受け関係をエッジで表現する係り受け木を作成し、該係り受け木を枝刈りし、短縮文に相当する枝刈りされた全ての木と前記分野における知識の程度を用いて期待伝達時間を算出し、該期待値伝達時間が最小となる該係り受け木に相当する短縮文を要約文とする文短縮ステップと、
を行うことを特徴とする要約生成方法。 - 前記装置が、自立語や該自立語の組み合わせについて、分野内での標準難易度を格納した標準難易度記憶手段を更に有し、
前記文短縮ステップにおいて、
前記枝刈りされた全ての木に残っている文節bを根とする部分木について、該部分木に含まれる自立語の集合qに基づいて前記標準難易度記憶手段を参照して取得した標準難易度nq、元の係り受け木において、該文節bの直下あった文節のうち、現在対象としている該部分木に存在しない文節の長さの和lend、該文節bの長さlenb、該文節bを除いた場合に根となる文節cについての伝達可能性Sc、前記利用者の知識の程度kを用いて、該文節bを根とする部分木の部分期待値伝達時間S bを算出し、該部分期待値伝達時間Sbを前記期待伝達時間とする
請求項4記載の要約生成方法。 - 前記装置が、要約出力手段を更に有し、
前記文短縮ステップにおいて、
前記短縮文内での各文節に係っている部分木を連結した文字列を修正要約記憶手段に格納するステップを更に行い、
前記要約出力手段が、前記文短縮ステップによって得られた前記短縮文短縮での要約文を出力するステップと、
前記要約文について、ユーザより指示があった場合には、該ユーザが該要約文に対する修正と判断し、指示された文節位置に対応する修正内容で修正要約記憶手段を更新する、または、該ユーザに再出力するステップを更に行う
請求項4記載の要約生成方法。 - コンピュータを、
請求項1乃至3のいずれか1項に記載の要約生成装置の各手段として機能させるための要約生成プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012186038A JP5810053B2 (ja) | 2012-08-27 | 2012-08-27 | 要約生成装置及び方法及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012186038A JP5810053B2 (ja) | 2012-08-27 | 2012-08-27 | 要約生成装置及び方法及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2014044539A true JP2014044539A (ja) | 2014-03-13 |
JP5810053B2 JP5810053B2 (ja) | 2015-11-11 |
Family
ID=50395765
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012186038A Expired - Fee Related JP5810053B2 (ja) | 2012-08-27 | 2012-08-27 | 要約生成装置及び方法及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5810053B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2021114184A (ja) * | 2020-01-20 | 2021-08-05 | シャープ株式会社 | 要約生成装置、要約生成方法、及びプログラム |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003281164A (ja) * | 2002-03-20 | 2003-10-03 | Fuji Xerox Co Ltd | 文書要約装置、文書要約方法、及び文書要約プログラム |
JP2004199408A (ja) * | 2002-12-18 | 2004-07-15 | Fuji Xerox Co Ltd | 文書処理方法、情報表示処理方法、情報表示処理システム、管理サーバ、クライアント端末、プログラム |
JP2010020678A (ja) * | 2008-07-14 | 2010-01-28 | Nippon Telegr & Teleph Corp <Ntt> | 文書要約装置、文書要約方法、プログラムおよび記録媒体 |
JP2010140468A (ja) * | 2008-11-12 | 2010-06-24 | Nippon Telegr & Teleph Corp <Ntt> | 文短縮装置、その方法およびプログラム |
JP2010262511A (ja) * | 2009-05-08 | 2010-11-18 | Nippon Telegr & Teleph Corp <Ntt> | テキスト要約方法、その装置およびプログラム |
-
2012
- 2012-08-27 JP JP2012186038A patent/JP5810053B2/ja not_active Expired - Fee Related
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003281164A (ja) * | 2002-03-20 | 2003-10-03 | Fuji Xerox Co Ltd | 文書要約装置、文書要約方法、及び文書要約プログラム |
JP2004199408A (ja) * | 2002-12-18 | 2004-07-15 | Fuji Xerox Co Ltd | 文書処理方法、情報表示処理方法、情報表示処理システム、管理サーバ、クライアント端末、プログラム |
JP2010020678A (ja) * | 2008-07-14 | 2010-01-28 | Nippon Telegr & Teleph Corp <Ntt> | 文書要約装置、文書要約方法、プログラムおよび記録媒体 |
JP2010140468A (ja) * | 2008-11-12 | 2010-06-24 | Nippon Telegr & Teleph Corp <Ntt> | 文短縮装置、その方法およびプログラム |
JP2010262511A (ja) * | 2009-05-08 | 2010-11-18 | Nippon Telegr & Teleph Corp <Ntt> | テキスト要約方法、その装置およびプログラム |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2021114184A (ja) * | 2020-01-20 | 2021-08-05 | シャープ株式会社 | 要約生成装置、要約生成方法、及びプログラム |
Also Published As
Publication number | Publication date |
---|---|
JP5810053B2 (ja) | 2015-11-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11615791B2 (en) | Voice application platform | |
US11790904B2 (en) | Voice application platform | |
US11450321B2 (en) | Voice application platform | |
US9251474B2 (en) | Reward based ranker array for question answer system | |
US7809552B2 (en) | Instance-based sentence boundary determination by optimization | |
US20160328467A1 (en) | Natural language question answering method and apparatus | |
US11437029B2 (en) | Voice application platform | |
WO2024182039A1 (en) | Natural language database generation and query system | |
CN110532358A (zh) | 一种面向知识库问答的模板自动生成方法 | |
JP5810053B2 (ja) | 要約生成装置及び方法及びプログラム | |
CN112470216B (zh) | 语音应用平台 | |
CN117370190A (zh) | 测试用例生成方法、装置、电子设备和存储介质 | |
CN112582073A (zh) | 医疗信息获取方法、装置、电子设备和介质 | |
JP5547254B2 (ja) | 対話的要約生成装置及び方法及びプログラム | |
JP2004348552A (ja) | 音声文書検索装置および方法およびプログラム | |
CN114519071A (zh) | 规则匹配模型的生成方法、匹配方法、系统、设备和介质 | |
JP5810052B2 (ja) | 要約生成装置及び方法及びプログラム | |
US20240242037A1 (en) | Generative text model interface system | |
US11949946B2 (en) | Dynamic insertion of supplemental audio content into audio recordings at request time | |
CN117828007B (zh) | 基于自然语言处理的建设征地移民档案管理方法及系统 | |
US20230317069A1 (en) | Context aware speech transcription | |
US20240273309A1 (en) | Text generation interface system | |
CN118585497A (zh) | 一种从文件中提取数据微调大语言模型的方法 | |
CN115422907A (zh) | 一种多维度科技项目立项查重的方法、装置和电子设备 | |
CN117150136A (zh) | 一种智能推荐的方法、系统及计算机可读存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20141020 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20150703 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20150714 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20150812 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20150908 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20150914 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5810053 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |