JP5728374B2 - 対話要約システムおよび対話要約プログラム - Google Patents
対話要約システムおよび対話要約プログラム Download PDFInfo
- Publication number
- JP5728374B2 JP5728374B2 JP2011268573A JP2011268573A JP5728374B2 JP 5728374 B2 JP5728374 B2 JP 5728374B2 JP 2011268573 A JP2011268573 A JP 2011268573A JP 2011268573 A JP2011268573 A JP 2011268573A JP 5728374 B2 JP5728374 B2 JP 5728374B2
- Authority
- JP
- Japan
- Prior art keywords
- score
- block
- dialog
- statement
- dialogue
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Document Processing Apparatus (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Machine Translation (AREA)
Description
図1は、本発明の一実施の形態である対話要約システムの構成例について概要を示した図である。対話要約システム1は、例えば、PC(Personal Computer)やサーバ機器などの情報処理装置からなり、対話内容をテキスト化したデータである対話データ21を入力として、重要文を抽出し、当該重要文からなる要約データ15を生成・出力するシステムである。ここで、対話データ21は、例えば、顧客とオペレータとの対話内容を録音した音声データから、公知の音声認識技術を利用した音声認識エンジン2などにより生成されたものである。
図3は、対話要約システム1における要約データ15を生成する処理の流れの例について概要を示したフローチャートである。対話要約システム1は、処理を開始すると、まず、テキスト化された対話データ21を入力し、対話構造解析部11により、対話構造の解析を行う(S01)。ここでは、上述したように、対話データ21内の各ステートメントをブロックにまとめ、また、各ステートメントについて形態素解析を行って単語に分割し、必要に応じて他の解析処理を行う。次に、スコアリング部12により、各ステートメントについて重要度を示すスコアを算出する(S02)。ここでは、上述したように、例えば、ステートメント内の各単語について算出したTF−IDF値の合計により各ステートメントについてのスコアを算出する。
以下では、対話データ21から重要度のスコアを伝搬させることによって重要文を抽出する手法における具体的な処理の例について、コールセンター業務におけるオペレータと顧客との対話を例として説明する。図4は、オペレータと顧客との対話についての対話構造データ14の例を示した図である。ここでは、対話データ21について対話構造解析部11による対話構造の解析およびスコアリング部12による重要度のスコアリングを行った結果を、話者毎にステートメント単位で時系列に並べた状態を示している。
11…対話構造解析部、12…スコアリング部、13…重要文抽出部、14…対話構造データ、15…要約データ、21…対話データ。
Claims (11)
- 対話内容から1つ以上の重要文を抽出して、前記重要文からなる要約データを生成する対話要約システムであって、
対話内容における各ステートメントの情報、および各ステートメントについての重要度を示すスコアの情報と、話者毎の連続したステートメントを単位とするブロックの情報とを有する対話構造データに基づいて、
所定の要約条件を満たすまで、前記スコアが最も高いステートメントを前記重要文として前記対話構造データから抽出し、前記重要文を抽出した第1のブロック、および前記第1のブロックの直前と直後もしくは前記第1のブロックの直前と直後および2つ前と2つ後の第2のブロックに対して所定のスコアを割り当て、さらに前記第1および第2のブロックに含まれる各ステートメントの前記スコアに対して前記所定のスコアを所定の条件に従って割り当てて加算する重要文抽出部を有することを特徴とする対話要約システム。 - 請求項1に記載の対話要約システムにおいて、
前記重要文抽出部は、
前記第1および第2のブロックに対して割り当てる前記所定のスコアを、前記重要文の前記スコアに対する所定の割合の値とすることを特徴とする対話要約システム。 - 請求項1または2に記載の対話要約システムにおいて、
前記重要文抽出部は、
前記第1のブロックの話者の情報に応じて、前記第2のブロックとなるブロックを異ならせることを特徴とする対話要約システム。 - 請求項3に記載の対話要約システムにおいて、
前記対話内容が、質問者もしくは相談者と回答者との間の対話である場合に、
前記重要文抽出部は、
前記第1のブロックの話者が前記回答者である場合は、前記第1のブロックの直前および直後の、前記質問者もしくは相談者が話者であるブロックをそれぞれ前記第2のブロックとし、
前記第1のブロックの話者が前記質問者もしくは相談者である場合は、前記第1のブロックの直後の、前記回答者が話者であるブロックを前記第2のブロックとすることを特徴とする対話要約システム。 - 請求項4に記載の対話要約システムにおいて、
前記重要文抽出部は、
前記第1のブロックの話者が前記回答者である場合は、前記第1のブロックに前記重要文の前記スコアの1/2を割り当て、前記各第2のブロックにそれぞれ前記重要文の前記スコアの1/4を割り当て、
前記第1のブロックの話者が前記質問者もしくは相談者である場合は、前記第1のブロックに前記重要文の前記スコアの1/2を割り当て、前記第2のブロックに前記重要文の前記スコアの1/2を割り当てることを特徴とする対話要約システム。 - 請求項1〜5のいずれか1項に記載の対話要約システムにおいて、
前記重要文抽出部は、
前記第1および第2のブロックに含まれる各ステートメントの前記スコアに対して前記所定のスコアを割り当てて加算する際に、各ステートメントの前記スコアの値に応じて前記所定のスコアを按分して割り当てることを特徴とする対話要約システム。 - 請求項1〜6のいずれか1項に記載の対話要約システムにおいて、
前記重要文抽出部は、
前記第1および第2のブロックに含まれる各ステートメントの前記スコアに対して前記所定のスコアを割り当てて加算する際に、既に前記重要文として抽出されているステートメントに対しては割り当てないことを特徴とする対話要約システム。 - 請求項1〜7のいずれか1項に記載の対話要約システムにおいて、
前記対話構造データから抽出する最初の前記重要文をユーザからの指定に基づいて選択することを特徴とする対話要約システム。 - 請求項1〜8のいずれか1項に記載の対話要約システムにおいて、
さらに、対話内容をテキスト化した対話データを入力として、前記対話データをステートメントに分割して話者を判別し、話者毎の連続したステートメントを単位とするブロックにまとめて前記対話構造データに保持する対話構造解析部と、
前記対話構造データに保持された各ステートメントについて、所定の手法により前記スコアを算出して前記対話構造データに保持するスコアリング部とを有することを特徴とする対話要約システム。 - 請求項9に記載の対話要約システムにおいて、
前記対話構造解析部は、前記対話構造データに保持された各ステートメントについて、形態素解析を行って単語に分割し、
前記スコアリング部は、前記対話構造データに保持された各ステートメントについて、単語毎に前記対話構造データにおけるTF−IDF値を算出して、各単語の前記TF−IDF値の合計を各ステートメントの前記スコアとすることを特徴とする対話要約システム。 - 対話内容から1つ以上の重要文を抽出して、前記重要文からなる要約データを生成する対話要約システムとしてコンピュータを動作させる対話要約プログラムであって、
対話内容における各ステートメントの情報、および各ステートメントについての重要度を示すスコアの情報と、話者毎の連続したステートメントを単位とするブロックの情報とを有する対話構造データに基づいて、
所定の要約条件を満たすまで、前記スコアが最も高いステートメントを前記重要文として前記対話構造データから抽出し、前記重要文を抽出した第1のブロック、および前記第1のブロックの直前と直後もしくは前記第1のブロックの直前と直後および2つ前と2つ後の第2のブロックに対して所定のスコアを割り当て、さらに前記第1および第2のブロックに含まれる各ステートメントの前記スコアに対して前記所定のスコアを所定の条件に従って割り当てて加算する重要文抽出処理を実行することを特徴とする対話要約プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011268573A JP5728374B2 (ja) | 2011-12-08 | 2011-12-08 | 対話要約システムおよび対話要約プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011268573A JP5728374B2 (ja) | 2011-12-08 | 2011-12-08 | 対話要約システムおよび対話要約プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2013120514A JP2013120514A (ja) | 2013-06-17 |
JP5728374B2 true JP5728374B2 (ja) | 2015-06-03 |
Family
ID=48773123
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011268573A Active JP5728374B2 (ja) | 2011-12-08 | 2011-12-08 | 対話要約システムおよび対話要約プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5728374B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11115359B2 (en) | 2016-11-03 | 2021-09-07 | Samsung Electronics Co., Ltd. | Method and apparatus for importance filtering a plurality of messages |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6524008B2 (ja) * | 2016-03-23 | 2019-06-05 | 株式会社東芝 | 情報処理装置、情報処理方法およびプログラム |
US20210182342A1 (en) * | 2018-08-15 | 2021-06-17 | Nippon Telegraph And Telephone Corporation | Major point extraction device, major point extraction method, and non-transitory computer readable recording medium |
CN111178067B (zh) * | 2019-12-19 | 2023-05-26 | 北京明略软件系统有限公司 | 信息获取模型生成方法、装置及信息获取方法、装置 |
CN111400489B (zh) * | 2020-04-08 | 2022-12-02 | 科大讯飞股份有限公司 | 对话文本摘要生成方法、装置、电子设备和存储介质 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH10301956A (ja) * | 1997-04-30 | 1998-11-13 | Ricoh Co Ltd | キーセンテンス抽出方式及び抄録方式及び文書表示方式 |
JP2004334382A (ja) * | 2003-05-02 | 2004-11-25 | Ricoh Co Ltd | 構造化文書要約装置、プログラムおよび記録媒体 |
-
2011
- 2011-12-08 JP JP2011268573A patent/JP5728374B2/ja active Active
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11115359B2 (en) | 2016-11-03 | 2021-09-07 | Samsung Electronics Co., Ltd. | Method and apparatus for importance filtering a plurality of messages |
Also Published As
Publication number | Publication date |
---|---|
JP2013120514A (ja) | 2013-06-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10824814B2 (en) | Generalized phrases in automatic speech recognition systems | |
JP6998680B2 (ja) | 対話型業務支援システムおよび対話型業務支援プログラム | |
JP7042693B2 (ja) | 対話型業務支援システム | |
US10347250B2 (en) | Utterance presentation device, utterance presentation method, and computer program product | |
JP5774459B2 (ja) | 談話要約テンプレート作成システムおよび談話要約テンプレート作成プログラム | |
JP5728374B2 (ja) | 対話要約システムおよび対話要約プログラム | |
US10860566B1 (en) | Themes surfacing for communication data analysis | |
WO2006085661A1 (ja) | 質問応答データ編集装置、質問応答データ編集方法、質問応答データ編集プログラム | |
CN116324792A (zh) | 与通过从自然语言会话挖掘意图来进行机器人创作相关的系统和方法 | |
Nedoluzhko et al. | ELITR minuting corpus: A novel dataset for automatic minuting from multi-party meetings in English and Czech | |
JP2013025648A (ja) | 対話装置、対話方法および対話プログラム | |
JP2021022211A (ja) | 問合せ対応支援装置、問合せ対応支援方法、プログラム及び記録媒体 | |
JP5574842B2 (ja) | Faq候補抽出システムおよびfaq候補抽出プログラム | |
JP2014219872A (ja) | 発話選択装置、方法、及びプログラム、対話装置及び方法 | |
CN117441165A (zh) | 减少生成语言模型的偏差 | |
JP2019008367A (ja) | 質問単語重み算出装置、質問回答検索装置、質問単語重み算出方法、質問回答検索方法、プログラム、及び記憶媒体 | |
JP2017027233A (ja) | 質問文生成装置、方法、及びプログラム | |
US20160034509A1 (en) | 3d analytics | |
JP7126865B2 (ja) | 対話型業務支援システム | |
CN111949777A (zh) | 一种基于人群分类的智能语音对话方法、装置及电子设备 | |
WO2020205817A1 (en) | Systems and methods for generating responses for an intelligent virtual assistant | |
JP6567128B1 (ja) | 会話支援システムおよび会話支援方法 | |
JP2011123565A (ja) | Faq候補抽出システムおよびfaq候補抽出プログラム | |
JP2019087123A (ja) | 複数種の対話を続けて実施可能な対話制御装置、プログラム及び方法 | |
JP6536580B2 (ja) | 文集合抽出システム、方法およびプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20140206 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20140717 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20140729 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20141007 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20141105 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20150324 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20150406 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5728374 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |