JP5341732B2 - 談話要約生成システムおよび談話要約生成プログラム - Google Patents
談話要約生成システムおよび談話要約生成プログラム Download PDFInfo
- Publication number
- JP5341732B2 JP5341732B2 JP2009271782A JP2009271782A JP5341732B2 JP 5341732 B2 JP5341732 B2 JP 5341732B2 JP 2009271782 A JP2009271782 A JP 2009271782A JP 2009271782 A JP2009271782 A JP 2009271782A JP 5341732 B2 JP5341732 B2 JP 5341732B2
- Authority
- JP
- Japan
- Prior art keywords
- discourse
- statement
- content
- data
- topic
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Machine Translation (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
図2は、本発明の一実施の形態における談話構造解析システムの構成例の概要について示したブロック図である。談話構造解析システム2は、サーバやPC(Personal Computer)等のコンピュータシステムによって構成され、例えば、ソフトウェアプログラムによって実装される前処理部10、フロー解析部20、形態素解析部30、固有表現解析部40、結束性解析部50の各部と、フロー解析ルール22、および固有表現解析ルール42の各テーブルを有し、音声認識エンジン3によって談話の内容がテキスト化された談話データ100を入力として、談話構造の解析を行って談話セマンティクス200を出力する。
図1は、本発明の一実施の形態である談話要約生成システムの構成例の概要について示したブロック図である。談話要約生成システム1は、談話構造解析システム2と同様に、サーバやPC等のコンピュータシステムによって構成され、例えば、ソフトウェアプログラムによって実装される話題解析部60および談話要約部70の各部と、話題解析ルール62、マッピングルール72、言い換えルール73および要約テンプレート74の各テーブルやデータを有し、談話の内容がテキスト化された談話データ101と、談話データ101についての談話構造の解析結果である談話セマンティクス200とを入力として、談話データ101についての要約300を生成して出力する。
以下では、図2に示した談話構造解析システム2のフロー解析部20によるフロー解析の処理の詳細について説明する。図4は、談話データ100におけるフローとコンテキストの例について示した図である。本実施の形態では、コンテキストは談話の各ブロックに対して設定される。図4の例では、最初のブロック(話者:オペレータ)のコンテキストは“開始”であり、次のブロック(話者:顧客)およびその次のブロック(話者:オペレータ)はともに“陳述”となっている。
以下では、図2に示した談話構造解析システム2の固有表現解析部40による固有表現解析の処理の詳細について説明する。図7は、談話構造解析システム2の固有表現解析ルール42の例について示した図である。固有表現解析ルール42は、ファイルやデータベース等に保持されており、ステートメント中の固有表現を特定するための正規表現と、当該正規表現とマッチする部分から固有表現を特定して抽出するための規則(以下では「固有表現規則」と記載する場合がある)との対応について予め指定したリストを保持するテーブルである。
以下では、図2に示した談話構造解析システム2の結束性解析部50による結束性解析の処理の詳細について説明する。図9は、談話構造解析システム2での結束性解析の例について示した図である。結束性解析処理では、まず、上段の図に示すように、談話データ100における全てのブロックを1つのセグメントとして設定する。
以下では、図1に示した談話要約生成システム1の話題解析部60による話題解析の処理の詳細について説明する。話題解析の処理は、上述した談話構造解析システム2の固有表現解析部40における固有表現解析の処理と同様である。すなわち、図7に示した固有表現解析ルール42と同様の構成のデータ(指定内容は異なる)を有する話題解析ルール62を有し、談話データ101のステートメント中の話題を示すと推測される文字列を、話題解析ルール62に指定された、形態素情報31の形態素列の表現も考慮した正規表現によって特定する。従って、話題解析ルール62の内容や話題解析部60での処理の流れの詳細についての説明は省略する。
以下では、図1に示した談話要約生成システム1の談話要約部70による談話要約の処理の詳細について説明する。図11は、談話要約生成システム1での談話要約の例について示した図である。図11の上段は、談話データ101についての談話構造解析の結果の例を示しており、談話データ101の各ステートメントに対して、談話セマンティクス200の各情報と話題情報61の内容(図11の例では、各ステートメントのフロー、および“企業名”や“人名”などの固有表現と話題)を示している。
10…前処理部、
20…フロー解析部、21…フロー情報、22…フロー解析ルール、
30…形態素解析部、31…形態素情報
40…固有表現解析部、41…固有表現情報、42…固有表現解析ルール、
50…結束性解析部、51…結束性情報、
60…話題解析部、61…話題情報、62…話題解析ルール、
70…談話要約部、72…マッピングルール、73…言い換えルール、74…要約テンプレート、
100、101…談話データ、200…談話セマンティクス、300…要約。
Claims (8)
- 音声認識処理によって談話の内容がテキスト化された談話データ、および前記談話データにおける前記談話の構造の解析結果である、前記談話全体の意味内容を把握するための情報である談話セマンティクスを入力とし、前記談話についての要約を生成して出力する談話要約生成システムであって、
前記談話セマンティクスは、前記談話データにおける各ステートメントの意味内容を示すフローの情報を含むフロー情報と、前記各ステートメントを形態素に分割して品詞を判別した形態素列の情報を含む形態素情報と、前記各ステートメントにおいて特定された前記談話データにおける固有表現のリストを含む固有表現情報とを含み、
前記要約の項目および記載内容を規定し、前記記載内容の一部または全部をプレースホルダとして指定した要約テンプレートと、
前記プレースホルダを置換する、前記談話データにおける対応する内容を、前記談話セマンティクスに基づいて特定するためのルールを指定したマッピングルールと、
前記要約テンプレートの前記各プレースホルダに対して、前記マッピングルールの指定内容に従って、前記談話データにおける対応する内容の文字列を取得して、前記プレースホルダを前記文字列によって置換して、前記要約を生成して出力する談話要約部と、
前記談話データにおける前記各ステートメント中の話題を特定するための、前記形態素の情報を考慮した正規表現と、前記正規表現とマッチする部分の前記形態素列から前記話題を特定して抽出するための規則との対応のリストからなる話題解析ルールと、
前記談話データにおける前記各ステートメントに対して、前記話題解析ルールにおける前記正規表現とのマッチングを行い、マッチした前記正規表現における前記規則に基づいて、対応する前記形態素列を抽出して前記話題として特定し、前記各ステートメントと前記各ステートメントにおいて特定された前記話題のリストとの対応からなる話題情報を出力する話題解析部とを有し、
前記マッピングルールは、前記各プレースホルダを置換する内容を特定するための条件として、前記談話セマンティクスおよび前記話題情報の内容に基づいて、前記プレースホルダを置換する内容を含む前記ステートメントを特定するための前記フローの指定を含む条件、および特定された前記ステートメントにおける前記プレースホルダを置換する内容とする前記固有表現もしくは前記話題もしくは前記ステートメントの内容の指定を有することを特徴とする談話要約生成システム。 - 請求項1に記載の談話要約生成システムにおいて、
さらに、前記要約テンプレートの前記各プレースホルダを前記談話データにおける対応する内容の文字列によって置換する際に、前記プレースホルダ毎に所定の表現を前記要約のための表現に言い換えるためのルールを指定した言い換えルールを有し、
前記談話要約部は、前記マッピングルールの指定内容に従って、前記談話データにおける対応する内容の文字列を取得し、前記言い換えルールに従って表現を変換して、変換した文字列によって前記プレースホルダを置換することを特徴とする談話要約生成システム。 - 請求項1または2に記載の談話要約生成システムにおいて、
前記談話セマンティクスは、さらに、前記談話データを内容の切り替わりが推測される単位で分割したセグメントの情報を含む結束性情報を有し、
前記談話要約部は、前記セグメント毎に、前記セグメントに属する各ステートメントに基づいて前記要約を生成することを特徴とする談話要約生成システム。 - 請求項1〜3のいずれか1項に記載の談話要約生成システムにおいて、
前記談話要約部は、前記要約テンプレートの前記各プレースホルダに対して、置換するための文字列として、前記談話データもしくは前記談話データの前記セグメントにおける前記話題の内容を取得する際に、対象の前記話題が複数ある場合は、対象の前記話題毎に前記要約を生成し、生成した前記各要約をユーザに提示して前記ユーザによる取捨選択を可能とすることを特徴とする談話要約生成システム。 - 音声認識処理によって談話の内容がテキスト化された談話データ、および前記談話データにおける前記談話の構造の解析結果である、前記談話全体の意味内容を把握するための情報である談話セマンティクスを入力とし、前記談話についての要約を生成して出力する談話要約生成システムとしてコンピュータを機能させる談話要約生成プログラムであって、
前記談話セマンティクスは、前記談話データにおける各ステートメントの意味内容を示すフローの情報を含むフロー情報と、前記各ステートメントを形態素に分割して品詞を判別した形態素列の情報を含む形態素情報と、前記各ステートメントにおいて特定された前記談話データにおける固有表現のリストを含む固有表現情報とを含み、
前記要約の項目および記載内容を規定し、前記記載内容の部分をプレースホルダとして指定した要約テンプレートと、
前記プレースホルダを置換する前記談話データにおける対応する内容を、前記談話セマンティクスに基づいて特定するためのルールを指定したマッピングルールと、
前記要約テンプレートの前記各プレースホルダに対して、前記マッピングルールの指定内容に従って、前記談話データにおける対応する内容の文字列を取得して、前記プレースホルダを前記文字列によって置換して、前記要約を生成して出力する談話要約部と、
前記談話データにおける前記各ステートメント中の話題を特定するための、前記形態素の情報を考慮した正規表現と、前記正規表現とマッチする部分の前記形態素列から前記話題を特定して抽出するための規則との対応のリストからなる話題解析ルールと、
前記談話データにおける前記各ステートメントに対して、前記話題解析ルールにおける前記正規表現とのマッチングを行い、マッチした前記正規表現における前記規則に基づいて、対応する前記形態素列を抽出して前記話題として特定し、前記各ステートメントと前記各ステートメントにおいて特定された前記話題のリストとの対応からなる話題情報を出力する話題解析部とを有し、
前記マッピングルールは、前記各プレースホルダを置換する内容を特定するための条件として、前記談話セマンティクスおよび前記話題情報の内容に基づいて、前記プレースホルダを置換する内容を含む前記ステートメントを特定するための前記フローの指定を含む条件、および特定された前記ステートメントにおける前記プレースホルダを置換する内容とする前記固有表現もしくは前記話題もしくは前記ステートメントの内容の指定を有することを特徴とする談話要約生成プログラム。 - 請求項5に記載の談話要約生成プログラムにおいて、
さらに、前記要約テンプレートの前記各プレースホルダを前記談話データにおける対応する内容の文字列によって置換する際に、前記プレースホルダ毎に所定の表現を前記要約のための表現に言い換えるためのルールを指定した言い換えルールを有し、
前記談話要約部は、前記マッピングルールの指定内容に従って、前記談話データにおける対応する内容の文字列を取得し、前記言い換えルールに従って表現を変換して、変換した文字列によって前記プレースホルダを置換することを特徴とする談話要約生成プログラム。 - 請求項5または6に記載の談話要約生成プログラムにおいて、
前記談話セマンティクスは、さらに、前記談話データを内容の切り替わりが推測される単位で分割したセグメントの情報を含む結束性情報を有し、
前記談話要約部は、前記セグメント毎に、前記セグメントに属する各ステートメントに基づいて前記要約を生成することを特徴とする談話要約生成プログラム。 - 請求項5〜7のいずれか1項に記載の談話要約生成プログラムにおいて、
前記談話要約部は、前記要約テンプレートの前記各プレースホルダに対して、置換するための文字列として、前記談話データもしくは前記談話データの前記セグメントにおける前記話題の内容を取得する際に、対象の前記話題が複数ある場合は、対象の前記話題毎に前記要約を生成し、生成した前記各要約をユーザに提示して前記ユーザによる取捨選択を可能とすることを特徴とする談話要約生成プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009271782A JP5341732B2 (ja) | 2009-11-30 | 2009-11-30 | 談話要約生成システムおよび談話要約生成プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009271782A JP5341732B2 (ja) | 2009-11-30 | 2009-11-30 | 談話要約生成システムおよび談話要約生成プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2011113490A JP2011113490A (ja) | 2011-06-09 |
JP5341732B2 true JP5341732B2 (ja) | 2013-11-13 |
Family
ID=44235746
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009271782A Expired - Fee Related JP5341732B2 (ja) | 2009-11-30 | 2009-11-30 | 談話要約生成システムおよび談話要約生成プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5341732B2 (ja) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5774459B2 (ja) * | 2011-12-08 | 2015-09-09 | 株式会社野村総合研究所 | 談話要約テンプレート作成システムおよび談話要約テンプレート作成プログラム |
JP6622165B2 (ja) * | 2016-09-16 | 2019-12-18 | 株式会社東芝 | 対話ログ分析装置、対話ログ分析方法およびプログラム |
JP7024533B2 (ja) * | 2018-03-20 | 2022-02-24 | 日本電気株式会社 | 検出パターン評価モデル生成システム、方法およびプログラム |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3614055B2 (ja) * | 1999-05-28 | 2005-01-26 | 日本電信電話株式会社 | 要約文作成方法及び装置及び要約文作成プログラムを格納した記憶媒体 |
US7610190B2 (en) * | 2003-10-15 | 2009-10-27 | Fuji Xerox Co., Ltd. | Systems and methods for hybrid text summarization |
WO2007113903A1 (ja) * | 2006-04-04 | 2007-10-11 | Fujitsu Limited | 要約文書作成プログラム、要約文書作成装置、要約文書作成方法及びコンピュータ読み取り可能記録媒体 |
-
2009
- 2009-11-30 JP JP2009271782A patent/JP5341732B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2011113490A (ja) | 2011-06-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5774459B2 (ja) | 談話要約テンプレート作成システムおよび談話要約テンプレート作成プログラム | |
JP5468474B2 (ja) | トークスクリプト利用状況算出システムおよびトークスクリプト利用状況算出プログラム | |
US9236047B2 (en) | Voice stream augmented note taking | |
CN100424632C (zh) | 用于高级交互接口的语义对象同步理解 | |
CN102176310B (zh) | 具有巨大词汇量的语音识别系统 | |
CN108364632B (zh) | 一种具备情感的中文文本人声合成方法 | |
Gardner-Bonneau et al. | Human factors and voice interactive systems | |
US20080077869A1 (en) | Conference supporting apparatus, method, and computer program product | |
JP2019207648A (ja) | 対話型業務支援システム | |
JP2013167985A (ja) | 談話要約生成システムおよび談話要約生成プログラム | |
JP5574842B2 (ja) | Faq候補抽出システムおよびfaq候補抽出プログラム | |
JP5495967B2 (ja) | 談話要約生成システムおよび談話要約生成プログラム | |
WO2009107441A1 (ja) | 音声合成装置、テキスト生成装置およびその方法並びにプログラム | |
JP5495968B2 (ja) | 談話構造解析システムおよび談話構造解析プログラム | |
JP5341732B2 (ja) | 談話要約生成システムおよび談話要約生成プログラム | |
Dutrey et al. | A CRF-based approach to automatic disfluency detection in a French call-centre corpus. | |
JP2011123565A (ja) | Faq候補抽出システムおよびfaq候補抽出プログラム | |
JP5457284B2 (ja) | 談話内訳算出システムおよび談話内訳算出プログラム | |
JP5856198B2 (ja) | 談話要約生成システムおよび談話要約生成プログラム | |
JP2006236037A (ja) | 音声対話コンテンツ作成方法、装置、プログラム、記録媒体 | |
JP6639431B2 (ja) | 用件判定装置、要約文表示装置、用件判定方法、要約文表示方法、及びプログラム | |
JP2017167433A (ja) | サマリ生成装置、サマリ生成方法及びサマリ生成プログラム | |
JP5633318B2 (ja) | 文生成装置及びプログラム | |
Whetten et al. | Evaluating Automatic Speech Recognition and Natural Language Understanding in an Incremental Setting | |
JP7211384B2 (ja) | 音声認識装置、個人識別方法および個人識別プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20120110 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20130527 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130604 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130711 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130730 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130808 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5341732 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |