JP6180340B2 - 対話文生成装置、対話文生成方法およびプログラム - Google Patents
対話文生成装置、対話文生成方法およびプログラム Download PDFInfo
- Publication number
- JP6180340B2 JP6180340B2 JP2014027966A JP2014027966A JP6180340B2 JP 6180340 B2 JP6180340 B2 JP 6180340B2 JP 2014027966 A JP2014027966 A JP 2014027966A JP 2014027966 A JP2014027966 A JP 2014027966A JP 6180340 B2 JP6180340 B2 JP 6180340B2
- Authority
- JP
- Japan
- Prior art keywords
- sentence
- word
- pattern
- laplacian
- dialogue
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Description
文パターン中の適切な箇所を獲得した単語で置き換えることが可能となる。ここで、グラフラプラシアンは、対話ログコーパスより抽出した対話文に基づいて生成しているので、応答文生成に必要なデータを人手によらず、自動で生成することができる。なお、グラフラプラシアンとは、グラフの構造を正規化した行列で表現したものである。本発明では、グラフラプラシアンを用いたラプラシアンラベル伝搬を用いたことにより、初期値である特徴語から関連性の低い単語へとラベル伝搬することが起こりにくく、意味ドリフトを抑制できる。
図1は、実施の形態に係る対話文生成装置1の構成を示す図である。対話文生成装置1のハードウェアは、CPU、RAM、ROM、ハードディスク、ディスプレイ、キーボード、マウス、通信インターフェース等を備えたコンピュータである。コンピュータに、対話文生成のプログラムを実行させることにより、図1に示す対話文生成装置1が実現される。このように対話文生成装置1を実現するプログラムも本発明の範囲に含まれる。
L=I−D(A)-1/2・A・D(A)-1/2
ここで、Aは隣接行列で、A=WT・Wである。隣接行列Aは、単語どうしの共起頻度を表す行列である。D(A)は次数対角行列であり、その要素は次の式で表される。
次に、文生成部20の構成について説明する。文生成部20は、入力された対話文に対して応答する応答文を生成する。文生成部20は、文入力部21と、固有表現抽出部22と、入力文パターン判定部23と、応答文パターンシード抽出部24と、特徴語抽出部25と、ラプラシアンラベル伝搬部26と、応答文生成部27と、応答文出力部28とを有している。
ここで、文パターンのスコアベクトルを
次に、本実施の形態の対話文生成装置1の動作について説明する。
図3は、対話文生成装置1が対話文生成の事前準備の動作を示すフローチャートである。対話文生成装置1は、まず、対話ログコーパス30から対話ログを取得する(S10)。対話文生成装置1は、取得した対話ログに含まれる各文の固有表現を抽出すると共に、各文の固有表現をスロットに置き換えて、文パターンを生成する(S11)。
10 事前計算部
11 対話ログ入力部
12 固有表現抽出部
13 文パターン抽出部
14 文パターン遷移行列構築部
15 2部グラフ構築部
16 グラフラプラシアン計算部
17 文パターン遷移行列記憶部
18 グラフラプラシアン記憶部
20 文生成部
21 文入力部
22 固有表現抽出部
23 入力文パターン判定部
24 応答文パターンシード抽出部
25 特徴語抽出部
26 ラプラシアンラベル伝搬部
27 応答文生成部
28 応答文出力部
29 単語入力部
Claims (6)
- 対話ログコーパスより抽出した対話文に基づいて生成した単語と文パターンとの間の関連度から計算したグラフラプラシアンと、対話ログコーパスの文パターン間の遷移行列とを記憶した記憶部と、
文の入力を受け付ける文入力部と、
入力文から固有表現を抽出する固有表現抽出部と、
抽出した固有表現に基づいて入力文の文パターンを判定するパターン判定部と、
前記記憶部に記憶された遷移行列を読み出し、前記遷移行列を用いて入力文の文パターンに対応する応答文のパターンシードを抽出するパターンシード抽出部と、
前記固有表現抽出部にて抽出された固有表現から特徴語を抽出する特徴語抽出部と、
前記記憶部から前記グラフラプラシアンを読み出し、前記グラフラプラシアン上で、前記応答文のパターンシードと前記特徴語を初期値としてラプラシアンラベル伝搬を行い、応答文に含めるべき単語を求めるラプラシアンラベル伝搬部と、
前記応答文のパターンに前記ラプラシアンラベル伝搬部にて求めた単語を入れて応答文を生成する対話文生成部と、
前記応答文を出力する出力部と、
を備える対話文生成装置。 - 対話ログコーパスより抽出した対話文に基づいて生成した単語と文パターンとの間の関連度から計算したグラフラプラシアンを記憶した記憶部と、
単語の入力を受け付ける入力部と、
前記記憶部から前記グラフラプラシアンを読み出し、前記グラフラプラシアン上で、前記単語を初期値としてラプラシアンラベル伝搬を行い、文パターンと、文に含めるべき単語を求めるラプラシアンラベル伝搬部と、
前記ラプラシアンラベル伝搬部にて求めた文パターン及び単語を用いて対話文を生成する対話文生成部と、
前記対話文を出力する出力部と、
を備える対話文生成装置。 - 対話ログコーパスより抽出した対話文に基づいて生成した単語と文パターンとの間の関連度から計算したグラフラプラシアンと、対話ログコーパスの文パターン間の遷移行列とを記憶した記憶部とを備える対話文生成装置によって対話文を生成する方法であって、
前記対話文生成装置が、文の入力を受け付けるステップと、
前記対話文生成装置が、入力文から固有表現を抽出するステップと、
前記対話文生成装置が、抽出した固有表現に基づいて入力文の文パターンを判定するステップと、
前記対話文生成装置が、前記記憶部に記憶された遷移行列を読み出し、前記遷移行列を用いて入力文の文パターンに対応する応答文のパターンシードを抽出するステップと、
前記対話文生成装置が、入力文から抽出された固有表現から特徴語を抽出するステップと、
前記対話文生成装置が、前記記憶部から前記グラフラプラシアンを読み出し、前記グラフラプラシアン上で、前記応答文のパターンシードと前記特徴語を初期値としてラプラシアンラベル伝搬を行い、応答文に含めるべき単語を求めるステップと、
前記対話文生成装置が、前記応答文のパターンに、ラプラシアンラベル伝搬部によって求めた単語を入れて応答文を生成するステップと、
前記対話文生成装置が、前記応答文を出力するステップと、
を備える対話文生成方法。 - 対話ログコーパスより抽出した対話文に基づいて生成した単語と文パターンとの間の関連度から計算したグラフラプラシアンを記憶した記憶部を備える対話文生成装置によって、対話文を生成する方法であって、
前記対話文生成装置が、単語の入力を受け付けるステップと、
前記対話文生成装置が、前記記憶部から前記グラフラプラシアンを読み出し、前記グラフラプラシアン上で、前記単語を初期値としてラプラシアンラベル伝搬を行い、文パターンと、文に含めるべき単語を求めるステップと、
前記対話文生成装置が、求めた文パターン及び単語を用いて応答文を生成するステップと、
前記対話文生成装置が、前記応答文を出力するステップと、
を備える対話文生成方法。 - 対話ログコーパスより抽出した対話文に基づいて生成した単語と文パターンとの間の関連度から計算したグラフラプラシアンと、対話ログコーパスの文パターン間の遷移行列とを記憶した記憶部とを備えるコンピュータに、対話文を生成させるプログラムであって、前記コンピュータに、
文の入力を受け付けるステップと、
入力文から固有表現を抽出するステップと、
抽出した固有表現に基づいて入力文の文パターンを判定するステップと、
前記記憶部に記憶された遷移行列を読み出し、前記遷移行列を用いて入力文の文パターンに対応する応答文のパターンシードを抽出するステップと、
入力文から抽出された固有表現から特徴語を抽出するステップと、
前記記憶部から前記グラフラプラシアンを読み出し、前記グラフラプラシアン上で、前記応答文のパターンシードと前記特徴語を初期値としてラプラシアンラベル伝搬を行い、応答文に含めるべき単語を求めるステップと、
前記応答文のパターンに、ラプラシアンラベル伝搬部によって求めた単語を入れて応答文を生成するステップと、
前記応答文を出力するステップと、
を実行させるプログラム。 - 対話ログコーパスより抽出した対話文に基づいて生成した単語と文パターンとの間の関連度から計算したグラフラプラシアンを記憶した記憶部を備えるコンピュータに、対話文を生成させるプログラムであって、
単語の入力を受け付けるステップと、
前記記憶部から前記グラフラプラシアンを読み出し、前記グラフラプラシアン上で、前記単語を初期値としてラプラシアンラベル伝搬を行い、文パターンと、文に含めるべき単語を求めるステップと、
求めた文パターン及び単語を用いて応答文を生成するステップと、
前記応答文を出力するステップと、
を実行させるプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014027966A JP6180340B2 (ja) | 2014-02-17 | 2014-02-17 | 対話文生成装置、対話文生成方法およびプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014027966A JP6180340B2 (ja) | 2014-02-17 | 2014-02-17 | 対話文生成装置、対話文生成方法およびプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2015153261A JP2015153261A (ja) | 2015-08-24 |
JP6180340B2 true JP6180340B2 (ja) | 2017-08-16 |
Family
ID=53895405
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014027966A Expired - Fee Related JP6180340B2 (ja) | 2014-02-17 | 2014-02-17 | 対話文生成装置、対話文生成方法およびプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6180340B2 (ja) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6843689B2 (ja) * | 2017-04-21 | 2021-03-17 | Kddi株式会社 | コンテキストに応じた対話シナリオを生成する装置、プログラム及び方法 |
JP6920104B2 (ja) * | 2017-05-16 | 2021-08-18 | 日本放送協会 | 原稿自動生成装置及びプログラム |
JP6821542B2 (ja) * | 2017-11-09 | 2021-01-27 | Kddi株式会社 | 複数種の対話を続けて実施可能な対話制御装置、プログラム及び方法 |
CN112597748B (zh) * | 2020-12-18 | 2023-08-11 | 深圳赛安特技术服务有限公司 | 语料生成方法、装置、设备及计算机可读存储介质 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008293098A (ja) * | 2007-05-22 | 2008-12-04 | Toyota Central R&D Labs Inc | 応答スコア情報生成装置、対話処理装置 |
WO2013080406A1 (ja) * | 2011-11-28 | 2013-06-06 | Necソフト株式会社 | 対話システム、冗長メッセージ排除方法および冗長メッセージ排除プログラム |
-
2014
- 2014-02-17 JP JP2014027966A patent/JP6180340B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2015153261A (ja) | 2015-08-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113962315B (zh) | 模型预训练方法、装置、设备、存储介质以及程序产品 | |
CN109670191B (zh) | 机器翻译的校准优化方法、装置与电子设备 | |
JP5540335B2 (ja) | 自然言語文生成装置及びコンピュータプログラム | |
JP6180340B2 (ja) | 対話文生成装置、対話文生成方法およびプログラム | |
CN111462751B (zh) | 解码语音数据的方法、装置、计算机设备和存储介质 | |
JP5441937B2 (ja) | 言語モデル学習装置、言語モデル学習方法、言語解析装置、及びプログラム | |
JP2016224483A (ja) | モデル学習装置、方法、及びプログラム | |
US10354646B2 (en) | Bilingual corpus update method, bilingual corpus update apparatus, and recording medium storing bilingual corpus update program | |
JP2019082860A (ja) | 生成プログラム、生成方法及び生成装置 | |
CN111488735A (zh) | 测试语料生成方法、装置及电子设备 | |
CN110765762A (zh) | 一种大数据背景下在线评论文本最佳主题提取系统和方法 | |
JP4499003B2 (ja) | 情報処理方法及び装置及びプログラム | |
CN115408997A (zh) | 一种文本生成方法、文本生成装置和可读存储介质 | |
JP6558856B2 (ja) | 形態素解析装置、モデル学習装置、及びプログラム | |
Vu et al. | Building a vietnamese sentiwordnet using vietnamese electronic dictionary and string kernel | |
JP5718406B2 (ja) | 発話文生成装置、対話装置、発話文生成方法、対話方法、発話文生成プログラム、及び対話プログラム | |
JP2007317132A (ja) | 概念ベクトル推定方法及び装置及びプログラム | |
JP5807966B2 (ja) | 文書評価学習装置、文書評価装置、方法、及びプログラム | |
CN112307181A (zh) | 基于特定语料库的提取语料的方法及语料提取器 | |
JP4592556B2 (ja) | 文書検索装置、文書検索方法および文書検索プログラム | |
JPWO2021038827A5 (ja) | ||
JP5860439B2 (ja) | 言語モデル作成装置とその方法、そのプログラムと記録媒体 | |
US20240086768A1 (en) | Learning device, inference device, non-transitory computer-readable medium, learning method, and inference method | |
JP7198492B2 (ja) | パーソナリティ出力装置、パーソナリティ出力方法、パーソナリティ出力プログラム、単語評価値生成装置、単語評価値生成方法および単語評価値生成プログラム | |
Ngoc et al. | Multi-dimensional data refining strategy for effective fine-tuning LLMs |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20151113 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20160720 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20170512 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20170704 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20170718 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6180340 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |