JP2020173608A - 対話行為推定装置、対話行為推定方法、対話行為推定モデル学習装置及びプログラム - Google Patents
対話行為推定装置、対話行為推定方法、対話行為推定モデル学習装置及びプログラム Download PDFInfo
- Publication number
- JP2020173608A JP2020173608A JP2019075055A JP2019075055A JP2020173608A JP 2020173608 A JP2020173608 A JP 2020173608A JP 2019075055 A JP2019075055 A JP 2019075055A JP 2019075055 A JP2019075055 A JP 2019075055A JP 2020173608 A JP2020173608 A JP 2020173608A
- Authority
- JP
- Japan
- Prior art keywords
- utterance
- utterance sentence
- sentence
- feature amount
- dialogue action
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
- G06F40/35—Discourse or dialogue representation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/284—Lexical analysis, e.g. tokenisation or collocates
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
- G06F40/216—Parsing using statistical methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Machine Translation (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
図1及び図2を参照して、本発明の実施の形態に係る対話行為推定モデル学習装置100の構成について説明する。図1は、本発明の実施の形態に係る対話行為推定モデル学習装置100として機能するコンピュータの概略構成を示すブロック図である。図2は、本発明の実施の形態に係る対話行為推定モデル学習装置100の構成を示すブロック図である。
(例1)第2発話文:「こんにちは、何か聞きたいことはありますか?」、第1発話文:「今契約しているサービスについて聞きたいのですが。」、及び第1発話文の対話行為タイプ:「Question:III」、
(例2)第2発話文:「こんにちは、何か聞きたいことはありますか?」、第1発話文:「あなたの名前はなあに?」、第1発話文の対話行為タイプ:「Question:II」
が挙げられる。
<<5−gram>>
BOS−今
BOS−今−契約
BOS−今−契約−し
BOS−今−契約−し−て
今−契約−し−て−い
…(中略)…
た−い−の−です−が
い−の−です−が−EOS
の−です−が−EOS
です−が−EOS
(1)発話主要文節の主辞の品詞が「形容詞語幹」、「動詞語幹」、「名詞:動作」、「名詞:形容」の場合、該当する品詞を「MPOS_」と結合して特徴量とする。
(2)発話文がただ一つの文節しかもたない場合、「ONLY」を特徴量とする。
(3)発話主要文節の主辞より後に出現する機能語を抽出し、下記(3−A)、(3−B)に該当する情報があればテンス情報(過去)、モダリティ情報(願望・意志・命令・禁止・疑問等)の特徴量として抽出する。
(3−A)テンス情報の抽出
述語の後ろに品詞に「接尾辞:終止」を含む形態素表記「た」が存在する場合、「PAST_T」を出力する。
(3−B)モダリティ情報の抽出
・『願望』:述語の後ろに、終止形が「たい」となる形態素が存在すれば「MOD_WNT」を出力する。
・『命令』:動詞が「しろ」、「帰れ」のような命令形であれば「MOD_IMP」を出力する。
・『禁止』:述語が動詞の基本形で、その直後に「な」が存在すれば「MOD_FBD」を出力する。
・『疑問』:文節の末尾形態素が「?」もしくは疑問を表す終助詞「か」、疑問詞「何」「どこ」「誰」等の場合、「MOD_Q」を出力する。
・『依頼』:述語が動詞で、直後の形態素表記が「て」の場合、下記リストに含まれるいずれかの表記が後続するか、又は後続する表記が何も存在しない場合は「MOD_REQ」を出力する。
[リスト]:「くれ」、「ください」、「いただく」、「ちょうだい」、「もらう」、「ほしい」、「もらいたい」
格表記の前に出現する名詞相当(品詞が名詞、もしくは未知語)の連続を項の表記として抽出し、以下の(A)〜(E)の処理を実施する。
(A)項の表記が「あなた」「お前」「てめえ」「あんた」等の第2者を表す場合、「II_格表記」を発話対象特徴量とする。なお、「格表記」は、該当する表記に置き換えられる。
(B)項の表記が「わたし」「私」「俺」「オレ」等の第1者を表す場合、「I_格表記」を発話対象特徴量とする。
(C)項の表記が上記以外の場合、対象の項に「の」を伴って係る項がある場合、その項について上記(A)(B)を適用する。適用されない場合は「III_格表記」を発話対象特徴量として抽出する。例えば、例1:「サービスについて」→「III_について」、例2:「あなたの名前」→「II_の」とする。
(D)項の表記が存在せず、かつ、発話が対話の先頭(直前に発話が存在しない)の場合、「II_ELM」を発話対象特徴量として抽出する。
(E)項の表記が存在せず、かつ、上記(D)以外の場合、「SBJ_UNK」を発話対象特徴量とする。
図4は、本発明の実施の形態に係る対話行為推定モデル学習ルーチンを示すフローチャートである。入力部110に学習データが入力されると、対話行為推定モデル学習装置100おいて、図4に示す対話行為推定モデル学習処理ルーチンが実行される。
次に、図1及び図5を参照して、本発明の実施の形態に係る対話行為推定装置200の構成について説明する。なお、本発明の実施の形態に係る対話行為推定モデル学習装置100と同様の構成については、同一の符号を付して詳細な説明は省略する。
図6は、本発明の実施の形態に係る対話行為推定処理ルーチンを示すフローチャートである。なお、本発明の実施の形態に係る対話行為推定モデル学習処理ルーチンと同様の処理については、同一の符号を付して詳細な説明は省略する。
11 CPU
12 メモリ
13 通信IF部
14 入力部
15 表示部
16 記憶部
17 プログラム
27 プログラム
100 対話行為推定モデル学習装置
110 入力部
120 テキスト解析部
130 特徴量抽出部
131 単語n−gram抽出部
132 発話主要文節特定部
133 機能的特徴量抽出部
134 発話対象特徴量抽出部
135 特徴量集約部
140 モデル学習部
150 対話行為推定モデル記憶部
200 対話行為推定装置
210 入力部
260 対話行為推定部
270 出力部
Claims (5)
- 第1発話文と前記第1発話文の少なくとも直前の発話文を含む前記第1発話文より前の発話文である第2発話文との入力を受け付ける入力部と、
前記第1発話文及び前記第2発話文の各々について、発話文の発話対象に関する特徴量である発話対象特徴量を含む特徴量を抽出し、抽出した前記第1発話文及び前記第2発話文の各々についての前記特徴量を集約して集約特徴量とする特徴量抽出部と、
前記集約特徴量と、予め学習された、発話文の発話対象を考慮した対話行為の種類を示す対話行為タイプを推定するための対話行為推定モデルとを用いて、前記第1発話文の前記対話行為タイプを推定する対話行為推定部と、
を含む対話行為推定装置。 - 前記特徴量抽出部は、
前記第1発話文と前記第2発話文との各々について、発話文の内容を最も表す文節である発話主要文節を特定する発話主要文節特定部と、
前記発話主要文節特定部により特定された前記第1発話文及び前記第2発話文の各々についての発話主要文節に含まれる、発話文の機能的な特徴量である機能的特徴量を抽出する機能的特徴量抽出部と、
前記発話主要文節特定部により特定された前記第1発話文及び前記第2発話文の各々についての発話主要文節に基づいて、前記第1発話文及び前記第2発話文の各々の前記発話対象特徴量を抽出する発話対象特徴量抽出部と、
前記機能的特徴量抽出部により抽出された前記第1発話文及び前記第2発話文の各々についての前記機能的特徴量と、前記発話対象特徴量抽出部により抽出された前記第1発話文及び前記第2発話文の各々についての前記発話対象特徴量とを集約して前記集約特徴量とする特徴量集約部
を含む請求項1記載の対話行為推定装置。 - 第1発話文と前記第1発話文の少なくとも直前の発話文を含む前記第1発話文より前の発話文である第2発話文と、前記第1発話文の発話対象を考慮した対話行為の種類を示す対話行為タイプとを含む学習データの入力を受け付ける入力部と、
前記第1発話文及び前記第2発話文の各々について、発話文の発話対象に関する特徴量である発話対象特徴量を含む特徴量を抽出し、抽出した前記第1発話文及び前記第2発話文の各々についての前記特徴量を集約して集約特徴量とする特徴量抽出部と、
前記特徴量抽出部により抽出された前記第1発話文及び前記第2発話文についての集約特徴量と、発話文の発話対象を考慮した対話行為の種類を示す対話行為タイプを推定するための対話行為推定モデルとに基づいて推定される前記第1発話文の前記対話行為タイプが、前記学習データに含まれる前記第1発話文の前記対話行為タイプと一致するように、前記対話行為推定モデルのパラメータを学習するモデル学習部と、
を含む対話行為推定モデル学習装置。 - 入力部が、第1発話文と前記第1発話文の少なくとも直前の発話文を含む前記第1発話文より前の発話文である第2発話文との入力を受け付け、
特徴量抽出部が、前記第1発話文及び前記第2発話文の各々について、発話文の発話対象に関する特徴量である発話対象特徴量を含む特徴量を抽出し、抽出した前記第1発話文及び前記第2発話文の各々についての前記特徴量を集約して集約特徴量とし、
対話行為推定部が、前記集約特徴量と、予め学習された、発話文の発話対象を考慮した対話行為の種類を示す対話行為タイプを推定するための対話行為推定モデルとを用いて、前記第1発話文の前記対話行為タイプを推定する
対話行為推定方法。 - 入力部が、第1発話文と前記第1発話文の少なくとも直前の発話文を含む前記第1発話文より前の発話文である第2発話文との入力を受け付け、
特徴量抽出部が、前記第1発話文及び前記第2発話文の各々について、発話文の発話対象に関する特徴量である発話対象特徴量を含む特徴量を抽出し、抽出した前記第1発話文及び前記第2発話文の各々についての前記特徴量を集約して集約特徴量とし、
対話行為推定部が、前記集約特徴量と、予め学習された、発話文の発話対象を考慮した対話行為の種類を示す対話行為タイプを推定するための対話行為推定モデルとを用いて、前記第1発話文の前記対話行為タイプを推定する
ことを含む処理をコンピュータに実行させるためのプログラム。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019075055A JP7180513B2 (ja) | 2019-04-10 | 2019-04-10 | 対話行為推定装置、対話行為推定方法、対話行為推定モデル学習装置及びプログラム |
US17/602,281 US20220164545A1 (en) | 2019-04-10 | 2020-03-25 | Dialog action estimation device, dialog action estimation method, dialog action estimation model learning device, and program |
PCT/JP2020/013445 WO2020209072A1 (ja) | 2019-04-10 | 2020-03-25 | 対話行為推定装置、対話行為推定方法、対話行為推定モデル学習装置及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019075055A JP7180513B2 (ja) | 2019-04-10 | 2019-04-10 | 対話行為推定装置、対話行為推定方法、対話行為推定モデル学習装置及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2020173608A true JP2020173608A (ja) | 2020-10-22 |
JP7180513B2 JP7180513B2 (ja) | 2022-11-30 |
Family
ID=72751072
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019075055A Active JP7180513B2 (ja) | 2019-04-10 | 2019-04-10 | 対話行為推定装置、対話行為推定方法、対話行為推定モデル学習装置及びプログラム |
Country Status (3)
Country | Link |
---|---|
US (1) | US20220164545A1 (ja) |
JP (1) | JP7180513B2 (ja) |
WO (1) | WO2020209072A1 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7460377B2 (ja) | 2020-01-28 | 2024-04-02 | 浜松ホトニクス株式会社 | レーザ加工装置及びレーザ加工方法 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2016001242A (ja) * | 2014-06-11 | 2016-01-07 | 日本電信電話株式会社 | 質問文生成方法、装置、及びプログラム |
JP2017228160A (ja) * | 2016-06-23 | 2017-12-28 | パナソニックIpマネジメント株式会社 | 対話行為推定方法、対話行為推定装置及びプログラム |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9262395B1 (en) * | 2009-02-11 | 2016-02-16 | Guangsheng Zhang | System, methods, and data structure for quantitative assessment of symbolic associations |
US8375033B2 (en) * | 2009-10-19 | 2013-02-12 | Avraham Shpigel | Information retrieval through identification of prominent notions |
-
2019
- 2019-04-10 JP JP2019075055A patent/JP7180513B2/ja active Active
-
2020
- 2020-03-25 US US17/602,281 patent/US20220164545A1/en active Pending
- 2020-03-25 WO PCT/JP2020/013445 patent/WO2020209072A1/ja active Application Filing
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2016001242A (ja) * | 2014-06-11 | 2016-01-07 | 日本電信電話株式会社 | 質問文生成方法、装置、及びプログラム |
JP2017228160A (ja) * | 2016-06-23 | 2017-12-28 | パナソニックIpマネジメント株式会社 | 対話行為推定方法、対話行為推定装置及びプログラム |
Non-Patent Citations (1)
Title |
---|
木村晋一 他3名: "係り受け関係を用いた発話意図推定手法", 第63回(平成13年後期)全国大会講演論文集(2), JPN6020019641, 26 September 2001 (2001-09-26), JP, pages 197 - 2, ISSN: 0004833943 * |
Also Published As
Publication number | Publication date |
---|---|
US20220164545A1 (en) | 2022-05-26 |
JP7180513B2 (ja) | 2022-11-30 |
WO2020209072A1 (ja) | 2020-10-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10991366B2 (en) | Method of processing dialogue query priority based on dialog act information dependent on number of empty slots of the query | |
US10242667B2 (en) | Natural language generation in a spoken dialogue system | |
CN106649825B (zh) | 语音交互系统及其创建方法和装置 | |
CN110543643A (zh) | 文本翻译模型的训练方法及装置 | |
WO2022142121A1 (zh) | 摘要语句提取方法、装置、服务器及计算机可读存储介质 | |
JP6884947B2 (ja) | 対話システム及びそのためのコンピュータプログラム | |
US11636272B2 (en) | Hybrid natural language understanding | |
US9792909B2 (en) | Methods and systems for recommending dialogue sticker based on similar situation detection | |
JPWO2016151700A1 (ja) | 意図理解装置、方法およびプログラム | |
JP6370962B1 (ja) | 生成装置、生成方法および生成プログラム | |
JPWO2007138875A1 (ja) | 音声認識用単語辞書・言語モデル作成システム、方法、プログラムおよび音声認識システム | |
WO2023108994A1 (zh) | 一种语句生成方法及电子设备、存储介质 | |
KR101677859B1 (ko) | 지식 베이스를 이용하는 시스템 응답 생성 방법 및 이를 수행하는 장치 | |
KR20190138562A (ko) | 정보를 생성하기 위한 방법 및 장치 | |
JP2017125921A (ja) | 発話選択装置、方法、及びプログラム | |
CN111402864A (zh) | 语音处理方法及电子设备 | |
WO2022022049A1 (zh) | 文本长难句的压缩方法、装置、计算机设备及存储介质 | |
WO2020209072A1 (ja) | 対話行為推定装置、対話行為推定方法、対話行為推定モデル学習装置及びプログラム | |
Lorenc et al. | Benchmark of public intent recognition services | |
JP7211103B2 (ja) | 系列ラベリング装置、系列ラベリング方法、およびプログラム | |
CN109002498B (zh) | 人机对话方法、装置、设备及存储介质 | |
CN115620726A (zh) | 语音文本生成方法、语音文本生成模型的训练方法、装置 | |
JP5976037B2 (ja) | モデル学習装置、ランキング装置、方法、及びプログラム | |
JP2018010481A (ja) | 深層格解析装置、深層格学習装置、深層格推定装置、方法、及びプログラム | |
JP6368683B2 (ja) | 要約長推定装置、方法、及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210726 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220726 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220830 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20221018 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20221031 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7180513 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |