JP2021193608A - 発話生成装置、発話生成方法、及びコンピュータプログラム - Google Patents
発話生成装置、発話生成方法、及びコンピュータプログラム Download PDFInfo
- Publication number
- JP2021193608A JP2021193608A JP2021151210A JP2021151210A JP2021193608A JP 2021193608 A JP2021193608 A JP 2021193608A JP 2021151210 A JP2021151210 A JP 2021151210A JP 2021151210 A JP2021151210 A JP 2021151210A JP 2021193608 A JP2021193608 A JP 2021193608A
- Authority
- JP
- Japan
- Prior art keywords
- utterance
- intention
- user
- unit
- associative
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 43
- 238000004590 computer program Methods 0.000 title claims abstract description 16
- 238000006243 chemical reaction Methods 0.000 claims abstract description 30
- 238000000605 extraction Methods 0.000 claims abstract description 12
- 230000004044 response Effects 0.000 claims abstract description 11
- 230000003340 mental effect Effects 0.000 claims abstract description 8
- 230000014509 gene expression Effects 0.000 claims description 44
- 230000008569 process Effects 0.000 claims description 18
- 239000000284 extract Substances 0.000 claims description 10
- 238000011156 evaluation Methods 0.000 claims description 5
- 230000008859 change Effects 0.000 abstract description 4
- 230000000694 effects Effects 0.000 abstract description 4
- 230000000763 evoking effect Effects 0.000 abstract description 2
- 238000004891 communication Methods 0.000 description 19
- 238000010586 diagram Methods 0.000 description 16
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 12
- 241000287531 Psittacidae Species 0.000 description 6
- 239000002245 particle Substances 0.000 description 6
- 238000012545 processing Methods 0.000 description 6
- 238000005516 engineering process Methods 0.000 description 5
- 230000000877 morphologic effect Effects 0.000 description 5
- 206010019133 Hangover Diseases 0.000 description 4
- 230000035876 healing Effects 0.000 description 4
- 230000035622 drinking Effects 0.000 description 3
- 230000005484 gravity Effects 0.000 description 3
- 241000287530 Psittaciformes Species 0.000 description 2
- 230000008451 emotion Effects 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 230000010365 information processing Effects 0.000 description 2
- 239000004973 liquid crystal related substance Substances 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 208000019901 Anxiety disease Diseases 0.000 description 1
- 230000001133 acceleration Effects 0.000 description 1
- 230000036506 anxiety Effects 0.000 description 1
- 230000003190 augmentative effect Effects 0.000 description 1
- 230000021615 conjugation Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 208000002161 echolalia Diseases 0.000 description 1
- 230000012447 hatching Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Landscapes
- Machine Translation (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
(実施の形態1)
図1は実施の形態1に係る対話システムの全体構成を説明するブロック図である。本実施の形態に係る対話システムは、通信網Nを介して互いに通信可能に接続される発話生成装置10と端末装置20とを備える。端末装置20は、ユーザによって利用されるパーソナルコンピュータ、スマートフォン、AR(Augmented Reality)装置などの情報処理端末であり、発話生成装置10にアクセスするためのアプリケーションプログラムがインストールされているものとする。発話生成装置10は、例えば、端末装置20からのアクセスを受付けた場合、ユーザ認証を行い、ユーザ認証に成功した場合、端末装置20に対して対話サービスを提供する。
図5は発話生成処理の概要を説明する説明図である。発話生成装置10は、端末装置20からユーザ発話を受信した場合、まず、受信したユーザ発話からコンテンツ及びユーザの意図を抽出する。このため、発話生成装置10は、形態素解析の手法を用いて、ユーザ発話を複数の形態素に分解する。図5の例では、端末装置20から受信したユーザ発話が「学校で学びたい」であった場合、形態素解析により、「学校」、「で」、「学び」、「たい」の4つの形態素に分解されたことを示している。また、端末装置20から受信したユーザ発話が「技術経営?」であった場合、「技術経営」及び「?」の2つの形態素に分解されたことを示している。
なお、ユーザ発話に対して、オウム返しを行う場合、パロットとして含まれる名詞及び共起表現が選択される。
図11は発話生成装置10が実行する処理の手順を説明するフローチャートである。発話生成装置10の制御部11は、通信部13を通じて、端末装置20から送信されるユーザ発話の入力を受付ける(ステップS101)。制御部11は、入力されたユーザ発話について定型文であるか否かを判断し(ステップS102)、定型文であると判断した場合(S102:YES)、システム発話として定型文を出力する(ステップS103)。制御部11から出力されるシステム発話は、通信部13を通じて、端末装置20へ送信される。
実施の形態2では、コンテンツに付随する心的語彙を評価し、評価結果に基づきシステム発話を生成する構成について説明する。
なお、システムの全体構成、並びに、発話生成装置10及び端末装置20の内部構成は実施の形態1と同様であるため、その説明を省略することとする。
11 制御部
12 記憶部
120 発話生成プログラム
121 意図変換テーブル
122 Word2Vecデータ
13 通信部
14 表示部
15 操作部
20 端末装置
21 制御部
22 記憶部
23 通信部
24 表示部
25 操作部
Claims (12)
- 入力されたユーザ発話に対して出力すべきシステム発話を生成する発話生成装置であって、
前記ユーザ発話に含まれるコンテンツ及びユーザの意図を認識する認識部と、
前記認識部が認識したコンテンツから連想される連想語を抽出する抽出部と、
前記認識部が認識したユーザの意図を前記システム発話に付与すべき意図へ変換する変換部と、
前記抽出部が抽出した連想語と、前記変換部が変換した意図とを含むシステム発話を生成する発話生成部と
を備える発話生成装置。 - 前記抽出部は、前記コンテンツから連想語を抽出する際に、前記連想語に共起する用言又は体言を含む共起表現を併せて抽出し、
前記発話生成部は、抽出した連想語に対する共起表現を含むシステム発話を生成する
請求項1に記載の発話生成装置。 - 前記抽出部は、
前記コンテンツから連想される複数の連想語を取得する取得部と、
取得した複数の連想語と、夫々の連想語に共起する用言又は体言を含む複数の共起表現とに基づき、無向グラフを生成する無向グラフ生成部と、
生成した無向グラフに基づき、前記複数の連想語のうちの1又は複数の連想語を含む複数のクラスタを生成するクラスタ生成部と、
生成した複数のクラスタの中から一のクラスタを選択する第1選択部と、
選択した一のクラスタに含まれる連想語の中から一の連想語を選択する第2選択部と、
前記一のクラスタに含まれる何れかの連想語と共起する用言又は体言を含む共起表現の中から一の共起表現を選択する第3選択部と
を備える請求項2に記載の発話生成装置。 - 前記第1選択部、前記第2選択部、及び前記第3選択部は、前記クラスタ、前記連想語、及び前記共起表現をそれぞれランダムに選択する
請求項3に記載の発話生成装置。 - 前記取得部は、言語空間内に配置した前記コンテンツから所定距離範囲内に位置する複数の連想語を取得する
請求項3又は請求項4に記載の発話生成装置。 - 前記連想語は、名詞、動詞、又は形容詞である
請求項1から請求項5の何れか1つに記載の発話生成装置。 - ユーザ発話から認識される意図と、システム発話に付与すべき意図との関係を規定する意図変換テーブル
を備え、
前記変換部は、前記意図変換テーブルを参照し、入力されたユーザ発話から認識した意図を、システム発話に付与すべき意図へ変換する
請求項1から請求項6の何れか1つに記載の発話生成装置。 - 前記意図変換テーブルは、システム発話に付与すべき意図の候補を複数含み、
前記変換部は、前記意図変換テーブルに含まれる意図の候補から、システム発話に付与すべき一の意図を選択する
請求項7に記載の発話生成装置。 - ユーザ発話が定型文である場合、前記発話生成部が生成するシステム発話に代えて、定型文を含むシステム発話を出力する定型文出力部
を備える請求項1から請求項8の何れか1つに記載の発話生成装置。 - ユーザ発話に付随する心的語彙を評価する評価部
を備え、
前記発話生成部は、前記評価部による評価結果に基づき、システム発話を生成する
請求項1から請求項9の何れか1つに記載の発話生成装置。 - コンピュータを用いて、入力されたユーザ発話に対して出力すべきシステム発話を生成する発話生成方法であって、
前記コンピュータは、
前記ユーザ発話に含まれるコンテンツ及びユーザの意図を認識し、
認識したコンテンツから連想される連想語を抽出し、
認識したユーザの意図を前記システム発話に付与すべき意図へ変換し、
抽出した連想語と、変換後の意図とを含むシステム発話を生成する
発話生成方法。 - コンピュータに、入力されたユーザ発話に対して出力すべきシステム発話を生成する処理を実行させるためのコンピュータプログラムであって、
前記コンピュータに、
前記ユーザ発話に含まれるコンテンツ及びユーザの意図を認識し、
認識したコンテンツから連想される連想語を抽出し、
認識したユーザの意図を前記システム発話に付与すべき意図へ変換し、
抽出した連想語と、変換後の意図とを含むシステム発話を生成する
処理を実行させるためのコンピュータプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2021151210A JP7308550B2 (ja) | 2018-12-25 | 2021-09-16 | 発話生成装置、発話生成方法、及びコンピュータプログラム |
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018241207A JP6951763B2 (ja) | 2018-12-25 | 2018-12-25 | 発話生成装置、発話生成方法、及びコンピュータプログラム |
JP2021151210A JP7308550B2 (ja) | 2018-12-25 | 2021-09-16 | 発話生成装置、発話生成方法、及びコンピュータプログラム |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018241207A Division JP6951763B2 (ja) | 2018-12-25 | 2018-12-25 | 発話生成装置、発話生成方法、及びコンピュータプログラム |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2021193608A true JP2021193608A (ja) | 2021-12-23 |
JP2021193608A5 JP2021193608A5 (ja) | 2022-12-07 |
JP7308550B2 JP7308550B2 (ja) | 2023-07-14 |
Family
ID=71139685
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018241207A Active JP6951763B2 (ja) | 2018-12-25 | 2018-12-25 | 発話生成装置、発話生成方法、及びコンピュータプログラム |
JP2021151210A Active JP7308550B2 (ja) | 2018-12-25 | 2021-09-16 | 発話生成装置、発話生成方法、及びコンピュータプログラム |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018241207A Active JP6951763B2 (ja) | 2018-12-25 | 2018-12-25 | 発話生成装置、発話生成方法、及びコンピュータプログラム |
Country Status (1)
Country | Link |
---|---|
JP (2) | JP6951763B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111930916B (zh) * | 2020-09-18 | 2021-02-05 | 北京百度网讯科技有限公司 | 对话生成方法、装置、电子设备和存储介质 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007219149A (ja) * | 2006-02-16 | 2007-08-30 | Toyota Central Res & Dev Lab Inc | 応答生成装置、方法及びプログラム |
-
2018
- 2018-12-25 JP JP2018241207A patent/JP6951763B2/ja active Active
-
2021
- 2021-09-16 JP JP2021151210A patent/JP7308550B2/ja active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007219149A (ja) * | 2006-02-16 | 2007-08-30 | Toyota Central Res & Dev Lab Inc | 応答生成装置、方法及びプログラム |
Non-Patent Citations (1)
Title |
---|
町田雄一郎 他3名: "関連語知識獲得のための対話システム上の連想ゲームのデザイン", 情報処理学会 論文誌(ジャーナル), vol. 57, no. 3, JPN6021001241, 15 March 2016 (2016-03-15), JP, pages 1058 - 1068, ISSN: 0004948044 * |
Also Published As
Publication number | Publication date |
---|---|
JP7308550B2 (ja) | 2023-07-14 |
JP6951763B2 (ja) | 2021-10-20 |
JP2020102117A (ja) | 2020-07-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Sun et al. | Chinese lexical database (cld) a large-scale lexical database for simplified mandarin chinese | |
Ferrand et al. | MEGALEX: A megastudy of visual and auditory word recognition | |
KR102101044B1 (ko) | 텍스트 투 스피치 및 시맨틱스에 기초한 오디오 인적 상호 증명 기법 | |
Kager et al. | Constraints in phonological acquisition | |
Bernolet et al. | Effects of phonological feedback on the selection of syntax: Evidence from between-language syntactic priming | |
Frank et al. | Hierarchical and sequential processing of language: A response to: Ding, Melloni, Tian, and Poeppel (2017). Rule-based and word-level statistics-based processing of language: insights from neuroscience. Language, Cognition and Neuroscience. | |
Johar | Emotion, affect and personality in speech: The Bias of language and paralanguage | |
Treiman et al. | Language comprehension and production | |
JP5620349B2 (ja) | 対話装置、対話方法および対話プログラム | |
Kristensson et al. | A design engineering approach for quantitatively exploring context-aware sentence retrieval for nonspeaking individuals with motor disabilities | |
Monaghan | Canalization of language structure from environmental constraints: A computational model of word learning from multiple cues | |
CN112185361B (zh) | 一种语音识别模型训练方法、装置、电子设备及存储介质 | |
Sproat et al. | The taxonomy of writing systems: How to measure how logographic a system is | |
Dunbar et al. | Self-supervised language learning from raw audio: Lessons from the zero resource speech challenge | |
Schmalz et al. | Quantifying the reliance on different sublexical correspondences in German and English | |
Bugert et al. | Generalizing cross-document event coreference resolution across multiple corpora | |
DiCanio et al. | Disentangling the effects of position and utterance-level declination on the production of complex tones in Yoloxóchitl Mixtec | |
Cavalieri et al. | Combination of language models for word prediction: An exponential approach | |
JP7308550B2 (ja) | 発話生成装置、発話生成方法、及びコンピュータプログラム | |
Clifton Jr et al. | Language comprehension and production | |
Myers | Markedness and lexical typicality in Mandarin acceptability judgments | |
Boroş et al. | Robust deep-learning models for text-to-speech synthesis support on embedded devices | |
Zimmerman et al. | A blind spot for large language models: Supradiegetic linguistic information | |
Algayres et al. | Generative Spoken Language Model based on continuous word-sized audio tokens | |
Roark et al. | Towards technology-assisted co-construction with communication partners |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20211224 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20221129 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20221220 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230217 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20230530 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20230627 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7308550 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |