JP2018181018A - 会話提供装置、会話提供方法及びプログラム - Google Patents
会話提供装置、会話提供方法及びプログラム Download PDFInfo
- Publication number
- JP2018181018A JP2018181018A JP2017080890A JP2017080890A JP2018181018A JP 2018181018 A JP2018181018 A JP 2018181018A JP 2017080890 A JP2017080890 A JP 2017080890A JP 2017080890 A JP2017080890 A JP 2017080890A JP 2018181018 A JP2018181018 A JP 2018181018A
- Authority
- JP
- Japan
- Prior art keywords
- speech
- user
- scenario
- conversation
- partial
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
の話題から抜け出せなくなるような対話破綻が生じることを抑制できる。すなわち、会話の継続性及び話題の転換の自然さを向上させることができる。
の転換の自然さを向上させることができる。
図1は、実施形態に係るシステム全体の一例を示す図である。本システムは、コンピュータによって発言が出力され、ユーザ(本発明に係る「第1の話者」に相当する)と会話を行う仮想的な人格(本発明に係る「第2の話者」に相当する)を提供する。また、会話の内容は雑談を含み、例えばユーザが本システムの利用を中断するまで会話を継続する。本システムは、ユーザ端末1と、会話提供サーバ2とを含み、これらがネットワーク3を解して接続されている。ネットワーク3は、インターネット等の通信網であり、ネットワーク3に接続されたコンピュータは様々なプロトコルに基づいて相互に通信できるものとする。ユーザ端末1は、スマートフォンやタブレット、PC(Personal Computer)等の
コンピュータであり、本実施形態に係るプログラム(ソフトウェア、又はアプリケーションとも呼ぶ)を実行することにより、本実施形態に係る会話提供システムのユーザインターフェースとして機能する。なお、ユーザ端末1は、ネットワーク3に複数接続されていてもよい。会話提供サーバ2は、一般的なコンピュータであり、本実施形態に係るプログラムを実行することにより、仮想的な人格の発言をユーザ端末1へネットワーク3を介して出力すると共に、ユーザ端末1からユーザの応答を取得する処理を繰り返す。なお、ユーザの発言は、会話提供サーバ2が出力する選択肢の中からユーザが選択することにより、ユーザ端末1に入力され、ネットワーク3を介して会話提供サーバ2へ送信される。
図2は、ユーザ端末1及び会話提供サーバ2の構成の一例を示すブロック図である。
ス15とを備えている。入出力I/F11は、例えばタッチパネル等のユーザインターフェースである。入出力I/F11は、ユーザに対し仮想的人格の発言を表示したり、ユーザの応答の選択肢を表示させたりすると共に、ユーザの操作に基づいてユーザの応答の選択を受け付ける。記憶装置12は、RAM(Random Access Memory)やROM(Read Only Memory)等の主記憶装置及びHDD(Hard-disk Drive)やSSD(Solid State Drive)、フラッシュメモリ等の補助記憶装置(二次記憶装置)である。主記憶装置は、プロセッサが読み出したプログラムや受信する台詞のデータを一時的に記憶したり、プロセッサの作業領域を確保したりする。補助記憶装置は、プロセッサが実行するプログラムを記憶したりする。通信I/F13は、例えば携帯電話の基地局や無線LAN(Local Area Network)のアクセスポイントと通信を行うネットワークモジュールであり、所定のプロトコルに基づき通信を行う。プロセッサ14は、CPU(Central Processing Unit)等の演
算処理装置であり、プログラムを実行することにより本実施の形態に係る各処理を行う。図2の例では、プロセッサ14内に機能ブロックを示している。具体的には、プロセッサ14は、入出力制御部141として機能する。入出力制御部141は、仮想的な人格の発言を入出力I/F11に表示させると共に、入出力I/F11を介してユーザの応答の入力を受け付ける。以上のような構成要素が、バス15を介して接続されている。
図3は、ユーザ端末1の入出力I/F11に表示される画像の一例を示す図である。図3の例では、タッチパネルである入出力I/F11に、仮想的な人格を表す画像111と、ユーザを表す画像112と、仮想的な人格の発言を表す吹出し113と、ユーザの応答の選択肢を表す3つの吹出し114(114a〜114c)とが表示されている。ユーザは、例えばこのような選択肢の中から自身の発言をタップして選択することにより、仮想的な人格との会話を行うことができる。なお、選択肢の数は複数であり、3には限られない。
図4は、会話提供サーバ2の記憶装置22に予め記憶されているシナリオの一例を示す図である。本実施形態では、図4に示すような、複数の人物による会話形式の台詞を複数含むシナリオが、会話提供サーバ2の記憶装置22に予め複数記憶されているものとする。なお、シナリオに含まれる各行には台詞が記述されており、各行の冒頭に付されたアルファベットA及びBは、各行に記述された台詞を発する人物を表す。便宜上、同一の人物に割り当てられた連続する台詞を、1つの発言と呼ぶものとする。図4の例では、人物Bの発言221(1つ目の発言)と、これに応答する人物Aの発言222(2つ目の発言)と、これにさらに応答する人物Bの発言223(3つ目の発言)とが記述されている。1つの発言は、1行以上の台詞を含む。1行は1文であってもよく、1行には何らかの意図
を表す台詞が記述される。また、各行の間で話題が転換されてもよいが、話の筋道が一貫するように記述されるものとする。図4に示すような、脈絡のある3〜4程度の発言を含むやりとりを1つの単位として記述しておき、これを「部分的シナリオ」とも呼ぶものとする。本実施形態では、部分的シナリオの少なくとも一部を、仮想的な人格とユーザとのそれまでの会話に連結することにより、会話を継続的に行う。
図5は、本システムにおいて実行される会話提供処理の一例を示す処理フロー図である。まず、会話提供サーバ2の会話制御部241は、何らかの条件に基づき、初期的な部分的シナリオを選択する(図5:S1)。本ステップでは、会話を開始するための任意の部分的シナリオが選択される。例えば、記憶装置22に格納された複数の部分的シナリオの中から、図4に示した部分的シナリオが選択されたものとする。
MD(Word Mover's Distance)、コサイン類似度等のような技術を用いることができる
。WMDを利用する場合、例えば2つの台詞に含まれる似た意味の単語同士を対応付け、各対応付けについて分散表現の距離をコストとして算出し、2つの台詞間のコストの総和を2つの台詞間の距離とする。そして、距離が近い台詞ほど類似度が高いと判断する。コサイン類似度を利用する場合、各台詞に含まれる単語の分散表現を生成し、進行中の部分的シナリオにおいて仮想的人格の発言に応答する発言として記述されている台詞に含まれる単語と、コサイン類似度の高い単語を含む台詞を抽出する。また、単語は、特に名詞を用いて類似度を算出するようにしてもよい。以上のようなテキストマイニング技術を用いて、進行中のシナリオにおいて仮想的人格の発言に応答する発言として記述されている台詞「そうね、ここ最近雨続きね」との類似度が高いものから順に所定数の台詞を抽出する。
の台詞「お昼から雨なんだって」、及びシナリオ3の台詞「曇ってきたね、雨が降るのかな」が、図3の吹出し114a〜114cに表示される。
において決定された仮想的な人格の発言を、通信I/F23を介してユーザ端末1へ送信する。
本実施形態によれば、脈絡のあるやりとりを記述した部分的シナリオを連結し、連結した複数の部分的シナリオに基づいて、仮想的な人格の発言と、ユーザの応答の選択肢とを出力する。また、ユーザの応答の選択肢は、いわゆる人工知能を用いて類似度が高いと評価された台詞であり、いずれを選択されても話の筋道が一貫するようになる。また、選択されたユーザの応答に対するさらなる仮想的な人格の応答は、部分的シナリオにおいて予め脈絡のあるやりとりとして記述されたシナリオ通りの台詞であり、話の筋道は一貫するようになっている。したがって、話題が転換される場合であっても、予め準備された部分的シナリオの中で自然に話題が変わるか、ユーザが選択肢を選ぶことにより話題を変えるかによって行われるため、話の流れは自然なものとなる。また、部分的シナリオを連結することにより、話が続けられるため、会話の継続性も向上する。
図7に示したように、部分的シナリオに登場する人物A、人物Bは、それぞれユーザ、仮想的な人格に割り当てるようにしてもよい。すなわち、図6のS13においては、部分的シナリオにおいて、ユーザの発言である人物Aの台詞の中から、ユーザの応答の選択肢を抽出する。このようにすれば、予め準備される部分的シナリオにおいて、ユーザ、及び仮想的な人格について何らかの性格付けをして台詞の内容や口調を記述しておくことができる。
部分的シナリオにおける2番目以降に記述された発言を対象としてもよい。なお、部分的シナリオにおいて、ユーザの応答に係る発言の後に、応答として記述された発言を仮想的な人格の発言として利用するため、部分的シナリオにおける最後の発言は、ユーザの応答の選択肢として抽出する対象としない。すなわち、S13におけるユーザの応答の選択肢は、部分的シナリオに記述された最後の発言以外の発言から抽出される。
本発明は上述の処理を実行するコンピュータプログラムを含む。さらに、当該プログラムを記録した、コンピュータ読み取り可能な記録媒体も、本発明の範疇に属する。当該プログラムが記録された記録媒体については、コンピュータに、この記録媒体のプログラムを読み込ませて実行させることにより、上述の処理が可能となる。
11 :入出力I/F
12 :記憶装置
13 :通信I/F
14 :プロセッサ
141:入出力制御部
15 :バス
2 :会話提供サーバ
21 :入出力I/F
22 :記憶装置
23 :通信I/F
24 :プロセッサ
241:会話制御部
25 :バス
3 :ネットワーク
Claims (10)
- 仮想的な人格とユーザとを会話させる会話提供装置であって、
複数の話者の台詞を含む会話形式の部分的シナリオを複数記憶するシナリオ記憶部と、
前記部分的シナリオを用いて前記ユーザに対する前記仮想的な人格の発言を出力する会話制御部と、
を備え、
前記会話制御部は、前記仮想的な人格の発言又は前記ユーザの発言と、前記部分的シナリオに含まれる台詞との類似度に基づいて、前記仮想的な人格の発言又は前記ユーザの発言に対する応答を前記部分的シナリオから抽出する
会話提供装置。 - 前記会話提供装置は、選択肢から前記ユーザに自身の発言を選択させる形式により、前記仮想的な人格と前記ユーザとを会話させ、
前記会話制御部は、
前記シナリオ記憶部から読み出した第1の部分的シナリオに含まれる台詞と、当該第1の部分的シナリオに類似する第2の部分的シナリオに含まれる台詞とを、前記選択肢として前記ユーザに提示すると共にいずれかを選択させ、
前記ユーザが選択した台詞を含む部分的シナリオにおいて、選択された台詞に対する応答として記述された台詞を、前記仮想的な人格の発言として出力する
請求項1に記載の会話提供装置。 - 前記会話制御部は、
前記シナリオ記憶部から読み出した前記第1の部分的シナリオに含まれる第1の話者の第1の台詞を、前記仮想的な人格の発言として出力し、
前記第1の部分的シナリオにおいて前記第1の話者の第1の台詞に対する応答として記述された第2の話者の第1の台詞に含まれる単語に基づいて、前記シナリオ記憶部から前記第2の話者の第1の台詞に類似する他の部分的シナリオに含まれる第2の話者の第2の台詞を抽出し、
前記第2の話者の第1の台詞と、前記第2の話者の第2の台詞とを含む選択肢を前記ユーザに提示すると共にいずれかを選択させる
請求項2に記載の会話提供装置。 - 前記会話制御部は、
前記第2の話者の第1の台詞、及び前記シナリオ記憶部に記憶されている他の部分的シナリオに含まれる台詞に対し形態素解析を行い、各台詞に含まれる単語の分散表現に基づいて、前記第1の部分的シナリオにおける前記第2の話者の第1の台詞に類似する他の部分的シナリオに含まれる第2の話者の第2の台詞を抽出する
請求項3に記載の会話提供装置。 - 前記第2の話者の第2の台詞は、前記他の部分的シナリオにおける最後の台詞以外から抽出される
請求項4に記載の会話提供装置。 - 前記会話提供装置は、前記ユーザに発言を自由入力させる形式により、前記仮想的な人格と前記ユーザとを会話させ、
前記会話制御部は、
前記ユーザが入力した発言に類似する台詞及び当該台詞が記述されている前記部分的シナリオを抽出し、
抽出された前記部分的シナリオにおいて、抽出された前記台詞に対する応答として記
述されている台詞を、前記ユーザが入力した発言に対する前記仮想的な人格の応答として出力する
請求項1に記載の会話提供装置。 - 前記会話制御部は、前記仮想的な人格の発言又は前記ユーザの第1の発言、及びこれに応答する第2の発言の組み合わせと、前記部分的シナリオに含まれる2つの台詞の組合せとの類似度に基づいて、前記第2の発言に対する応答を前記部分的シナリオから抽出する
請求項1に記載の会話提供装置。 - 前記部分的シナリオは、話の筋道が一貫するように予め記述されている
請求項1から7のいずれか一項に記載の会話提供装置。 - コンピュータが、仮想的な人格とユーザとを会話させる会話提供方法であって、
複数の話者の台詞を含む会話形式の部分的シナリオを複数記憶するシナリオ記憶部に記憶された前記部分的シナリオを用いて、前記仮想的な人格の発言又は前記ユーザの発言と、前記部分的シナリオに含まれる台詞との類似度に基づいて、前記仮想的な人格の発言又は前記ユーザの発言に対する応答を前記部分的シナリオから抽出するステップと、
抽出された応答を出力するステップと、
を含む会話提供方法。 - コンピュータが、仮想的な人格とユーザとを会話させる処理をコンピュータに実行させるプログラムであって、
複数の話者の台詞を含む会話形式の部分的シナリオを複数記憶するシナリオ記憶部に記憶された前記部分的シナリオを用いて、前記仮想的な人格の発言又は前記ユーザの発言と、前記部分的シナリオに含まれる台詞との類似度に基づいて、前記仮想的な人格の発言又は前記ユーザの発言に対する応答を前記部分的シナリオから抽出するステップと、
抽出された応答を出力するステップと、
を実行させるプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017080890A JP6449368B2 (ja) | 2017-04-14 | 2017-04-14 | 会話提供装置、会話提供方法及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017080890A JP6449368B2 (ja) | 2017-04-14 | 2017-04-14 | 会話提供装置、会話提供方法及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2018181018A true JP2018181018A (ja) | 2018-11-15 |
JP6449368B2 JP6449368B2 (ja) | 2019-01-09 |
Family
ID=64275597
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017080890A Active JP6449368B2 (ja) | 2017-04-14 | 2017-04-14 | 会話提供装置、会話提供方法及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6449368B2 (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20200068193A (ko) * | 2018-12-05 | 2020-06-15 | 서울대학교산학협력단 | 자연어 문장에서 응대 여부를 판단하는 음성인식 방법 |
KR20210074649A (ko) * | 2019-12-12 | 2021-06-22 | 서울대학교산학협력단 | 음향정보와 텍스트정보를 이용하여 자연어 문장에서 응대 여부를 판단하는 음성인식 방법 |
CN113938697A (zh) * | 2021-10-13 | 2022-01-14 | 广州方硅信息技术有限公司 | 直播间内的虚拟发言方法、装置及计算机设备 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008170817A (ja) * | 2007-01-12 | 2008-07-24 | Toyota Motor Corp | 対話制御装置、対話制御方法及び対話制御プログラム |
JP2012094075A (ja) * | 2010-10-28 | 2012-05-17 | Toshiba Corp | 対話装置 |
-
2017
- 2017-04-14 JP JP2017080890A patent/JP6449368B2/ja active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008170817A (ja) * | 2007-01-12 | 2008-07-24 | Toyota Motor Corp | 対話制御装置、対話制御方法及び対話制御プログラム |
JP2012094075A (ja) * | 2010-10-28 | 2012-05-17 | Toshiba Corp | 対話装置 |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20200068193A (ko) * | 2018-12-05 | 2020-06-15 | 서울대학교산학협력단 | 자연어 문장에서 응대 여부를 판단하는 음성인식 방법 |
KR102174148B1 (ko) * | 2018-12-05 | 2020-11-04 | 서울대학교산학협력단 | 자연어 문장에서 응대 여부를 판단하는 음성인식 방법 |
KR20210074649A (ko) * | 2019-12-12 | 2021-06-22 | 서울대학교산학협력단 | 음향정보와 텍스트정보를 이용하여 자연어 문장에서 응대 여부를 판단하는 음성인식 방법 |
KR102334961B1 (ko) * | 2019-12-12 | 2021-12-02 | 서울대학교산학협력단 | 음향정보와 텍스트정보를 이용하여 자연어 문장에서 응대 여부를 판단하는 음성인식 방법 |
CN113938697A (zh) * | 2021-10-13 | 2022-01-14 | 广州方硅信息技术有限公司 | 直播间内的虚拟发言方法、装置及计算机设备 |
CN113938697B (zh) * | 2021-10-13 | 2024-03-12 | 广州方硅信息技术有限公司 | 直播间内的虚拟发言方法、装置及计算机设备 |
Also Published As
Publication number | Publication date |
---|---|
JP6449368B2 (ja) | 2019-01-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10872609B2 (en) | Method, apparatus, and program of dialog presentation steps for agents | |
US20190294638A1 (en) | Dialog method, dialog system, dialog apparatus and program | |
CN110493123B (zh) | 即时通讯方法、装置、设备及存储介质 | |
CN115309877B (zh) | 对话生成方法、对话模型训练方法及装置 | |
JP5834291B2 (ja) | 音声認識装置、自動応答方法及び、自動応答プログラム | |
JPWO2017200078A1 (ja) | 対話方法、対話システム、対話装置、およびプログラム | |
JP6682104B2 (ja) | 対話方法、対話システム、対話装置、およびプログラム | |
JP6449368B2 (ja) | 会話提供装置、会話提供方法及びプログラム | |
JPWO2017200081A1 (ja) | 取得方法、生成方法、それらのシステム、及びプログラム | |
KR102102287B1 (ko) | 챗봇을 위한 대화 모델의 데이터 크라우드소싱 방법 | |
US11776546B1 (en) | Intelligent agent for interactive service environments | |
Inupakutika et al. | Integration of NLP and Speech-to-text Applications with Chatbots | |
CN114783405B (zh) | 一种语音合成方法、装置、电子设备及存储介质 | |
KR101891495B1 (ko) | 사용자 발화 입력에 대한 대화 응답 후보를 표시하도록 하는 디스플레이 제어 방법, 컴퓨터 판독가능 기록 매체 및 컴퓨터 장치 | |
US10559298B2 (en) | Discussion model generation system and method | |
JP2017207693A (ja) | 対話方法、対話システム、対話装置、およびプログラム | |
JP6551852B1 (ja) | 情報提供装置、情報提供方法およびプログラム | |
KR102679919B1 (ko) | 자연어처리모델을 이용한 캐릭터 영상통화 서비스를 제공하는 방법, 시스템, 및 컴퓨터-판독가능 기록매체 | |
JP6383748B2 (ja) | 音声翻訳装置、音声翻訳方法、及び音声翻訳プログラム | |
JP6985311B2 (ja) | 相槌判定によって応答発話生成を制御する対話実施プログラム、装置及び方法 | |
KR102644550B1 (ko) | 자연어처리모델을 이용한 캐릭터 영상통화 제공방법, 이를 수행하는 컴퓨팅시스템, 및 이를 구현하기 위한 컴퓨터-판독가능 기록매체 | |
JP7462995B1 (ja) | 情報処理システム、情報処理方法及びプログラム | |
WO2023234128A1 (ja) | 対話管理装置、対話管理方法及び対話管理システム | |
Campbell et al. | Expressivity in interactive speech synthesis; some paralinguistic and nonlinguistic issues of speech prosody for conversational dialogue systems | |
Sundblad et al. | OLGA—a multimodal interactive information assistant |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20180822 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20180904 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20181102 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20181120 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20181205 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6449368 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |