JP6680125B2 - ロボットおよび音声対話方法 - Google Patents
ロボットおよび音声対話方法 Download PDFInfo
- Publication number
- JP6680125B2 JP6680125B2 JP2016145367A JP2016145367A JP6680125B2 JP 6680125 B2 JP6680125 B2 JP 6680125B2 JP 2016145367 A JP2016145367 A JP 2016145367A JP 2016145367 A JP2016145367 A JP 2016145367A JP 6680125 B2 JP6680125 B2 JP 6680125B2
- Authority
- JP
- Japan
- Prior art keywords
- robot
- utterance
- voice
- robots
- sentence
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Toys (AREA)
Description
具体的には、他のロボットとの間で無線通信を行う通信手段と、前記他のロボットに対する発話文を取得する発話文取得手段と、合成音声によって前記発話文を出力する音声出力手段と、前記音声出力手段が出力する発話文に関連するデータである発話データを、無線通信によって他のロボットに送信する発話送信手段と、対話相手のロボットが送信した発話データを受信することで、当該ロボットが発した発話の内容を取得する発話受信手段と、を有することを特徴とする。
かかる構成によると、ロボットが実際に音声によって会話をしているような効果を演出
しつつ、対話を成立させるために必要なデータを相手側のロボットに伝送することができる。すなわち、音声認識の精度にかかわらず、ロボット間の会話を正しく成立させることができる。
本実施形態に係る音声対話システムは、ロボットが、ユーザおよび他のロボットと自然言語による対話を行うシステムである。
図1は、本実施形態に係る音声対話システムのシステム構成図である。本実施形態に係る音声対話システムは、ロボット10と対話サーバ20から構成される。なお、図1には示していないが、本実施形態に係る音声対話システムは、複数のロボット10を含んで構
成することができる。
音声入力部12は、音声を取得する手段である。具体的には、不図示のマイクを用いて、音声を電気信号(以下、音声データ)に変換する。取得した音声データは制御部15へ送信される。音声入力部12は、主にユーザが発した音声を取得するために用いられる。
音声出力部13は、音声を出力する手段である。具体的には、不図示のスピーカを用いて、制御部15から送信された音声データを音声に変換する。
具体的には、対話相手(例えば、ユーザや他のロボット)が存在することを検出して対話を開始する機能、対話サーバ20から発話文を取得する機能、取得した発話文を音声データに変換し音声出力部13を介して出力する機能などを実行する。
音声認識部22は、ロボット10から送信された音声データに対して音声認識を行い、テキストに変換する手段である。音声認識は、既知の技術によって行うことができる。例えば、音声認識部22には、音響モデルと認識辞書が記憶されており、取得した音声データと音響モデルとを比較して特徴を抽出し、抽出した特徴を認識辞書とをマッチングさせることで音声認識を行う。
したテキストに基づいて、発話文を生成する手段である。具体的には、(1)ロボット10から取得した発話データ、(2)ロボット10から取得した、対話相手に関する情報、(3)音声認識を行った結果得られたテキスト、のいずれかに基づいて、発話文の生成を行う。ロボット10の対話相手が他のロボット10である場合、前述した(1)および(2)によって発話文が生成され、ロボット10の対話相手が人間である場合、前述した(3)によって発話文が生成される。それぞれの具体的な処理例については、データフロー図を参照しながら後ほど説明する。
発話生成部23が取得した情報は、ロボット10へテキスト形式で送信され、その後、合成音声によって出力される。
次に、ロボット10が行う具体的な処理の内容について説明する。
まず、ロボット10とユーザが音声によって対話する処理について、装置間のデータフロー図である図2を参照しながら説明する。
そして、ステップS14で、ロボット10が有する制御部15が、発話文に基づいて音声合成を行い、音声出力部13を介して出力する。
なお、ここでは、一台目のロボットをロボット10、ロボット10と対話する二台目のロボットをロボット10’と称し、両者を区別する。また、ロボット10’が有している各手段については、符号にアポストロフィを付加することで区別する。
成してもよい。この際、制御部15は、検出した他のロボット(すなわち、対話相手となるロボット)の識別子をさらに取得する。
ステップS23では、ロボット10が有する制御部15が、発話文に基づいて音声合成を行い、音声出力部13を介して出力する。また、同時に、(1)発話データに加えて、(2)発話を行ったロボットの識別子と、(3)相手先ロボットの識別子を、対話先のロボット10’へ無線通信によって送信する。以降、これら三つのデータを発話データセットと称する。
そして、発話文を生成するための情報を対話サーバ20(発話生成部23)に送信する。ここで送信される情報は、ロボット10から送信された発話データセットそのものである。
なお、本例では発話データセットそのものを対話サーバ20に送信するものとしたが、対話相手に関する情報であれば、他の情報を追加で対話サーバ20に送信してもよい。例えば、発話内容の要約、発話文の種別、相手側ロボットの感情などを送信してもよい。
なお、発話文の生成においては、発話を行ったロボットの識別子と、相手先ロボットの識別子を加味してもよい。例えば、対話サーバ20に、ロボットのプロフィールや、当該ロボットのオーナーのプロフィール、当該ロボットと行った過去の会話の内容などを、ロボットの識別子と関連付けて記憶させておき、発話文の生成に利用してもよい。
以降は、前述した処理を繰り返すことでロボット同士の対話が進行する。
ロボット同士が実際に音声を介して対話を行う場合、当該ロボットが置かれた環境によっては、音声の認識精度が確保できず、正しい応答を生成できなくなることがあるが、本実施形態によると、精度の高い対話を行うことができる。
上記の実施形態はあくまでも一例であって、本発明はその要旨を逸脱しない範囲内で適
宜変更して実施しうる。
また、実施形態の説明では、ロボット10がユーザとの対話を行ったが、外部との入出力を行う手段をロボット10から分離してもよい。例えば、音声出力部13や音声入力部12を独立させてもよい。
また、実施形態の説明では、発話データセットにロボットの識別子を含ませたが、例えば、対話を行うロボットが一対一である場合など、対話相手となるロボットが一意に特定できる場合、省略してもよい。
11,21・・・通信部
12・・・音声出力部
13・・・音声入力部
14・・・音声認識部
15・・・近距離通信部
16・・・制御部
20・・・対話サーバ
22・・・発話生成部
Claims (7)
- ロボット同士が相互に対話を行う対話システムを構成するロボットであって、
他のロボットとの間で無線通信を行う通信手段と、
複数の前記ロボットに関する情報、または、前記複数のロボットのオーナーに関する情報を有するサーバ装置を介して、前記他のロボットに対する発話文を取得する発話文取得手段と、
合成音声によって前記発話文を出力する音声出力手段と、
前記音声出力手段が出力する発話文に関連するデータである発話データを、無線通信によって他のロボットに送信する発話送信手段と、
対話相手のロボットが送信した発話データを受信することで、当該ロボットが発した発話の内容を取得する発話受信手段と、
を有するロボット。 - 前記発話文取得手段は、前記対話相手のロボットが送信した発話データを用いて、当該ロボットに対する返答となる発話文を取得する、
請求項1に記載のロボット。 - 前記発話データは、発話を行うロボットを識別する情報を含む、
請求項1または2に記載のロボット。 - 前記発話データは、対話相手のロボットを識別する情報を含む、
請求項3に記載のロボット。 - 前記発話データは、発話を行うロボットのオーナーと、対話相手のロボットのオーナーをそれぞれ識別する情報を含み、
前記発話文取得手段は、前記オーナーに関する情報をさらに用いて前記発話文を取得する、
請求項1から4のいずれかに記載のロボット。 - ロボット同士が相互に対話を行う対話システムを構成するロボットが行う音声対話方法
であって、
複数の前記ロボットに関する情報、または、前記複数のロボットのオーナーに関する情報を有するサーバ装置を介して、他のロボットに対する発話文を取得する発話文取得ステップと、
合成音声によって前記発話文を出力する音声出力ステップと、
前記発話文に関連するデータである発話データを、無線通信によって他のロボットに送信する発話送信ステップと、
他のロボットから発話データを受信する発話受信ステップと、
を含み、
対話相手のロボットが送信した発話データを用いて、当該ロボットが発した発話の内容を取得する、
音声対話方法。 - 請求項6に記載の音声対話方法をコンピュータに実行させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016145367A JP6680125B2 (ja) | 2016-07-25 | 2016-07-25 | ロボットおよび音声対話方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016145367A JP6680125B2 (ja) | 2016-07-25 | 2016-07-25 | ロボットおよび音声対話方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2018017764A JP2018017764A (ja) | 2018-02-01 |
JP6680125B2 true JP6680125B2 (ja) | 2020-04-15 |
Family
ID=61081710
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016145367A Active JP6680125B2 (ja) | 2016-07-25 | 2016-07-25 | ロボットおよび音声対話方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6680125B2 (ja) |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3494567B2 (ja) * | 1998-01-22 | 2004-02-09 | 株式会社ナムコ | 携帯用通信玩具及び情報記憶媒体 |
JP2002287953A (ja) * | 2001-03-23 | 2002-10-04 | Sony Corp | ユーザーインターフェースシステム |
JP2003205483A (ja) * | 2001-11-07 | 2003-07-22 | Sony Corp | ロボットシステム及びロボット装置の制御方法 |
JP2004062063A (ja) * | 2002-07-31 | 2004-02-26 | Matsushita Electric Ind Co Ltd | 対話型装置 |
CN101193684A (zh) * | 2004-06-08 | 2008-06-04 | 思比驰盖尔公司 | 采用无线通信控制外部计算能力的小雕像 |
JP6448971B2 (ja) * | 2014-09-30 | 2019-01-09 | シャープ株式会社 | 対話装置 |
-
2016
- 2016-07-25 JP JP2016145367A patent/JP6680125B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2018017764A (ja) | 2018-02-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10412206B1 (en) | Communications for multi-mode device | |
JP6402748B2 (ja) | 音声対話装置および発話制御方法 | |
JP6465077B2 (ja) | 音声対話装置および音声対話方法 | |
JP6520878B2 (ja) | 音声取得システムおよび音声取得方法 | |
JP6447578B2 (ja) | 音声対話装置および音声対話方法 | |
US9552815B2 (en) | Speech understanding method and system | |
JP6497372B2 (ja) | 音声対話装置および音声対話方法 | |
WO2013027360A1 (ja) | 音声認識システム、認識辞書登録システム及び音響モデル識別子系列生成装置 | |
JP6614080B2 (ja) | 音声対話システムおよび音声対話方法 | |
JP2020046478A (ja) | ロボットシステム | |
US10143027B1 (en) | Device selection for routing of communications | |
US20180033432A1 (en) | Voice interactive device and voice interaction method | |
JP6448950B2 (ja) | 音声対話装置及び電子機器 | |
WO2018020828A1 (ja) | 翻訳装置および翻訳システム | |
WO2019187521A1 (ja) | 音声情報送信装置、音声情報送信方法、音声情報送信プログラム、音声情報解析システム及び音声情報解析サーバ | |
JP6680125B2 (ja) | ロボットおよび音声対話方法 | |
WO2019150708A1 (ja) | 情報処理装置、情報処理システム、および情報処理方法、並びにプログラム | |
US11172527B2 (en) | Routing of communications to a device | |
JP2007286376A (ja) | 音声案内システム | |
JP2018055155A (ja) | 音声対話装置および音声対話方法 | |
US10505879B2 (en) | Communication support device, communication support method, and computer program product | |
CN112823047A (zh) | 用于控制网络应用程序的系统和设备 | |
JP2000311077A (ja) | 音声情報入力装置 | |
JP5929810B2 (ja) | 音声解析システム、音声端末装置およびプログラム | |
KR102441066B1 (ko) | 차량의 음성생성 시스템 및 방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20180815 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20190625 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20190709 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20190905 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20200218 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20200302 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 6680125 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |