JP6824127B2 - ロボット制御装置、ロボット制御方法およびロボット制御プログラム - Google Patents
ロボット制御装置、ロボット制御方法およびロボット制御プログラム Download PDFInfo
- Publication number
- JP6824127B2 JP6824127B2 JP2017154232A JP2017154232A JP6824127B2 JP 6824127 B2 JP6824127 B2 JP 6824127B2 JP 2017154232 A JP2017154232 A JP 2017154232A JP 2017154232 A JP2017154232 A JP 2017154232A JP 6824127 B2 JP6824127 B2 JP 6824127B2
- Authority
- JP
- Japan
- Prior art keywords
- verbal
- action
- utterance
- robot
- time
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 29
- 230000001755 vocal effect Effects 0.000 claims description 124
- 230000033001 locomotion Effects 0.000 claims description 102
- 230000009471 action Effects 0.000 claims description 100
- 230000036961 partial effect Effects 0.000 claims description 43
- 230000006870 function Effects 0.000 claims description 16
- 230000006399 behavior Effects 0.000 description 34
- 230000007704 transition Effects 0.000 description 15
- 238000010586 diagram Methods 0.000 description 12
- 239000000470 constituent Substances 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 230000015572 biosynthetic process Effects 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 238000003786 synthesis reaction Methods 0.000 description 2
- 238000009825 accumulation Methods 0.000 description 1
- 230000002301 combined effect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 239000000945 filler Substances 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000003252 repetitive effect Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
Landscapes
- Manipulator (AREA)
Description
一実施形態では、ロボットの過去の動作シナリオ作成ログと、ロボットの発話内容テキストとから、ロボットへの自動的な非言語動作付与を実現する。
図1に示すように、本発明の一実施形態におけるロボット制御システムは、ロボット制御装置10、発話内容入力部200、ロボット301を有する。
また、ロボット制御装置10は、外部の制御対象としてのロボット301と接続可能である。
一例として、ロボット制御システムは、ロボット制御装置10をスマートフォン、タブレット型端末、パーソナルコンピュータ(PC)などのコンピュータデバイスとした装置とすることにより実現される。例えば、コンピュータデバイスは、CPU(Central Processing Unit)などのプロセッサと、プロセッサに接続されるメモリと、ロボット301と(例えば無線で)通信するための通信インタフェースと、を備える。なお、ロボット制御システムの実現形態は、この例に限定されるものではない。以下では、ロボット制御装置10は、ロボット301と別の構成であるとして説明するが、ロボット制御装置10がロボット301に組み込まれる構成であってもよい。
(1)ログ中の発話内容のテキストから発話内容の対話行為を推定する、対話行為推定部101(第1の推定手段)
(2)推定した対話行為に対する、この対話行為と一緒に実施される非言語動作の共起確率を複数種類の非言語動作についてそれぞれ求める、共起確率計算部102
(3)ロボットの新たな発話内容のテキストを入力する発話内容入力部200
(4)入力した新たな発話内容のテキストから、ロボットが音声発話する場合の発話時間(発話内容の音声発話に要する時間)や対話行為を発話情報として推定する、発話情報取得部201(第2の推定手段)
(5)共起確率や発話情報(発話時間、対話行為)をもとに、この発話情報における対話行為とともに実施されて、動作時間(動作開始から動作終了までに要する時間)の長さが発話時間に対応した長さである非言語動作を、新たな発話内容に付与する非言語動作として決定する、付与動作決定部203
(6)付与した非言語動作と入力された発話内容とからロボットの動作シナリオを自動生成する、動作シナリオ生成部300
発話内容を入力するために、発話内容入力部200は、事前に作成したテキストファイルを読み込ませても良いし、Webブラウザなどで動作するアプリケーションのユーザインターフェースにテキストを逐次入力しても良い。
さらに、本実施形態で対象とする非言語動作は、非言語動作を構成する部分的な動作としてのプリミティブな動作を複数組み合わせた動作パターンとしてあらかじめ定義しておくことができる。非言語動作は、「継続」と「単発」でなる2種類の属性のいずれかを有する。
属性が「継続」である非言語動作は、「動作完了」の命令が設定されるまで、上記のプリミティブな動作を組み合わせた動作を繰り返し継続する動作である。また、属性が「単発」である非言語動作は、プリミティブな動作の組み合わせを全て実行したら終了する動作である。
本実施形態において、ロボットの非言語動作を自動で付与するために、まず、対話行為推定部101は、過去に作成された動作シナリオログを読み込む。そして、対話行為推定部101は、動作シナリオ中の各ノード情報として、発話内容と非言語動作を取得し、各発話内容の対話行為DAiを決定する。対話行為は発話の意図を示す分類ラベルの1つであり、質問・挨拶・フィラー(filler)などの分類要素から構成される。
次に、共起確率計算部102は、対話行為とロボットの非言語動作との共起確率を、全ての対話行為と複数種類の非言語動作とについてそれぞれ求める。ここで、ロボットのジェスチャ(非言語動作)集合をM={mo1,mo2,…,mok}とし、ある対話行為αの発話と一緒に非言語動作mo1が実施される共起確率をpα1とすると、対話行為αに対する各非言語動作の共起確率の離散分布は、pα={pα1, pα2,…,pαk}(このとき
この手法では、発話情報取得部201が発話内容入力部200を介して入力した発話内容テキストTiから発話情報として、音声合成時の発話時間tiと対話行為DAiをそれぞれ推定する。
次に、ここで取得した対話行為DAiをもとに、付与動作決定部203は、事前に共起確率計算部102が計算した、発話内容に基づく対話行為と非言語動作との共起確率を参照して、該当する共起確率の離散分布
上記の手順を経て、発話内容テキストTiに対して付与された非言語動作集合から、動作シナリオ生成部300は、ロボットの動作シナリオを自動生成する。ロボット301は、この動作シナリオに従って、音声発話と非言語動作とをそれぞれ実行する。
次に、本発明の実施例について示す。本実施例では、発話内容の入力に沿って非言語動作を付与したロボットの動作シナリオを自動で生成し、1台のロボットの制御を実現することができる。
本実施例におけるロボット制御システムが有する機能は、(1)ロボットの過去の動作シナリオから、発話内容と非言語動作との共起確率をあらかじめ計算する共起確率計算機能、(2)共起確率にもとづき、発話時間と動作時間を考慮して、入力された発話内容から非言語動作を付与する非言語動作付与機能、(3)発話内容への非言語動作の付与結果から、ロボット制御プラットフォームに合わせて動作シナリオを生成する機能、に大別できる。
共起確率計算部102は、対話行為推定部101により推定した対話行為と非言語動作とが共起する確率を計算する。共起確率記憶部103は、共起確率計算部102により計算した、各対話行為における非言語動作の共起確率を保存する。
非言語動作IDは、後述する非言語動作記憶部204にも保存された情報であり、対となるノードIDに該当するノードでロボットに設定される非言語動作のIDである。
図3に示すように、共起確率記憶部103は、各対話行為に対して、非言語動作毎の共起確率を保存する。図3に示した例では、対話行為「挨拶」に対して、非言語動作「1」(非言語動作IDが「1」である非言語動作)が0.5の確率(0から1の範囲内)で、非言語動作「2」(非言語動作IDが「2」である非言語動作)が「0.2」の確率で、非言語動作「3」(非言語動作IDが「3」である非言語動作)が「0.05」の確率でそれぞれ共起することを表す。
図7に示すように、対話行為推定部101は、ロボットの動作シナリオの状態遷移図における各ノードに含まれるノード情報(ノードID、発話内容、非言語動作ID、遷移条件、遷移先ノード)を、動作シナリオログ記憶部100に記憶される動作シナリオログから読み出す(S11)。対話行為推定部101は、読み出したノード情報から発話内容のテキストと非言語動作IDとを取得し、この発話内容のテキストから対話行為を推定する(S12)。共起確率計算部102は、推定した各対話行為と非言語動作との共起確率をそれぞれ計算する(S13)。共起確率計算部102は、計算した、対話行為ごとの共起確率を共起確率記憶部103へ保存する。
付与動作決定部203は、共起確率と発話時間に合わせて、ロボットの非言語動作を付与する。
部分動作記憶部205は、プリミティブな動作の情報を部分動作一覧として保存する。付与動作記憶部206は、発話内容に合わせて付与動作決定部203が、発話内容に自動的に付与した非言語動作の一覧を付与動作一覧として保存する。
部分動作は、ロボットを制御する際の最もプリミティブな動作である。図5に示すように、部分動作記憶部205では、(1)各種の部分動作を一意に識別す部分動作ID、(2)部分動作をさせたいロボット関節の指定部分、(3)指定した関節をどの角度まで動かすかを示すパラメータ、(4)指定した角度までの遷移時間を示す動作時間、を対応付けて部分動作一覧として保存する。
図5に示した例では、部分動作ID「1」の動作は、ロボットの右手の関節を40°に300msの遷移時間で動かすことを表し、また、部分動作ID「2」の動作は、ロボットの右手の関節を0°に400msの遷移時間で動かすことを表す。この部分動作ID「1」の動作と部分動作ID「2」の動作とを組み合わせて、図4に示した例では「手を振る」(動作名称)という非言語動作を設定可能としている。
また、図4に示した例では、特殊な非言語動作として非言語動作「end」(非言語動作IDが「end」である非言語動作)を設定することができる。これは、「継続」の属性を持つ非言語動作に対して、この動作を完了する命令に相当し、非言語動作「end」を実施すると、ロボットの全ての関節を初期状態に戻すことができる。
図6の例では、1、2行目における「こんにちは」という発話内容テキストに対して、1行目の非言語動作(部分動作IDが動作順に3、4、3、4である4つの部分動作でなる非言語動作)と2行目の非言語動作(部分動作IDが動作順に1、2である2つの部分動作でなる非言語動作)とがそれぞれ付与されている。
まず、発話情報取得部201は、シナリオ作成者の発話内容のテキスト入力が終了しないときに(S21のN)、発話内容入力部200から入力された発話内容Tiのテキストから対話行為Daiを推定する。また、発話情報取得部201は、発話内容Tiのテキストを音声合成し、この音声ファイルを再生する際の発話時間tiを取得し、これらの対話行為Daiと発話時間tiとを発話情報として発話情報記憶部202へ保存する(S22)。以後は、S21に戻り、シナリオ作成者の発話内容のテキスト入力が終了する(S21のY)まで、S22を繰り返す。
まず、付与動作決定部203は、新たな発話内容Tiから上記のように推定された対話行為Daiおよび発話時間tiを発話情報記憶部202に記憶される発話情報からそれぞれ読み出す(S31)。
あわせて、付与動作決定部203は、S31で読み出した対話行為Daiにおける各非言語動作の共起確率を共起確率記憶部103(図3参照)からそれぞれ読み出す(S32)。
次に、付与動作決定部203は、S31で読み出した対話行為Daiにおける非言語動作の集合M’(={mo1’,mo2,…,mok’}を共起確率記憶部103(図3参照)から取得する(S33)。
具体的には、S35で選択された非言語動作moj’の属性が「継続」であるときは(S40のY)、発話が終了する(非言語動作moj’にかかる時間の累積が発話時間tiに達する)まで、この非言語動作moj’を継続すればよく、発話終了後に当該非言語動作moj’を完了するように、付与動作決定部203は、非言語動作IDが「end」である非言語動作を付与動作記憶部206に保存して(S41)、動作付与にかかる処理フローを終了する。
つまり、S35で選択した非言語動作の属性が「継続」であるときに、S35で選択した非言語動作を、非言語動作に要する時間である動作時間が発話時間に達するまで繰り返してなる動作として求め、この求めた動作が、発話時間に対応した(動作時間の長さが発話時間に対応した長さである)非言語動作として決定される。例えば、S35で選択した非言語動作の1回の動作時間が発話時間の3分の1であるときは、この動作を3回繰り返してなる動作が、上記対応した非言語動作として決定される。
具体的には、S35で選択された非言語動作moj’内に、反復するプリミティブな動作が存在しないときには(S42のN)、S35で選択した非言語動作moj’をS39と同様に付与動作記憶部206に保存した上で(S43)、S35に戻る。
このようにS35に戻ることで、先にS35で選択した非言語動作moj’と比較して、S32で取得した各非言語動作のうち未選択の非言語動作であって、共起確率が最も高い新たな非言語動作moj’を選択して、この動作に要する動作時間を反映した全動作時間と発話時間とが再度比較される。このように、選択した非言語動作に要する時間である動作時間と発話時間との間に差分があるときに、必要に応じ、複数種類の非言語動作(S32で取得した各非言語動作)のうち既に選択した非言語動作以外の非言語動作であって共起確率が最も高い非言語動作の選択が繰り返される。
S47の比較で、S45での追加後の全動作時間tallのカウンタの現在の値が、S31で取得した発話時間ti以上であるとき(S47のY)は、付与動作決定部203は、動作付与にかかる処理フローを終了する。
一方、S45での追加後の全動作時間のカウンタの現在の値tallがS31で取得した発話時間tiより小さいとき(S47のN)は、S35に戻る。
まず、動作シナリオ生成部300は、付与動作記憶部206に記憶される付与動作一覧(図6参照)の最初の行を選択し、この選択した行から(1)発話内容のテキストと、(2)付与された非言語動作IDを読み出し、これら読み出した発話内容と非言語動作IDを状態遷移図のノード内に記述する(S51)。
動作シナリオ生成部300は、付与動作一覧(図6参照)における、S51で選択した行の次の行を読み出す(S52)。この行に、S51で選択した行から読み出した発話内容のテキストと同一の発話内容のテキストが存在する場合で(S53のY)、この行で記述される非言語動作IDが「end」でない場合は(S54のN)、動作シナリオ生成部300は、この非言語動作IDを同一のノード内に記述する。(S55)。
Claims (6)
- ロボットの発話内容と、前記ロボットの非言語動作の識別情報とを含むログ情報から、前記発話内容の意図の分類を示す情報である対話行為を推定する第1の推定手段と、
前記第1の推定手段により推定された対話行為に対する、当該対話行為とともに実施される非言語動作の共起確率を計算する計算手段と、
前記ロボットの新たな発話内容を取得し、この取得した発話内容の音声発話に要する時間である発話時間、および、前記取得した発話内容の意図の分類を示す情報である対話行為をそれぞれ推定する第2の推定手段と、
前記第2の推定手段により推定された発話時間、前記第2の推定手段により推定された対話行為、および前記計算手段により計算された共起確率に基づいて、前記第2の推定手段により推定された対話行為とともに実施される動作で、かつ動作に要する時間である動作時間の長さが前記第2の推定手段により推定された発話時間に対応した長さである非言語動作を決定する決定手段と、
前記決定手段により決定された非言語動作および前記新たな発話内容に基づいて、前記ロボットの動作シナリオを生成する生成手段とを備えたロボット制御装置。 - 前記計算手段は、
前記第1の推定手段により推定された対話行為に基づいて、当該対話行為とともに実施される非言語動作の共起確率を複数種類の非言語動作についてそれぞれ計算し、
前記決定手段は、
前記複数種類の非言語動作のうち共起確率が最も高い非言語動作を選択し、
前記選択した非言語動作に要する時間である動作時間と前記第2の推定手段により推定された発話時間との間に差分があるときに、前記複数種類の非言語動作のうち前記選択した非言語動作以外の非言語動作であって前記共起確率が最も高い非言語動作の選択を繰り返す請求項1に記載のロボット制御装置。 - 前記非言語動作を示す情報を、この非言語動作が、動作完了まで繰り返し継続する動作であるか否かを示す属性情報と対応付けて記憶する非言語動作記憶手段をさらに備え、
前記決定手段は、
前記決定手段により選択された非言語動作に対応する属性情報を前記非言語動作記憶手段から読み出し、当該属性情報が前記繰り返し継続する動作を示すときに、前記決定手段により選択された非言語動作を、前記決定手段により選択された非言語動作に要する時間である動作時間が前記第2の推定手段により推定された発話時間に達するまで繰り返した動作として、当該動作を、前記第2の推定手段により推定された対話行為とともに実施される動作で、かつ前記動作時間の長さが前記第2の推定手段により推定された発話時間に対応した長さである非言語動作として決定する請求項2に記載のロボット制御装置。 - 前記決定手段は、
前記決定手段により選択された非言語動作が、同一の部分的な動作を反復した動作を含むときに、前記決定手段により選択された非言語動作を、前記同一の部分的な動作を反復した動作を繰り返す動作に更新する請求項2に記載のロボット制御装置。 - ロボット制御装置が行なうロボット制御方法であって、
ロボットの発話内容と、前記ロボットの非言語動作の識別情報とを含むログ情報から、前記発話内容の意図の分類を示す情報である第1の対話行為を推定し、
前記推定された対話行為に対する、当該対話行為とともに実施される非言語動作の共起確率を計算し、
前記ロボットの新たな発話内容を取得し、この取得した発話内容の音声発話に要する時間である発話時間、および、前記取得した発話内容の意図の分類を示す情報である第2の対話行為をそれぞれ推定し、
前記推定した発話時間、前記推定された前記第2の対話行為、および前記計算された共起確率に基づいて、前記推定された前記第2の対話行為とともに実施される動作で、かつ動作に要する時間である動作時間の長さが前記推定された発話時間に対応した長さである非言語動作を決定し、
前記決定された非言語動作および前記新たな発話内容に基づいて、前記ロボットの動作シナリオを生成するロボット制御方法。 - 請求項1乃至4のいずれか1つにおけるロボット制御装置の前記各手段としてプロセッサを機能させるロボット制御プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017154232A JP6824127B2 (ja) | 2017-08-09 | 2017-08-09 | ロボット制御装置、ロボット制御方法およびロボット制御プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017154232A JP6824127B2 (ja) | 2017-08-09 | 2017-08-09 | ロボット制御装置、ロボット制御方法およびロボット制御プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2019030949A JP2019030949A (ja) | 2019-02-28 |
JP6824127B2 true JP6824127B2 (ja) | 2021-02-03 |
Family
ID=65522801
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017154232A Active JP6824127B2 (ja) | 2017-08-09 | 2017-08-09 | ロボット制御装置、ロボット制御方法およびロボット制御プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6824127B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102576788B1 (ko) | 2020-08-21 | 2023-09-11 | 한국전자통신연구원 | 로봇 인터랙션 행위 생성 장치 및 방법 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4246548B2 (ja) * | 2003-05-30 | 2009-04-02 | 日本電信電話株式会社 | 統計情報を用いた対話方法及びその装置と、対話プログラム及びそのプログラムを記録した記録媒体 |
JPWO2007043679A1 (ja) * | 2005-10-14 | 2009-04-23 | シャープ株式会社 | 情報処理装置およびプログラム |
JP5877418B2 (ja) * | 2011-12-09 | 2016-03-08 | 株式会社国際電気通信基礎技術研究所 | シナリオ生成装置およびシナリオ生成方法 |
JP5612720B1 (ja) * | 2013-05-15 | 2014-10-22 | 日本電信電話株式会社 | 対話制御学習装置と対話制御装置とそれらの方法とプログラム |
JP6310150B2 (ja) * | 2015-03-20 | 2018-04-11 | 株式会社東芝 | 意図理解装置、方法およびプログラム |
-
2017
- 2017-08-09 JP JP2017154232A patent/JP6824127B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2019030949A (ja) | 2019-02-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Bhattacharya et al. | Speech2affectivegestures: Synthesizing co-speech gestures with generative adversarial affective expression learning | |
JP2019086679A (ja) | 対話システム、対話方法および対話プログラム | |
US9117316B1 (en) | Social identity models for automated entity interactions | |
Cambre et al. | Methods and tools for prototyping voice interfaces | |
KR20200059112A (ko) | 로봇 상호작용 시스템 및 그를 위한 프로그램 | |
JP2020140628A (ja) | 文生成装置、文生成方法、文生成学習装置、文生成学習方法及びプログラム | |
JP6824127B2 (ja) | ロボット制御装置、ロボット制御方法およびロボット制御プログラム | |
Jannach et al. | Conversational recommendation: A grand AI challenge | |
Suguitan et al. | Affective robot movement generation using cyclegans | |
US9342912B1 (en) | Animation control retargeting | |
Pohl et al. | Body layars: A toolkit for body-based augmented reality | |
Michael et al. | Retico: An open-source framework for modeling real-time conversations in spoken dialogue systems | |
Qian et al. | Breaking the limits of text-conditioned 3d motion synthesis with elaborative descriptions | |
US11922141B2 (en) | Voice and chatbot conversation builder | |
KR101964300B1 (ko) | 지식모델을 이용한 로봇의 동작 구현 장치 및 방법 | |
KR102431369B1 (ko) | 대화형 인공지능을 이용한 코딩 방법 및 장치 | |
US20210060775A1 (en) | Splitting transformers for robotics planning | |
KR20200144296A (ko) | 딥러닝 모델의 병렬 트레이닝 방법 및 장치 | |
JP6678138B2 (ja) | ロボット制御装置、ロボット制御方法およびロボット制御プログラム | |
Kim et al. | Design of code template for automatic code generation of heterogeneous smartphone application | |
Blumendorf et al. | Multimodal user interfaces for smart environments: the multi-access service platform | |
Meszaros et al. | Speech-based natural language interface for UAV trajectory generation | |
KR20080028732A (ko) | 디지털 캐릭터 동작생성 시스템 및 방법 | |
CN113901267A (zh) | 动作视频的生成方法、装置、设备及介质 | |
Cui et al. | Master of puppets: an animation-by-demonstration computer puppetry authoring framework |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD01 | Notification of change of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7426 Effective date: 20170821 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20170821 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20190723 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20200709 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20200721 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20200911 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20210105 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20210112 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6824127 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |