JP2018075657A - 生成プログラム、生成装置、制御プログラム、制御方法、ロボット装置及び通話システム - Google Patents
生成プログラム、生成装置、制御プログラム、制御方法、ロボット装置及び通話システム Download PDFInfo
- Publication number
- JP2018075657A JP2018075657A JP2016218471A JP2016218471A JP2018075657A JP 2018075657 A JP2018075657 A JP 2018075657A JP 2016218471 A JP2016218471 A JP 2016218471A JP 2016218471 A JP2016218471 A JP 2016218471A JP 2018075657 A JP2018075657 A JP 2018075657A
- Authority
- JP
- Japan
- Prior art keywords
- voice
- data
- character string
- speaker
- motion
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B25—HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
- B25J—MANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
- B25J11/00—Manipulators not otherwise provided for
- B25J11/0005—Manipulators having means for high-level communication with users, e.g. speech generator, face recognition means
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B25—HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
- B25J—MANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
- B25J11/00—Manipulators not otherwise provided for
- B25J11/0005—Manipulators having means for high-level communication with users, e.g. speech generator, face recognition means
- B25J11/0015—Face robots, animated artificial faces for imitating human expressions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
- G06F3/167—Audio in a user interface, e.g. using voice commands for navigating, audio feedback
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/004—Artificial life, i.e. computing arrangements simulating life
- G06N3/008—Artificial life, i.e. computing arrangements simulating life based on physical entities controlled by simulated intelligence so as to replicate intelligent life forms, e.g. based on robots replicating pets or humans in their appearance or behaviour
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
- G10L13/08—Text analysis or generation of parameters for speech synthesis out of text, e.g. grapheme to phoneme translation, prosody generation or stress or intonation determination
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
Abstract
【解決手段】生成プログラムは、話者の音声から認識された文字列と、当該音声が発された期間に応じた期間における話者の動きを表すデータと、を取得し、取得した文字列と、動きを表すデータとを基に、文字列と動きとの対応関係を示す情報を生成する処理をコンピュータに実行させる。また、制御プログラムは、所定の文字列に基づく音声を発するようにロボット装置を制御する。そして、制御プログラムは、生成された文字列と動きとの対応関係を示す情報に基づき、所定の文字列に対応する動きを、ロボット装置による音声の発声に同期して行うようにロボット装置を制御する処理をコンピュータに実行させる。
【選択図】図1
Description
まず、通話システム1の概要について、図1を用いて説明する。図1は、実施例1における通話システムの構成例を説明する説明図である。図1に示すように、通話システム1は、通話装置100、生成装置200及びロボット装置300を有する。また、通話装置100、生成装置200及びロボット装置300は、無線又は有線で構築された通信ネットワーク10を介して互いに通信可能に接続されている。通信ネットワーク10は、例えばインターネットである。なお、生成装置200は、情報処理装置の一例である。
図3は、実施例1における通話装置の機能ブロックの一例を示す図である。図3に示す通話装置100は、発話部110と、受話部120と、通信部130と、検知部140と、記憶部150と、制御部160とを有する。なお、通話装置100は、図3に示す機能部以外にも既知のコンピュータが有する各種の機能部、例えば各種の通信デバイス、入力デバイスや音声出力デバイス等の機能部を有することとしてもかまわない。通話装置100の一例としては、スマートフォン、通話機能を有するタブレット端末及びパーソナルコンピュータ等を採用できる。
図11を用いて、本実施例における通話装置100及び生成装置200による生成処理の流れを説明する。図11は、実施例1における生成処理の一例を説明する図である。図11に示すように、通話装置100は、通話が開始されるまで待機する(ステップS101:No)。通話装置100の音声認識部161は、通話が開始されると(ステップS101:Yes)、受話部120によって収集された音声の音声認識を行う(ステップS102)。また、検知部140は、話者の動きを検知する(ステップS103)。そして、通信部130は、音声認識部161による音声認識の結果得られた文字列、及び、検知部140によって取得された話者の動きに関するデータを、生成装置200に送信する(ステップS104)。
本実施例における生成装置200によれば、通話装置100を用いて通話を行うユーザの実際の音声及び動きを基に、音声と動きとの関係を学習することができる。このため、本実施例におけるロボット装置300は、多様な動きを行うことが可能となる。例えば、本実施例によれば、ロボット装置300は、より人間らしい振る舞いをすることが可能になる。また、これにより、本実施例によれば、遠地にいる家族同士がロボット装置300を通して対話を行うことが可能となる。
図14を用いて、本実施例における生成装置200及びロボット装置300による応答処理の流れを説明する。図14は、実施例2における応答処理の一例を説明する図である。なお、図14に示す応答処理は、ロボット装置300を用いるユーザH20と、通話装置100を用いるユーザH10との通話が行われる場合の例である。
本実施例では、通話の際に、ロボット装置300は予め通話相手の動きに関するデータを生成装置200から取得しておく。このため、ロボット装置300及び生成装置200の通信回数を削減することができる。
110、310 発話部
120、320 受話部
130、210、330 通信部
140 検知部
150、220、350 記憶部
160、230、360 制御部
161 音声認識部
200 生成装置
221 学習結果DB
231 生成部
300 ロボット装置
351 話者指定学習結果DB
340 可動部
361 音声認識部
362 決定部
363 取得部
364 駆動部
H10、H20 ユーザ
Claims (19)
- コンピュータに、
話者の音声から認識された文字列と、当該音声が発された期間に応じた期間における前記話者の動きを表すデータと、を取得し、
取得した前記文字列と、前記動きを表すデータとを基に、文字列と動きとの対応関係を示す情報を生成する
処理を実行させることを特徴とする生成プログラム。 - 前記取得する処理において、前記話者を識別するデータをさらに取得し、
前記生成する処理において、前記話者毎の前記対応関係を示す情報を生成することを特徴とする請求項1に記載の生成プログラム。 - 前記取得する処理において、通話装置を用いる話者の音声から認識された文字列と、当該音声が発された期間に応じた期間における前記通話装置の傾きを表すデータと、を取得し
前記生成する処理において、文字列と傾きとの対応関係を示す情報を生成することを特徴とする請求項1又は2に記載の生成プログラム。 - 話者の音声から認識された文字列と、当該音声が発された期間に応じた期間における前記話者の動きを表すデータと、を取得する取得部と、
取得した前記文字列と、前記動きを表すデータとを基に、文字列と動きとの対応関係を示す情報を生成する生成部と
を有することを特徴とする生成装置。 - コンピュータに、
所定の文字列に基づく音声を発するようにロボット装置を制御し、
話者の音声から認識された文字列と、当該音声が発された期間に応じた期間における前記話者の動作を表すデータと、を基に生成された文字列と動きとの対応関係を示す情報に基づき、前記所定の文字列に対応する動きを、前記ロボット装置による音声の発声に同期して行うように前記ロボット装置を制御する
処理を実行させることを特徴とする制御プログラム。 - 前記動きを行うように制御する処理において、話者の音声から認識された文字列と、当該音声が発された期間に応じた期間における前記話者の動作を表すデータと、前記話者を識別するデータと、を基に生成された文字列と動きとの話者毎の対応関係を示す情報のうち、予め設定された特定の話者の対応関係を示す情報に基づき、前記所定の文字列に対応する動きを行うように前記ロボット装置を制御することを特徴とする請求項5に記載の制御プログラム。
- 前記動きを行うように制御する処理において、通話装置を用いる話者の音声から認識された文字列と、当該音声が発された期間に応じた期間における前記通話装置の傾きを表すデータと、を基に生成された文字列と傾きとの対応関係を示す情報に基づき、前記ロボット装置の頭部の傾きが、前記所定の文字列に対応する傾きとなるように前記ロボット装置を制御することを特徴とする請求項5又は6に記載の制御プログラム。
- 前記音声を発するように制御する処理において、前記ロボット装置と接続された通話装置に対して第1の話者が発した音声から認識された第1の文字列を発するように前記ロボット装置を制御し、
前記動きを行うように制御する処理において、前記第1の文字列に対応する動きを行うように前記ロボット装置を制御する処理を実行させることを特徴とする請求項5乃至7のいずれか1つに記載の制御プログラム。 - ロボット装置の制御プログラムにおいて、
通話装置から出力された音声データを受け付けると、受け付けた前記音声データに応じた音声を前記ロボット装置に出力させ、前記音声データに応じた動きデータを受け付けると、受け付けた前記動きデータに応じた動きを前記ロボット装置に実行させる、
処理をコンピュータに実行させることを特徴とする制御プログラム。 - 前記音声データに応じた動きデータは、前記音声データに応じた発話内容に対応付けられた動きデータである、
ことを特徴とする請求項9に記載の制御プログラム。 - ロボット装置の制御プログラムにおいて、
通話装置から出力された音声データを受け付けると、受け付けた前記音声データに応じた音声を前記ロボット装置に出力させるとともに、音声データと動きデータとの対応関係を示す情報を記憶する記憶部を参照して、受け付けた前記音声データに対応付けられた動きデータを特定し、特定した前記動きデータに応じた動きを前記ロボット装置に実行させる、
処理をコンピュータに実行させることを特徴とする制御プログラム。 - 前記通話装置の話者を特定した場合、音声データと動きデータとの対応関係を示す情報を話者毎に記憶する外部記憶部から、特定した前記話者に応じた情報を取得し、
取得した前記情報を前記記憶部に記憶する、
ことを特徴とする請求項11に記載の制御プログラム。 - コンピュータが、
所定の文字列に基づく音声を発するようにロボット装置を制御し、
話者の音声から認識された文字列と、当該音声が発された期間に応じた期間における前記話者の動作を表すデータと、を基に生成された文字列と動きとの対応関係を示す情報に基づき、前記所定の文字列に対応する動きを、前記ロボット装置による音声の発声に同期して行うように前記ロボット装置を制御する
処理を実行することを特徴とする制御方法。 - ロボット装置の制御方法において、
通話装置から出力された音声データを受け付けると、受け付けた前記音声データに応じた音声を前記ロボット装置に出力させ、前記音声データに応じた動きデータを受け付けると、受け付けた前記動きデータに応じた動きを前記ロボット装置に実行させる、
処理をコンピュータが実行することを特徴とする制御方法。 - ロボット装置の制御方法において、
通話装置から出力された音声データを受け付けると、受け付けた前記音声データに応じた音声を前記ロボット装置に出力させるとともに、音声データと動きデータとの対応関係を示す情報を記憶する記憶部を参照して、受け付けた前記音声データに対応付けられた動きデータを特定し、特定した前記動きデータに応じた動きを前記ロボット装置に実行させる、
処理をコンピュータが実行することを特徴とする制御プログラム。 - 所定の文字列に基づく音声を発する発話部と、
話者の音声から認識された文字列と、前記音声が発された期間に応じた期間における前記話者の動作を表すデータと、を基に生成された文字列と動きとの対応関係を示す情報に基づき、前記所定の文字列に対応する動きを、前記発話部による音声の発声に同期して行う動作部と、
を有することを特徴とするロボット装置。 - 通話装置から出力された音声データを受け付けると、受け付けた前記音声データに応じた音声を出力する発話部と、
前記音声データに応じた動きデータを受け付けると、受け付けた前記動きデータに応じた動きを実行する動作部と、
を有することを特徴とするロボット装置。 - 通話装置から出力された音声データを受け付けると、受け付けた前記音声データに応じた音声を出力する発話部と、
前記発話部による音声の出力とともに、音声データと動きデータとの対応関係を示す情報を記憶する記憶部を参照して、受け付けた前記音声データに対応付けられた動きデータを特定し、特定した前記動きデータに応じた動きを実行する動作部と、
を有することを特徴とするロボット装置。 - 通話装置と、
ロボット装置と、
情報処理装置と、を備え、
前記通話装置は、
話者の音声を受け付けると、受け付けた前記音声に応じた音声データを、前記ロボット装置と前記情報処理装置とに送信し、
前記情報処理装置は、
前記通話装置から前記音声データを受信すると、発話内容と動きデータとの対応関係を示す情報を記憶する記憶部を参照して、受信した前記音声データに応じた発話内容に対応付けられた動きデータを取得し、
取得した前記動きデータを前記ロボット装置に送信し、
前記ロボット装置は、
前記通話装置から前記音声データを受信すると、受信した前記音声データに応じた音声を出力し、前記情報処理装置から前記動きデータを受信すると、受信した前記動きデータに応じた動きを実行する、
ことを特徴とする通話システム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016218471A JP6798258B2 (ja) | 2016-11-08 | 2016-11-08 | 生成プログラム、生成装置、制御プログラム、制御方法、ロボット装置及び通話システム |
US15/785,597 US20180126561A1 (en) | 2016-11-08 | 2017-10-17 | Generation device, control method, robot device, call system, and computer-readable recording medium |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016218471A JP6798258B2 (ja) | 2016-11-08 | 2016-11-08 | 生成プログラム、生成装置、制御プログラム、制御方法、ロボット装置及び通話システム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2018075657A true JP2018075657A (ja) | 2018-05-17 |
JP6798258B2 JP6798258B2 (ja) | 2020-12-09 |
Family
ID=62065079
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016218471A Active JP6798258B2 (ja) | 2016-11-08 | 2016-11-08 | 生成プログラム、生成装置、制御プログラム、制御方法、ロボット装置及び通話システム |
Country Status (2)
Country | Link |
---|---|
US (1) | US20180126561A1 (ja) |
JP (1) | JP6798258B2 (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2020066094A (ja) * | 2018-10-24 | 2020-04-30 | トヨタ自動車株式会社 | コミュニケーションロボットおよびコミュニケーションロボットの制御プログラム |
JP2020082246A (ja) * | 2018-11-20 | 2020-06-04 | 大日本印刷株式会社 | 姿勢データ生成装置、学習器、コンピュータプログラム、学習データ、姿勢データ生成方法及び学習モデルの生成方法 |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20230335006A1 (en) * | 2022-04-14 | 2023-10-19 | Annunciation Corporation | Robotic Head For Modeling Articulation Of Speech Sounds |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004214895A (ja) * | 2002-12-27 | 2004-07-29 | Toshiba Corp | 通信補助装置 |
JP2004230479A (ja) * | 2003-01-28 | 2004-08-19 | Advanced Telecommunication Research Institute International | コミュニケーションロボットおよびそれを用いたコミュニケーションシステム |
JP2006142407A (ja) * | 2004-11-17 | 2006-06-08 | Sanyo Electric Co Ltd | ロボット装置およびロボット装置システム |
-
2016
- 2016-11-08 JP JP2016218471A patent/JP6798258B2/ja active Active
-
2017
- 2017-10-17 US US15/785,597 patent/US20180126561A1/en not_active Abandoned
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004214895A (ja) * | 2002-12-27 | 2004-07-29 | Toshiba Corp | 通信補助装置 |
JP2004230479A (ja) * | 2003-01-28 | 2004-08-19 | Advanced Telecommunication Research Institute International | コミュニケーションロボットおよびそれを用いたコミュニケーションシステム |
JP2006142407A (ja) * | 2004-11-17 | 2006-06-08 | Sanyo Electric Co Ltd | ロボット装置およびロボット装置システム |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2020066094A (ja) * | 2018-10-24 | 2020-04-30 | トヨタ自動車株式会社 | コミュニケーションロボットおよびコミュニケーションロボットの制御プログラム |
JP7067414B2 (ja) | 2018-10-24 | 2022-05-16 | トヨタ自動車株式会社 | コミュニケーションロボットおよびコミュニケーションロボットの制御プログラム |
JP2020082246A (ja) * | 2018-11-20 | 2020-06-04 | 大日本印刷株式会社 | 姿勢データ生成装置、学習器、コンピュータプログラム、学習データ、姿勢データ生成方法及び学習モデルの生成方法 |
Also Published As
Publication number | Publication date |
---|---|
US20180126561A1 (en) | 2018-05-10 |
JP6798258B2 (ja) | 2020-12-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6635049B2 (ja) | 情報処理装置、情報処理方法およびプログラム | |
CN102903362B (zh) | 集成的本地和基于云的语音识别 | |
US10702991B2 (en) | Apparatus, robot, method and recording medium having program recorded thereon | |
JP4839838B2 (ja) | 情報処理システム、情報処理方法および情報処理用プログラム | |
KR102463806B1 (ko) | 이동이 가능한 전자 장치 및 그 동작 방법 | |
US11526147B2 (en) | Systems and methods to adapt and optimize human-machine interaction using multimodal user-feedback | |
WO2017130486A1 (ja) | 情報処理装置、情報処理方法およびプログラム | |
JP6798258B2 (ja) | 生成プログラム、生成装置、制御プログラム、制御方法、ロボット装置及び通話システム | |
WO2016206647A1 (zh) | 用于控制机器装置产生动作的系统 | |
KR102115222B1 (ko) | 사운드를 제어하는 전자 장치 및 그 동작 방법 | |
WO2021153101A1 (ja) | 情報処理装置、情報処理方法および情報処理プログラム | |
JP7435641B2 (ja) | 制御装置、ロボット、制御方法およびプログラム | |
JP2017211430A (ja) | 情報処理装置および情報処理方法 | |
JP2016156877A (ja) | 情報処理装置、情報処理方法およびプログラム | |
JP2017182261A (ja) | 情報処理装置、情報処理方法、およびプログラム | |
KR102168812B1 (ko) | 사운드를 제어하는 전자 장치 및 그 동작 방법 | |
KR20170029390A (ko) | 음성 명령 모드 진입 방법 | |
JP4735965B2 (ja) | 遠隔地間対話システム | |
US20210392427A1 (en) | Systems and Methods for Live Conversation Using Hearing Devices | |
JP2018051648A (ja) | ロボット制御装置、ロボット、ロボット制御方法、及びプログラム | |
JP2001188896A (ja) | 情報処理装置および方法、並びに記録媒体 | |
KR20210109722A (ko) | 사용자의 발화 상태에 기초하여 제어 정보를 생성하는 디바이스 및 그 제어 방법 | |
JP2022147921A (ja) | 疑似的接触提示システム、制御プログラムおよび制御方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20190807 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20200715 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20200721 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20200915 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20201020 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20201102 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6798258 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |