JP2017212557A - 制御装置、対話システム、制御方法及びコンピュータプログラム - Google Patents
制御装置、対話システム、制御方法及びコンピュータプログラム Download PDFInfo
- Publication number
- JP2017212557A JP2017212557A JP2016103764A JP2016103764A JP2017212557A JP 2017212557 A JP2017212557 A JP 2017212557A JP 2016103764 A JP2016103764 A JP 2016103764A JP 2016103764 A JP2016103764 A JP 2016103764A JP 2017212557 A JP2017212557 A JP 2017212557A
- Authority
- JP
- Japan
- Prior art keywords
- video
- voice
- information
- unit
- user
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
Abstract
Description
図1は、第一実施形態の対話システム(対話システム1)のシステム構成を表すシステム構成図である。対話システム1は、制御装置10、表示装置20、音声出力装置30及び音声入力装置40を備える。表示装置20、音声出力装置30及び音声入力装置40は、それぞれ制御装置10と通信可能に接続されている。各装置と制御装置10との間の通信の態様はどのようなものであってもよい。例えば、制御装置10と表示装置20とは、映像信号を伝送する映像ケーブルを用いて通信可能に接続されてもよい。例えば、制御装置10と音声出力装置30及び音声入力装置40とは、音声信号を伝送する音声ケーブルを用いて通信可能に接続されてもよい。例えば、制御装置10と各装置とは、Blue tooth(登録商標)等の無線通信を用いて通信可能に接続されてもよい。
音声入力部11は、音声信号の入力インタフェースである。音声入力部11は、音声入力装置40から出力される音声信号を取得する。
音声出力部15は、音声信号の出力インタフェースである。音声出力部15は、音声生成部134によって生成された音声を示す音声信号を音声出力装置30に対して出力する。
第一実施形態において、要素映像情報記憶部121及び要素音声情報記憶部122は、複数の対話相手の情報を記憶してもよい。この場合、応答情報生成部132は、所定の条件に基づいて複数の対話相手の中から一人又は複数の対話相手を選択してもよい。この場合、応答情報生成部132は、選択された対話相手の映像及び音声を生成することを映像生成部133及び音声生成部134に指示する。所定の条件とは、例えばユーザの属性情報(性別、年齢、好みなど)に応じた条件である。ユーザの属性情報は、例えば不図示のカメラで撮影された画像を用いた画像認証や、ユーザが携帯する機器から通信で取得される情報に基づいて判定されてもよい。
図3は、第二実施形態の対話システム(対話システム1a)のシステム構成を表すシステム構成図である。対話システム1aは、制御装置10に代えて制御装置10aを備える点、ネットワーク50を介して制御装置10aに対してサーバ60が通信可能に接続される点、において第一実施形態の対話システム1と異なる。他の構成に関しては、第一実施形態の対話システム1と第二実施形態の対話システム1aとは同じである。
通信部61は、ネットワークカード等の通信インタフェースである。通信部61は、ネットワーク50を介して制御装置10aと通信する。
第二実施形態において、制御部63は、制御装置10aに対して認証処理を実行し、認証された制御装置10aに対してのみ要素映像情報及び要素音声情報を提供するように構成されてもよい。このように構成されることにより、要素映像情報及び要素音声情報を正当な権限を有していないユーザに対して提供してしまうことを抑止することが可能となる。そのため、要素映像情報及び要素音声情報が不当に使用されることを抑止することが可能となる。特に、上述したように有名人の映像及び音声を用いてユーザに対話を提供する場合には、有名人の肖像権などのパブリシティ権が問題になる。このような問題に対し、認証処理を行うことによって映像及び音声について適切な取り扱いが可能となる。
Claims (6)
- ユーザが発話した音声を認識する音声認識部と、
前記音声認識部の認識結果に基づいて、前記ユーザに対する応答内容を示す応答情報を生成する応答情報生成部と、
前記応答情報生成部によって生成された前記応答情報に応じて、前記ユーザの対話相手の映像の一部である要素映像情報を用いて前記対話相手の映像を生成する映像生成部と、
前記応答情報生成部によって生成された前記応答情報に応じて、前記ユーザの対話相手の音声の一部である要素音声情報を用いて前記対話相手の音声を生成する音声生成部と、
映像を表示する表示装置に対して前記映像生成部によって生成された前記映像を出力する映像出力部と、
音声を出力する音声出力装置に対して前記音声生成部によって生成された前記音声を出力する音声出力部と、
を備える制御装置。 - 前記応答情報生成部は、前記認識結果に基づいて、複数の対話相手の中から一又は複数の対話相手を選択し、
前記映像生成部は、選択された対話相手の映像を生成し、
前記音声生成部は、選択された対話相手の音声を生成する、請求項1に記載の制御装置。 - 制御装置及びサーバを備える対話システムであって、
前記制御装置は、
ユーザが発話した音声を認識する音声認識部と、
前記音声認識部の認識結果に基づいて、前記ユーザに対する応答内容を示す応答情報を生成する応答情報生成部と、
前記サーバと通信する通信部と、
前記応答情報生成部によって生成された前記応答情報に応じて、前記ユーザの対話相手の映像の一部である要素映像情報を前記通信部を介して前記サーバから取得し、前記要素映像情報を用いて前記対話相手の映像を生成する映像生成部と、
前記応答情報生成部によって生成された前記応答情報に応じて、前記ユーザの対話相手の音声の一部である要素音声情報を前記通信部を介して前記サーバから取得し、前記要素音声情報を用いて前記対話相手の音声を生成する音声生成部と、
映像を表示する表示装置に対して前記映像生成部によって生成された前記映像を出力する映像出力部と、
音声を出力する音声出力装置に対して前記音声生成部によって生成された前記音声を出力する音声出力部と、
を備え、
前記サーバは、
前記要素映像情報を記憶する要素映像情報記憶部と、
前記要素音声情報を記憶する要素音声情報記憶部と、
を備える、対話システム。 - 前記サーバは、前記制御装置を認証し、認証された制御装置に対してのみ前記要素映像情報及び前記要素音声情報を送信する制御部をさらに備える、請求項3に記載の対話システム。
- ユーザが発話した音声を認識する音声認識ステップと、
前記音声認識ステップの認識結果に基づいて、前記ユーザに対する応答内容を示す応答情報を生成する応答情報生成ステップと、
前記応答情報生成ステップによって生成された前記応答情報に応じて、前記ユーザの対話相手の映像の一部である要素映像情報を用いて前記対話相手の映像を生成する映像生成ステップと、
前記応答情報生成ステップによって生成された前記応答情報に応じて、前記ユーザの対話相手の音声の一部である要素音声情報を用いて前記対話相手の音声を生成する音声生成ステップと、
映像を表示する表示装置に対して前記映像生成ステップによって生成された前記映像を出力する映像出力ステップと、
音声を出力する音声出力装置に対して前記音声生成ステップによって生成された前記音声を出力する音声出力ステップと、
を備える制御方法。 - ユーザが発話した音声を認識する音声認識ステップと、
前記音声認識ステップの認識結果に基づいて、前記ユーザに対する応答内容を示す応答情報を生成する応答情報生成ステップと、
前記応答情報生成ステップによって生成された前記応答情報に応じて、前記ユーザの対話相手の映像の一部である要素映像情報を用いて前記対話相手の映像を生成する映像生成ステップと、
前記応答情報生成ステップによって生成された前記応答情報に応じて、前記ユーザの対話相手の音声の一部である要素音声情報を用いて前記対話相手の音声を生成する音声生成ステップと、
映像を表示する表示装置に対して前記映像生成ステップによって生成された前記映像を出力する映像出力ステップと、
音声を出力する音声出力装置に対して前記音声生成ステップによって生成された前記音声を出力する音声出力ステップと、
をコンピュータに実行させるためのコンピュータプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016103764A JP2017212557A (ja) | 2016-05-24 | 2016-05-24 | 制御装置、対話システム、制御方法及びコンピュータプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016103764A JP2017212557A (ja) | 2016-05-24 | 2016-05-24 | 制御装置、対話システム、制御方法及びコンピュータプログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2017212557A true JP2017212557A (ja) | 2017-11-30 |
Family
ID=60475659
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016103764A Pending JP2017212557A (ja) | 2016-05-24 | 2016-05-24 | 制御装置、対話システム、制御方法及びコンピュータプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2017212557A (ja) |
Citations (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH1195652A (ja) * | 1997-09-25 | 1999-04-09 | Fumio Denda | 聴覚訓練方法および聴覚訓練用音処理方法および聴覚訓練用音処理装置ならびに聴覚訓練用記録媒体 |
JP2001236290A (ja) * | 2000-02-22 | 2001-08-31 | Toshinao Komuro | アバタを利用したコミュニケーション・システム |
JP2001273522A (ja) * | 2000-03-23 | 2001-10-05 | Ntt Comware Corp | キャラクタ画像データ登録システムおよびその記録媒体 |
JP2003248841A (ja) * | 2001-12-20 | 2003-09-05 | Matsushita Electric Ind Co Ltd | バーチャルテレビ通話装置 |
JP2003256862A (ja) * | 2002-02-28 | 2003-09-12 | Sony Communication Network Corp | キャラクタ表示方法および装置 |
JP2003283604A (ja) * | 2002-03-20 | 2003-10-03 | Oki Electric Ind Co Ltd | 表情伝送機能付情報端末装置 |
JP2004158994A (ja) * | 2002-11-05 | 2004-06-03 | Ntt Learning Systems Kk | テレビ電話機能付携帯電話対向自動応答装置及びその動作方法 |
JP2005260626A (ja) * | 2004-03-12 | 2005-09-22 | Oki Electric Ind Co Ltd | 通信端末装置 |
JP2009123148A (ja) * | 2007-11-19 | 2009-06-04 | Hitachi Ltd | 作業担当者選択装置およびその方法 |
JP2012215645A (ja) * | 2011-03-31 | 2012-11-08 | Speakglobal Ltd | コンピュータを利用した外国語会話練習システム |
WO2013065088A1 (ja) * | 2011-11-02 | 2013-05-10 | 三菱電機株式会社 | 雑音抑圧装置 |
JP2013115622A (ja) * | 2011-11-29 | 2013-06-10 | Fujitsu Ltd | 音声情報解析装置および音声情報解析プログラム |
JP2013175066A (ja) * | 2012-02-25 | 2013-09-05 | Kuroda And Partners Kk | 3次元フィギアを構成するデータを配信するための方法、システム、サーバ装置、端末装置およびプログラム |
JP2013201525A (ja) * | 2012-03-23 | 2013-10-03 | Mitsubishi Electric Corp | ビームフォーミング処理装置 |
JP2015220597A (ja) * | 2014-05-16 | 2015-12-07 | 株式会社ニコン | 電子機器及びプログラム |
US20160057083A1 (en) * | 2014-08-22 | 2016-02-25 | FVMC Software LLC | Systems and methods for virtual interaction |
WO2016052470A1 (ja) * | 2014-09-30 | 2016-04-07 | 日本電気株式会社 | 解析装置、解析方法、及び、プログラム |
JP2016085284A (ja) * | 2014-10-23 | 2016-05-19 | Kddi株式会社 | 人の発言に基づいて学習項目に対する評価レベルを推定するプログラム、装置及び方法 |
-
2016
- 2016-05-24 JP JP2016103764A patent/JP2017212557A/ja active Pending
Patent Citations (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH1195652A (ja) * | 1997-09-25 | 1999-04-09 | Fumio Denda | 聴覚訓練方法および聴覚訓練用音処理方法および聴覚訓練用音処理装置ならびに聴覚訓練用記録媒体 |
JP2001236290A (ja) * | 2000-02-22 | 2001-08-31 | Toshinao Komuro | アバタを利用したコミュニケーション・システム |
JP2001273522A (ja) * | 2000-03-23 | 2001-10-05 | Ntt Comware Corp | キャラクタ画像データ登録システムおよびその記録媒体 |
JP2003248841A (ja) * | 2001-12-20 | 2003-09-05 | Matsushita Electric Ind Co Ltd | バーチャルテレビ通話装置 |
JP2003256862A (ja) * | 2002-02-28 | 2003-09-12 | Sony Communication Network Corp | キャラクタ表示方法および装置 |
JP2003283604A (ja) * | 2002-03-20 | 2003-10-03 | Oki Electric Ind Co Ltd | 表情伝送機能付情報端末装置 |
JP2004158994A (ja) * | 2002-11-05 | 2004-06-03 | Ntt Learning Systems Kk | テレビ電話機能付携帯電話対向自動応答装置及びその動作方法 |
JP2005260626A (ja) * | 2004-03-12 | 2005-09-22 | Oki Electric Ind Co Ltd | 通信端末装置 |
JP2009123148A (ja) * | 2007-11-19 | 2009-06-04 | Hitachi Ltd | 作業担当者選択装置およびその方法 |
JP2012215645A (ja) * | 2011-03-31 | 2012-11-08 | Speakglobal Ltd | コンピュータを利用した外国語会話練習システム |
WO2013065088A1 (ja) * | 2011-11-02 | 2013-05-10 | 三菱電機株式会社 | 雑音抑圧装置 |
JP2013115622A (ja) * | 2011-11-29 | 2013-06-10 | Fujitsu Ltd | 音声情報解析装置および音声情報解析プログラム |
JP2013175066A (ja) * | 2012-02-25 | 2013-09-05 | Kuroda And Partners Kk | 3次元フィギアを構成するデータを配信するための方法、システム、サーバ装置、端末装置およびプログラム |
JP2013201525A (ja) * | 2012-03-23 | 2013-10-03 | Mitsubishi Electric Corp | ビームフォーミング処理装置 |
JP2015220597A (ja) * | 2014-05-16 | 2015-12-07 | 株式会社ニコン | 電子機器及びプログラム |
US20160057083A1 (en) * | 2014-08-22 | 2016-02-25 | FVMC Software LLC | Systems and methods for virtual interaction |
WO2016052470A1 (ja) * | 2014-09-30 | 2016-04-07 | 日本電気株式会社 | 解析装置、解析方法、及び、プログラム |
JP2016085284A (ja) * | 2014-10-23 | 2016-05-19 | Kddi株式会社 | 人の発言に基づいて学習項目に対する評価レベルを推定するプログラム、装置及び方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2020203999A1 (ja) | コミュニケーション支援システム、コミュニケーション支援方法、および画像制御プログラム | |
US8830244B2 (en) | Information processing device capable of displaying a character representing a user, and information processing method thereof | |
KR20190038900A (ko) | 단어 흐름 주석 | |
TWI255141B (en) | Method and system for real-time interactive video | |
WO2018155026A1 (ja) | 情報処理装置、情報処理方法、及びプログラム | |
KR20200145700A (ko) | 머신 러닝 기반의 발화 동영상 생성 방법 및 장치 | |
US20230047858A1 (en) | Method, apparatus, electronic device, computer-readable storage medium, and computer program product for video communication | |
KR102540763B1 (ko) | 머신 러닝 기반의 립싱크 영상 생성을 위한 학습 방법 및 이를 수행하기 위한 립싱크 영상 생성 장치 | |
CN110794964A (zh) | 虚拟机器人的交互方法、装置、电子设备及存储介质 | |
WO2018158852A1 (ja) | 通話システム及びコミュニケーションシステム | |
US20240292175A1 (en) | Audio System and Method of Determining Audio Filter Based on Device Position | |
KR102360840B1 (ko) | 텍스트를 이용한 발화 동영상 생성 방법 및 장치 | |
JP2020136921A (ja) | ビデオ通話システム、およびコンピュータプログラム | |
JP6796762B1 (ja) | 仮想人物対話システム、映像生成方法、映像生成プログラム | |
RU2721180C1 (ru) | Способ генерации анимационной модели головы по речевому сигналу и электронное вычислительное устройство, реализующее его | |
JP2023181219A (ja) | 動画配信システム、動画配信方法および動画配信プログラム | |
US11164341B2 (en) | Identifying objects of interest in augmented reality | |
JP2008299135A (ja) | 音声合成装置、音声合成方法、および音声合成用プログラム | |
JP2006065683A (ja) | アバタ通信システム | |
US11368664B2 (en) | Information processing apparatus, information processing method, and program | |
JP2017212557A (ja) | 制御装置、対話システム、制御方法及びコンピュータプログラム | |
JP2002297199A (ja) | 合成音声判別方法と装置及び音声合成装置 | |
JP6980150B1 (ja) | 3次元仮想現実空間提供サーバ、3次元仮想現実空間提供方法、3次元仮想現実空間提供プログラム、3次元仮想現実空間表示制御装置、3次元仮想現実空間表示制御方法、3次元仮想現実空間表示制御プログラムおよび3次元仮想現実空間提供システム | |
CN111091807B (zh) | 语音合成方法、装置、计算机设备及存储介质 | |
JP2005057431A (ja) | テレビ電話端末装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20190122 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20190613 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20190709 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20190909 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20200225 |