JPWO2019053864A1 - 電子機器制御システム、音声出力装置及びそれらの方法 - Google Patents

電子機器制御システム、音声出力装置及びそれらの方法 Download PDF

Info

Publication number
JPWO2019053864A1
JPWO2019053864A1 JP2019541585A JP2019541585A JPWO2019053864A1 JP WO2019053864 A1 JPWO2019053864 A1 JP WO2019053864A1 JP 2019541585 A JP2019541585 A JP 2019541585A JP 2019541585 A JP2019541585 A JP 2019541585A JP WO2019053864 A1 JPWO2019053864 A1 JP WO2019053864A1
Authority
JP
Japan
Prior art keywords
electronic device
voice
communication information
unit
operation instruction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2019541585A
Other languages
English (en)
Other versions
JP6919710B2 (ja
Inventor
江崎 功太郎
功太郎 江崎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Socionext Inc
Original Assignee
Socionext Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Socionext Inc filed Critical Socionext Inc
Publication of JPWO2019053864A1 publication Critical patent/JPWO2019053864A1/ja
Application granted granted Critical
Publication of JP6919710B2 publication Critical patent/JP6919710B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G08SIGNALLING
    • G08CTRANSMISSION SYSTEMS FOR MEASURED VALUES, CONTROL OR SIMILAR SIGNALS
    • G08C23/00Non-electrical signal transmission systems, e.g. optical systems
    • G08C23/04Non-electrical signal transmission systems, e.g. optical systems using light waves, e.g. infrared
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/167Audio in a user interface, e.g. using voice commands for navigating, audio feedback
    • GPHYSICS
    • G08SIGNALLING
    • G08CTRANSMISSION SYSTEMS FOR MEASURED VALUES, CONTROL OR SIMILAR SIGNALS
    • G08C17/00Arrangements for transmitting signals characterised by the use of a wireless electrical link
    • G08C17/02Arrangements for transmitting signals characterised by the use of a wireless electrical link using a radio link
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04QSELECTING
    • H04Q9/00Arrangements in telecontrol or telemetry systems for selectively calling a substation from a main station, in which substation desired apparatus is selected for applying a control signal thereto or for obtaining measured values therefrom
    • GPHYSICS
    • G08SIGNALLING
    • G08CTRANSMISSION SYSTEMS FOR MEASURED VALUES, CONTROL OR SIMILAR SIGNALS
    • G08C2201/00Transmission systems of control signals via wireless link
    • G08C2201/30User interface
    • G08C2201/31Voice input
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems
    • G10L15/30Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Theoretical Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Selective Calling Equipment (AREA)

Abstract

音声認識可能な電子機器(30)の動作を音声により指示する電子機器制御システム(10)は、制御装置(100)と、制御装置(100)と通信可能な音声出力装置(200)と、を備える。制御装置(100)は、操作者(20)から、電子機器(30)への第一動作指示が割り当てられた第一入力を受ける第一入力部(110)と、第一入力部(110)が第一入力を受けた場合に、第一入力に割り当てられた第一動作指示に対応する第一通信用情報を音声出力装置(200)へ送信する送信部(120)と、を備える。音声出力装置(200)は、制御装置(100)から第一通信用情報を受信する受信部(210)と、受信部(210)が第一通信用情報を受信した場合に、第一通信用情報に基づいて、第一動作指示のための第一音声を出力する出力部(220)と、を備える。

Description

本発明は、音声認識可能な電子機器の動作を音声により指示する電子機器制御システム、音声出力装置及びそれらの方法に関する。
最近の情報家電に代表される電子機器には、自然言語ユーザインタフェース(Natural language user interface)を持つものがある。自然言語ユーザインタフェースでは、操作者は、人に話しかけるように電子機器に話しかけることで、電子機器を操作することができる。このとき、電子機器は、操作者の発話の内容を理解し、その内容が電子機器に対する動作の指示であれば、その指示通りに動作する。今後、このような自然言語インタフェースを持つ電子機器は増えてくると考えられる。
特開2002−252884号公報
しかしながら、自然言語インタフェースでは、操作者の発話が正しく認識されずに、電子機器が動作指示を受け付けられない場合もある。例えば、操作者と電子機器との距離が大きい場合、あるいは、怪我や疾病等で操作者の発話が困難な場合には、電子機器は、操作者の発話を正しく認識して動作指示を受け付けることが難しい。
また、電子機器によっては、コマンド送信による動作指示よりも音声入力による動作指示の方が操作の自由度が高い場合があり、このような場合、通信よりも音声による動作指示が優先される。
そこで、本発明は、音声認識可能な電子機器に対する音声による動作指示の成功率を向上させることができる電子機器制御システム、音声出力装置及びそれらの方法を提供する。
本発明の一形態に係る電子機器制御システムは、音声認識可能な電子機器の動作を音声により指示する電子機器制御システムであって、制御装置と、前記制御装置と通信可能な音声出力装置と、を備え、前記制御装置は、操作者から、前記電子機器への第一動作指示が割り当てられた第一入力を受ける第一入力部と、前記第一入力部が前記第一入力を受けた場合に、前記第一入力に割り当てられた前記第一動作指示に対応する第一通信用情報を前記音声出力装置へ送信する送信部と、を備え、前記音声出力装置は、前記制御装置から前記第一通信用情報を受信する受信部と、前記受信部が前記第一通信用情報を受信した場合に、前記第一通信用情報に基づいて、前記第一動作指示のための第一音声を出力する出力部と、を備える。
また、本発明の他の一態様に係る音声出力装置は、電子機器が認識可能な音声を出力する音声出力装置であって、前記電子機器に第一動作指示を行うための第一入力を操作者から受けた制御装置から、前記第一動作指示に対応する第一通信用情報を受信する受信部と、前記受信部が前記第一通信用情報を受信した場合に、前記第一通信用情報に基づいて、前記第一動作指示のための第一音声を出力する出力部と、を備える。
なお、これらの包括的又は具体的な態様は、方法、集積回路、コンピュータプログラム又はコンピュータ読み取り可能なCD−ROMなどの記録媒体で実現されてもよく、方法、集積回路、コンピュータプログラム及び記録媒体の任意な組み合わせで実現されてもよい。
本発明により、音声認識可能な電子機器に対する音声による動作指示の成功率を向上させることができる。
図1は、実施の形態1に係る電子機器制御システムと操作者及び電子機器とを示す図である。 図2は、実施の形態1に係る制御装置の斜視図である。 図3は、実施の形態1に係る電子機器制御システムの機能構成を示すブロック図である。 図4は、実施の形態1に係る電子機器制御システムの動作を示すシーケンス図である。 図5は、実施の形態2に係る電子機器制御システムの機能構成を示すブロック図である。 図6は、実施の形態2に係る電子機器制御システムの動作を示すシーケンス図である。 図7は、実施の形態3に係る電子機器制御システムの機能構成を示すブロック図である。 図8は、実施の形態3に係る電子機器制御システムの動作を示すシーケンス図である。 図9は、実施の形態4に係る電子機器制御システムの機能構成を示すブロック図である。 図10は、実施の形態4に係る電子機器制御システムの動作を示すシーケンス図である。 図11は、実施の形態5に係る電子機器制御システム、電子機器及び表示装置の外観図である。 図12Aは、実施の形態5に係る音声出力装置の前方斜視図である。 図12Bは、実施の形態5に係る音声出力装置の後方斜視図である。
以下、本発明の実施の形態について、図面を用いて詳細に説明する。なお、以下で説明する実施の形態は、いずれも本発明の一具体例を示すものである。以下の実施の形態で示される数値、形状、材料、構成要素、構成要素の配置位置及び接続形態、使用手順、通信手順等は、一例であり、本発明を限定する主旨ではない。また、以下の実施の形態における構成要素のうち、本発明の最上位概念を示す独立請求項に記載されていない構成要素については、任意の構成要素として説明される。また、各図は、必ずしも厳密に図示したものではない。各図において、実質的に同一の構成については同一の符号を付し、重複する説明は省略又は簡略化する。
(実施の形態1)
[電子機器制御システムのハードウェア構成]
まず、本実施の形態に係る電子機器制御システムのハードウェア構成の一例について図1を参照しながら具体的に説明する。図1は、実施の形態1に係る電子機器制御システム10と操作者20及び電子機器30とを示す図である。
電子機器制御システム10は、電子機器30の動作を音声により指示する。電子機器制御システム10は、制御装置100と、制御装置100と通信可能な音声出力装置200と、を備える。
本説明において、制御装置100と通信可能とは、少なくとも制御装置100からデータを受信可能なことを意味する。なお、制御装置100と音声出力装置200との間の通信手段は、特に限定される必要はなく、有線通信及び無線通信のどちらであってもよい。音声出力装置200は、例えば、無線赤外線通信、Bluetooth(登録商標)又は無線LAN(Local area network)等により制御装置100と通信する。
制御装置100は、音声出力装置200を介して電子機器30を操作する。本実施の形態では、制御装置100は、操作者20が遠隔で電子機器30を操作するための遠隔制御装置である。制御装置100は、動作指示に関する通信用情報を無線で音声出力装置200に送信する。なお、制御装置100の詳細な構成については図2を用いて後述する。
音声出力装置200は、制御装置100から受信した通信用情報に基づいて、電子機器30への動作指示のための音声を出力する。
電子機器30は、音声認識可能な機器であり、例えば自然言語ユーザインタフェースを有する。具体的には、電子機器30は、例えばスマートフォン又はタブレットコンピュータである。さらには、広くスマートスピーカーと呼ばれる音声認識ユーザインタフェースを持つ機器(Amazon Echo(登録商標)、Google Home(登録商標)、Line Wave、Apple HomePodなど)や、音声認識可能なリモートコントローラであってもよい。すなわち、電子機器30が最終の制御対象でなくてもよい。なお、音声認識処理は、電子機器30で行われてもよいし、電子機器30と通信可能な音声認識サーバで行われてもよい。
[制御装置のハードウェア構成]
ここで、制御装置100のハードウェア構成の一具体例について図2を参照しながら説明する。図2は、実施の形態1に係る制御装置100の斜視図である。
制御装置100は、タッチパネル101と、操作ボタン102と、カメラ103と、マイクロホン104と、赤外線通信ポート105と、を備える。タッチパネル101は、タッチスクリーンであり、タッチ位置の情報を出力する。タッチ位置には、動作指示が割り当てられている。したがって、操作者20は、タッチパネル101をタッチすることにより、動作指示を入力することができる。
操作ボタン102の各々は、機械的なボタンであり、操作者20に押されたときに電気信号を出力する。操作ボタン102の各々には、動作指示が割り当てられている。したがって、操作者20は、操作ボタン102のいずれかを押下することにより、動作指示を入力することができる。
カメラ103は、操作者20を撮影し、操作者20の映像信号を出力する。この映像信号から、操作者20のジェスチャが検出される。ジェスチャには、動作指示が割り当てられている。したがって、操作者20は、ジェスチャを行うことにより、動作指示を入力することができる。
マイクロホン104は、操作者20の音声を電気信号である音声信号に変換する。音声信号には動作指示が割り当てられている。したがって、操作者20は、音声により動作指示を入力することができる。
赤外線通信ポート105は、データ通信を行うための赤外線が音声出力装置200に出射されるポートである。なお、本実施の形態では、通信手段として、無線赤外線通信が用いられているが、Bluetooth(登録商標)又は無線LANが用いられてもよい。この場合、赤外線通信ポート105の代わりにアンテナなどを備えればよい。
なお、ここでは、制御装置100は、ユーザインタフェースとして、タッチパネル101、操作ボタン102、カメラ103、及びマイクロホン104を備えていたが、これらのすべてを備える必要はない。例えば、制御装置100は、これらの少なくとも1つを備えてもよい。また、制御装置100は、他のユーザインタフェースを備えてもよい。例えば、制御装置100は、動きセンサ(例えば加速度センサ、角速度センサなど)を備えてもよい。これより、操作者20は、制御装置100を動かすことによって動作指示を入力することも可能となる。
[電子機器制御システムの機能構成]
次に、以上のように構成された電子機器制御システム10の機能構成について、図3を参照しながら説明する。図3は、実施の形態1に係る電子機器制御システム10の機能構成を示すブロック図である。電子機器制御システム10は、制御装置100と、音声出力装置200と、を備える。
[制御装置の機能構成]
制御装置100は、第一入力部110と、送信部120と、第一記憶部130と、第一読出部140と、を備える。
第一入力部110は、操作者20から、電子機器30への第一動作指示が割り当てられた第一入力を受ける。第一入力部110は、例えば、タッチパネル101、操作ボタン102、カメラ103、マイクロホン104、又は、それらの任意の組合せによって実現される。
第一動作指示とは、電子機器30に第一動作を行わせる指示である。例えば、第一動作指示は、映像の再生、停止、早送り又は巻き戻しの指示である。
第一入力とは、ユーザインタフェースに対する操作者20の入力である。具体的には、第一入力は、例えば、第一動作指示が割り当てられた操作ボタンの押下、又は、第一動作指示が割り当てられたタッチパネル上の位置のタッチなどである。
送信部120は、第一入力部110が第一入力を受けた場合に、第一動作指示に対応する第一通信用情報を音声出力装置200へ送信する。送信部120は、例えば、赤外線通信ポート105を介して、第一通信用情報を音声出力装置200へ送信する。本実施の形態では、第一通信用情報は、第一音声データである。
音声データとは、デコードすることにより音声を再生できるデータである。つまり、音声データのみを用いて音声が復元されうる。具体的には、音声データは、例えば所定の音声ファイルフォーマットのデジタル音声ファイルである。所定の音声ファイルフォーマットは、非圧縮音声フォーマット(例えばWAV、AIFFなど)及び圧縮音声フォーマットのどちらであってもよい。また、圧縮音声フォーマットは、可逆圧縮音声フォーマット(例えばFLAC、TAKなど)及び不可逆圧縮音声フォーマット(例えば、MP3、AAC、WMAなど)のどちらであってもよい。
第一記憶部130は、複数の第一動作指示に対応付けて複数の第一音声データを記憶している。ここでは、複数の第一音声データは、第一記憶部130に予め格納された初期設定データである。第一記憶部130は、例えば半導体メモリ又はハードディスクドライブによって実現される。
第一読出部140は、第一入力部110が第一入力を受けた場合に、当該第一入力に割り当てられた第一動作指示に対応する第一音声データ131を第一記憶部130から読み出す。第一読出部140は、例えば、専用の電子回路、又は、汎用プロセッサ及びメモリによって実現される。
具体的には、第一読出部140は、第一記憶部130に記憶されている複数の第一音声データの中から、第一入力に割り当てられた第一動作指示に対応する第一音声データ131を読み出す。読み出された第一音声データ131は、送信部120によって音声出力装置200に送信される。
[音声出力装置の機能構成]
音声出力装置200は、受信部210と、出力部220と、を備える。
受信部210は、制御装置100から第一音声データ131を受信する。受信部210は、例えば、赤外線通信ポート(図示せず)を介して第一音声データ131を受信する。
出力部220は、受信部210が第一音声データ131を受信した場合に、第一音声データ131に基づいて、第一動作指示のための第一音声を出力する。出力部220は、例えばスピーカ(図示せず)によって実現される。
この第一音声は、例えば自然言語である。電子機器30は、第一音声を解釈し、第一動作指示を認識することができる。そして、電子機器30は、認識した第一動作指示に従って第一動作を行うことができる。
[電子機器制御システムの動作]
次に、以上のように構成された電子機器制御システム10の動作について図4を参照しながら具体的に説明する。図4は、実施の形態1に係る電子機器制御システム10の動作を示すシーケンス図である。
制御装置100の第一入力部110は、操作者20から、第一動作指示が割り当てられた第一入力を受ける(S101)。制御装置100の第一読出部140は、第一入力に割り当てられた第一動作指示に対応する第一音声データ131を第一記憶部130から読み出す(S102)。制御装置100の送信部120は、第一記憶部130から読み出された第一音声データ131を音声出力装置200に送信する。
音声出力装置200の受信部210は、制御装置100から第一音声データ131を受信する。そして、音声出力装置200の出力部220は、受信された第一音声データ131に基づいて、第一音声を出力する(S103)。
[効果等]
以上のように、本実施の形態に係る電子機器制御システム10によれば、制御装置100が、操作者20から、電子機器30への第一動作指示が割り当てられた第一入力を受けた場合に、音声出力装置200が、第一動作指示のための第一音声を出力することができる。つまり、電子機器制御システム10では、操作者20は、電子機器30に直接的に音声を入力しなくても、電子機器30の動作を音声により指示することができる。したがって、操作者20と電子機器30との距離が大きい場合であっても、音声出力装置200が電子機器30の近くに配置されていれば、音声による動作指示の成功率を向上させることができる。また、怪我や疾病等で操作者20の発話が困難な場合、又は、操作者20が声を出すのが恥ずかしい場合であっても、操作者20は、制御装置100に対して第一入力を行えばよく、電子機器30に対して発話する必要がないので、音声による動作指示の成功率を向上させることができる。
(実施の形態2)
次に、実施の形態2について説明する。本実施の形態では、第一通信用情報として、第一音声データの代わりに第一音声データインデックスが用いられる点が、上記実施の形態1と異なる。以下に、本実施の形態に係る電子機器制御システムについて上記実施の形態1と異なる点を中心に説明する。
[電子機器制御システムの機能構成]
図5は、実施の形態2に係る電子機器制御システム10Aの機能構成を示すブロック図である。本実施の形態に係る電子機器制御システム10Aは、制御装置100Aと、音声出力装置200Aと、を備える。
[制御装置の機能構成]
制御装置100Aは、第一入力部110と、送信部120Aと、第一記憶部130Aと、第一読出部140Aと、を備える。
送信部120Aは、第一入力部110が第一入力を受けた場合に、第一動作指示に対応する第一通信用情報を音声出力装置200Aへ送信する。本実施の形態では、第一通信用情報は、第一音声データインデックスである。
音声データインデックスとは、音声データを識別するための情報である。例えば、音声データインデックスとして、音声データのファイル名を用いることができる。なお、音声データインデックスは、音声データを識別さえできれば、どのような情報であってもよい。例えば、音声出力装置200Aにおいて、音声データと、第一動作指示の識別子又は第一入力の識別子とが対応付けられていれば、音声データインデックスは第一動作指示の識別子又は第一入力の識別子であってもよい。
第一記憶部130Aは、複数の第一動作指示に対応付けて複数の第一音声データインデックスを記憶している。
第一読出部140Aは、第一入力部110が第一入力を受けた場合に、当該第一入力に割り当てられた第一動作指示に対応する第一音声データインデックス131Aを第一記憶部130Aから読み出す。ここで読み出された第一音声データインデックス131Aは、送信部120Aによって音声出力装置200Aに送信される。
[音声出力装置の機能構成]
音声出力装置200Aは、受信部210Aと、出力部220Aと、第二記憶部230Aと、第二読出部240Aと、を備える。
受信部210Aは、制御装置100Aから第一音声データインデックス131Aを受信する。
第二記憶部230Aは、複数の第一音声データインデックスに対応付けて複数の第一音声データを記憶している。第二記憶部230Aは、例えば半導体メモリ又はハードディスクドライブによって実現される。
第二読出部240Aは、受信部210Aによって受信された第一音声データインデックス131Aに対応する第一音声データ231Aを第二記憶部230Aから読み出す。第二読出部240Aは、例えば、専用の電子回路、又は、汎用プロセッサ及びメモリによって実現される。
出力部220Aは、第二読出部240Aによって第二記憶部230Aから読み出された第一音声データ231Aに基づいて、第一動作指示のための第一音声を出力する。
[電子機器制御システムの動作]
次に、以上のように構成された電子機器制御システム10Aの動作について図6を参照しながら具体的に説明する。図6は、実施の形態2に係る電子機器制御システム10Aの動作を示すシーケンス図である。
制御装置100Aの第一入力部110は、操作者20から、第一動作指示が割り当てられた第一入力を受ける(S101)。制御装置100Aの第一読出部140Aは、第一入力に割り当てられた第一動作指示に対応する第一音声データインデックス131Aを第一記憶部130Aから読み出す(S111)。制御装置100Aの送信部120Aは、第一記憶部130Aから読み出された第一音声データインデックス131Aを音声出力装置200Aに送信する。
音声出力装置200Aの受信部210Aは、制御装置100Aから第一音声データインデックス131Aを受信する。そして、音声出力装置200Aの第二読出部240Aは、第一音声データインデックス131Aに対応する第一音声データ231Aを第二記憶部230Aから読み出す(S112)。音声出力装置200Aの出力部220Aは、読み出された第一音声データ231Aに基づいて第一音声を出力する(S113)。
[効果等]
以上のように、本実施の形態に係る電子機器制御システム10Aによれば、制御装置100Aから音声出力装置200Aに送信される第一通信用情報として、第一音声データインデックスを用いることができる。したがって、第一音声データが送信される場合よりも通信量を削減することができる。さらに、制御装置100Aとして従来のリモコンを流用することも容易となる。
(実施の形態3)
次に、実施の形態3について説明する。本実施の形態では、操作者によって第一記憶部に新たな音声データを登録することができる点が、上記実施の形態1及び2と異なる。以下に、本実施の形態に係る電子機器制御システムについて上記実施の形態1及び2と異なる点を中心に説明する。
[電子機器制御システムの機能構成]
図7は、実施の形態3に係る電子機器制御システム10Bの機能構成を示すブロック図である。本実施の形態に係る電子機器制御システム10Bは、制御装置100Bと、音声出力装置200Bと、を備える。
[制御装置の機能構成]
制御装置100Bは、第一入力部110Bと、送信部120Bと、第一記憶部130Bと、第一読出部140Bと、第二入力部150Bと、書込部160Bと、を備える。
第二入力部150Bは、操作者20から、電子機器30への第二動作指示と、当該第二動作指示に対応する第二音声データとの入力を受ける。第二入力部150Bは、例えば、タッチパネル101、操作ボタン102、カメラ103、マイクロホン104、又は、それらの任意の組合せによって実現される。
第二動作指示とは、電子機器30に第二動作を行わせる指示であり、操作者20によって新たに制御装置100Bに登録される指示である。例えば、第二動作指示は、映像の特殊再生(例えば、30秒スキップなど)の指示である。
書込部160Bは、第二入力部150Bが第二動作指示と第二音声データ131Bとの入力を受けた場合に、当該第二動作指示に対応付けて第二音声データ131Bを第一記憶部130Bに書き込む。
第一記憶部130Bは、複数の第一動作指示に対応付けて複数の第一音声データインデックスを記憶している。また、第一記憶部130Bは、書込部160Bによって書き込まれた第二音声データを第二動作指示に対応付けて記憶する。
第一入力部110Bは、操作者20から、第一動作指示が割り当てられた第一入力、又は、第二動作指示が割り当てられた第二入力を受ける。
第二入力とは、ユーザインタフェースに対する入力であり、第二入力部150Bを介して操作者20により第二動作指示が割り当てられた入力である。具体的には、第二入力は、例えば、操作者20によって第二動作指示が割り当てられた操作ボタンの押下、又は、操作者20によって第二動作指示が割り当てられたタッチパネル上の位置のタッチなどである。
第一読出部140Bは、第一入力部110Bが第一入力を受けた場合に、当該第一入力に割り当てられた第一動作指示に対応する第一音声データインデックス131Aを第一記憶部130Bから読み出す。一方、第一入力部110Bが第二入力を受けた場合に、第一読出部140Bは、当該第二入力に割り当てられた第二動作指示に対応する第二音声データ131Bを第一記憶部130Bから読み出す。
送信部120Bは、第一動作指示に対応する第一通信用情報又は第二動作指示に対応する第二通信用情報を音声出力装置200Bに送信する。ここでは、第一通信用情報は、第一音声データインデックス131Aであり、第二通信用情報は、第二音声データ131Bである。したがって、送信部120Bは、第一読出部140Bによって読み出された第一音声データインデックス131A又は第二音声データ131Bを音声出力装置200Bに送信する。
[音声出力装置の機能構成]
音声出力装置200Bは、受信部210Bと、出力部220Bと、第二記憶部230Aと、第二読出部240Bと、を備える。
受信部210Bは、制御装置100から第一音声データインデックス131A又は第二音声データ131Bを受信する。
第二読出部240Bは、受信部210Bが第一音声データインデックス131A及び第二音声データ131Bのどちらを受信したかを判定する。
ここで、受信部210Bが第一音声データインデックス131Aを受信した場合に、第二読出部240Bは、第一音声データインデックス131Aに対応する第一音声データ231Aを第二記憶部230Aから読み出す。そして、出力部220Bは、第二読出部240Bによって読み出された第一音声データ231Aに基づいて、第一動作指示のための第一音声を出力する。
一方、受信部210Bが第二音声データ131Bを受信した場合に、出力部220Bは、受信された第二音声データ131Bに基づいて、第二動作指示のための第二音声を出力する。このとき、第二読出部240Bは、第二記憶部230Aから第一音声データ231Aを読み出さなくてもよい。
この第二音声は、例えば自然言語である。電子機器30は、第二音声を解釈し、第二動作指示を認識することができる。そして、電子機器30は、認識した第二動作指示に従って第二動作を行うことができる。
[電子機器制御システムの動作]
次に、以上のように構成された電子機器制御システム10Bの動作について図8を参照しながら具体的に説明する。図8は、実施の形態3に係る電子機器制御システム10Bの動作を示すシーケンス図である。
制御装置100Bの第二入力部150Bは、操作者20から、電子機器30への第二動作指示と、当該第二動作指示に対応する第二音声データ131Bとの入力を受ける(S121)。例えば、操作者20は、第二動作指示を割り当てるために操作ボタン102を押下しながら、第二動作指示のための第二音声をマイクロホン104へ入力する。
制御装置100Bの書込部160Bは、第二入力部150Bが第二動作指示及び第二音声データ131Bの入力を受けたときに、第二動作指示に対応付けて第二音声データ131Bを第一記憶部130Bに書き込む(S122)。
その後、制御装置100Bの第一入力部110Bは、操作者20から、第一動作指示が割り当てられた第一入力、又は、第二動作指示が割り当てられた第二入力を受ける(S123)。
制御装置100Bの第一読出部140Bは、第一動作指示に対応する第一音声データインデックス131A又は第二動作指示に対応する第二音声データ131Bを第一記憶部130Bから読み出す(S124)。具体的には、第一入力部110Bが第一入力を受けた場合に、第一読出部140Bは、当該第一入力に割り当てられた第一動作指示に対応する第一音声データインデックス131Aを読み出す。一方、第一入力部110Bが第二入力を受けた場合に、第一読出部140Bは、当該第二入力に割り当てられた第二動作指示に対応する第二音声データ131Bを読み出す。
第一読出部140Bによって読み出された第一音声データインデックス131A又は第二音声データ131Bは、送信部120Bを介して音声出力装置200Bに送信される。
音声出力装置200Bの第二読出部240Bは、受信部210Bが第一音声データインデックス131A及び第二音声データ131Bのどちらを受信したかを判定する。ここで、受信部210Bが第一音声データインデックス131Aを受信した場合に、第二読出部240Bは、第一音声データインデックス131Aに対応する第一音声データ231Aを第二記憶部230Aから読み出す(S125)。なお、このステップS125は、受信部210Bが第二音声データを受信した場合にはスキップされるので破線で表されている。
音声出力装置200Bの出力部220Bは、第一動作指示のための第一音声又は第二動作指示のための第二音声を出力する(S126)。具体的には、受信部210Bが第一音声データインデックス131Aを受信した場合に、出力部220Bは、第二読出部240Bによって読み出された第一音声データ231Aに基づいて第一音声を出力する。また、受信部210Bが第二音声データ131Bを受信した場合に、出力部220Bは、受信された第二音声データ131Bに基づいて第二音声を出力する。
[効果等]
以上のように、本実施の形態に係る電子機器制御システム10によれば、制御装置100Bにおいて予め保持される第一通信用情報として、第一音声データインデックスを用いることができ、制御装置100Bにおいて新たに登録される第二通信用情報として、第二音声データを用いることができる。したがって、操作者20は、第二動作指示に対応する第二音声データの入力を制御装置100Bで行うことができる。つまり、制御装置100Bは、例えば操作者20の音声を録音することで第二音声データを取得することができる。したがって、操作者20は、音声出力装置200に第二音声データを入力する必要がなく、操作者20の利便性を向上させることができる。さらに、第一通信用情報については、第一音声データではなく第一音声データインデックスを送信することができ、通信量を削減することができる。
なお、本実施の形態では、制御装置100Bから音声出力装置200Bに、第一音声データインデックス131A又は第二音声データ131Bが第一通信用情報又は第二通信用情報として送信されていたが、第一通信用情報及び第二通信用情報はこれに限定されない。
例えば、第一通信用情報及び第二通信用情報は、ともに音声データであってもよい。この場合、音声出力装置200Bは、第二読出部240B及び第二記憶部230Aを備えなくてもよい。したがって、音声出力装置200Bの構成を簡便化することができる。
また例えば、第一通信用情報及び第二通信用情報は、ともに音声データインデックスであってもよい。この場合、音声出力装置200Bの第二記憶部230Aは、さらに、第二音声データインデックスに対応付けて第二音声データを記憶すればよい。そして、第二読出部240Bは、受信部210Bが第二通信用情報として第二音声データインデックスを受信した場合に、第二音声データインデックスに対応する第二音声データを第二記憶部230Aから読み出せばよい。これにより、制御装置100Bから音声出力装置200Bへの通信量をさらに削減することができる。
(実施の形態4)
次に、実施の形態4について説明する。本実施の形態では、電子機器に音声入力が受け付けられなかった場合に、音声の言語を変更することができる点が、上記各実施の形態と異なる。以下に、本実施の形態に係る電子機器制御システムについて上記各実施の形態と異なる点を中心に説明する。
[電子機器制御システムの機能構成]
図9は、実施の形態4に係る電子機器制御システム10Cの機能構成を示すブロック図である。本実施の形態に係る電子機器制御システム10Cは、制御装置100Aと、音声出力装置200Cと、を備える。
[音声出力装置の機能構成]
音声出力装置200Cは、受信部210Aと、出力部220Cと、第二記憶部230Cと、第二読出部240Cと、判定部250Cと、を備える。
第二記憶部230Cは、複数の第一音声データインデックスに対応付けて、複数の第一言語音声データ及び複数の第二言語音声データを記憶している。
第一言語音声データとは、第一言語で発せられる音声のデータである。第一言語とは、予め定められた任意の言語である。第一言語は、例えば日本語である。なお、第一言語は、操作者20の母語を意味しているわけではない。したがって、第一言語は、操作者20の母語以外の言語であってもよい。
第二言語音声データとは、第二言語で発せられる音声のデータである。第二言語とは、第一言語と異なる言語である。第二言語は、例えば英語である。なお、第二言語は、操作者20が使用可能な母語以外の言語を意味しているわけではない。したがって、第二言語は、操作者20が使用不可能な言語であってもよい。
第二読出部240Cは、受信部210Aによって受信された第一音声データインデックス131Aに対応する第一言語音声データ231Cを第二記憶部230Cから読み出す。
出力部220Cは、第二読出部240Cによって第二記憶部230Cから読み出された第一言語音声データ231Cに基づいて、第一動作指示のための第一音声を第一言語で出力する。
判定部250Cは、電子機器30が第一言語での第一音声による第一動作指示を受け付けたか否かを判定する。判定部250Cは、例えば、専用の電子回路、又は、汎用プロセッサ及びメモリによって実現される。
具体的には、判定部250Cは、例えば、電子機器30から出力される受付/非受付を示す音声を検出することにより、第一動作指示の受付/非受付を判定する。受付を示す音声は、例えば、「第一動作を行います。」などである。非受付を示す音声は、例えば、「すみません、よくわかりません。」などである。なお、これらは、受付/非受付を示す音声の一例であり、これらに限定されない。また、受付/非受付の判定に用いられる情報は、電子機器30から出力される音声に限定されない。例えば、判定部250Cは、電子機器30から、受付/非受付を示す通知データを受信し、当該通知データに基づいて判定を行ってもよい。
ここで、電子機器30が第一言語での第一音声による第一動作指示を受け付けなかったと判定された場合に、第二読出部240Cは、第一音声データインデックス131Aに対応する第二言語音声データ232Cを第二記憶部230Cから読み出す。そして、出力部220Cは、第二読出部240Cによって第二記憶部230Cから読み出された第二言語音声データ232Cに基づいて、第一動作指示のための第一音声を第二言語で出力する。
[電子機器制御システムの動作]
次に、以上のように構成された電子機器制御システム10Cの動作について図10を参照しながら具体的に説明する。図10は、実施の形態4に係る電子機器制御システム10Cの動作を示すシーケンス図である。
音声出力装置200Cの第二読出部240Cは、制御装置100Aから受信した第一音声データインデックス131Aに対応する第一言語音声データ231Cを第二記憶部230Cから読み出す(S131)。そして、音声出力装置200Cの出力部220Cは、読み出された第一言語音声データ231Cに基づいて、第一動作指示のための第一音声を第一言語で出力する(S132)。
判定部250Cは、電子機器30が第一言語での第一音声による第一動作指示を受け付けたか否かを判定する(S133)。ここで、電子機器30が第一言語での第一動作指示を受け付けなかったと判定された場合、第二読出部240Cは、第一音声データインデックス131Aに対応する第二言語音声データ232Cを第二記憶部230Cから読み出す(S134)。そして、出力部220Cは、読み出された第二言語音声データ232Cに基づいて、第一動作指示のための第一音声を第二言語で出力する(S135)。
一方、電子機器30が第一言語での第一音声による第一動作指示が受け付けられたと判定された場合、ステップS134及びステップS135はスキップされる。
[効果等]
以上のように、本実施の形態に係る電子機器制御システム10Cによれば、電子機器30が第一言語での第一音声による第一動作指示を受け付けなかったと判定された場合に、第一言語と異なる第二言語で第一音声を出力することができる。したがって、電子機器30で認識不可能あるいは受付不可能な言語で第一音声が出力された場合に、第一音声の言語を切り替えることができ、第一動作指示の成功率を向上させることができる。
なお、本実施の形態では、第一音声データインデックスに対応付けて第二言語音声データが音声出力装置200Cに保持されていたが、第二言語音声データは、他の装置から取得されてもよい。例えば、音声出力装置200Cは、第一言語での第一音声による第一動作指示が受け付けられなかった場合に、第一言語音声データを自動翻訳サーバに送信し、自動翻訳サーバから第一言語音声データの翻訳結果として第二言語音声データを受信してもよい。
(実施の形態5)
次に、実施の形態5について説明する。本実施の形態では、上記各実施の形態における音声出力装置200Cの一具体例について説明する。
[音声出力装置のハードウェア構成]
音声出力装置200の一具体例について、図11〜図12Bを参照しながら説明する。図11は、実施の形態5に係る電子機器制御システム10、電子機器30及び表示装置40の外観図である。図12Aは、実施の形態5に係る音声出力装置200の前方斜視図である。図12Bは、実施の形態5に係る音声出力装置200の後方斜視図である。
電子機器30は、長方形状の画面を有する携帯情報端末である。例えば、電子機器30は、インターネット又は電話網に接続して通信したり、様々なアプリケーション(ソフトウェアプログラム)を実行したりするスマートフォンあるいはタブレットコンピュータ等である。
表示装置40は、画面及びスピーカを有し、音声出力装置200から入力される映像音響信号に基づいて、映像を画面に表示し、音響をスピーカから出力する。
音声出力装置200は、電子機器30を着脱可能に保持する卓上型のクレードル又はドッキングステーションである。音声出力装置200は、長方形状の画面を有する電子機器30から出力される映像音響信号を表示装置40に中継する。
図12A及び図12Bに示すように、音声出力装置200は、筐体201と、コネクタ202と、外部インタフェース203と、赤外線通信ポート204と、電源端子205と、スピーカ206と、を備える。
筐体201は、略三角柱形状を有し、三角柱の一側面に相当する前面に電子機器30を保持するための保持部201aを有する。筐体201は、例えば、成型加工された樹脂で構成される。筐体201内には、上記各実施の形態における第二読出部などとして機能する、制御回路(図示せず)、又は、プロセッサ及びメモリ(いずれも図示せず)が収納されている。
コネクタ202は、筐体201に設けられており、電子機器30とケーブルを介さずに直接接続される。ここでは、コネクタ202は、電子機器30が有する充電及び通信用の専用コネクタ(例えば、ライトニングコネクタ、USB等)に直接差し込まれる接続端子である。音声出力装置200は、コネクタ202を介して、電子機器30に電力を供給する。また、音声出力装置200は、コネクタ202を介して、電子機器30から映像音響信号を受信する。
外部インタフェース203は、筐体201に設けられており、表示装置40に接続される。具体的には、外部インタフェース203は、映像音響信号を伝送するための通信インタフェース(例えば、HDMI(登録商標)(High−Definition Multimedia Interface))である。外部インタフェース203には、通信ケーブル60が接続される。
赤外線通信ポート204は、制御装置100から通信用情報を赤外線で受信する。
電源端子205は、AC−DCアダプタ又はAC電源ケーブル等の電源コード50が差し込まれるメス型のコネクタである。電源コード50は、商用電源に接続される。
スピーカ206は、制御回路からの信号に基づいて、第一動作指示のための第一音声又は第二動作指示のための第二音声を出力する。つまり、スピーカ206は、上記各実施の形態における出力部として機能する。
なお、本実施の形態では、音声出力装置200は、コネクタ202を介して、電子機器30から映像音響信号を受信したが、これに限定されない。つまり、音声出力装置200は、コネクタ202を介して電子機器30から映像音響信号を受信しなくてもよい。
(他の実施の形態)
以上、本発明の1つまたは複数の態様に係る電子機器制御システムについて、実施の形態に基づいて説明したが、本発明は、この実施の形態に限定されるものではない。本発明の趣旨を逸脱しない限り、当業者が思いつく各種変形を本実施の形態に施したものや、異なる実施の形態における構成要素を組み合わせて構築される形態も、本発明の1つまたは複数の態様の範囲内に含まれてもよい。
例えば、実施の形態3と実施の形態4とは組み合わされてもよい。この場合、実施の形態4に係る電子機器制御システム10Cは、制御装置100Aの代わりに制御装置100Bを備えてもよい。
なお、上記各実施の形態では、第一記憶部は、制御装置に含まれていたが、これに限られない。例えば、第一記憶部は、制御装置に接続された外部記憶装置に含まれてもよい。また、上記実施の形態2〜4では、第二記憶部は、音声出力装置に含まれていたが、これに限られない。例えば、第二記憶部は、音声出力装置に接続された外部記憶装置に含まれてもよい。
なお、上記各実施の形態では、電子機器30は、自然言語インタフェースを有していたが、音声インタフェースはこれに限られない。例えば、電子機器30は、キーワードの入力を受ける音声インタフェースであってもよい。
また、上記各実施の形態における制御装置又は音声出力装置が備える構成要素の一部又は全部は、1個のシステムLSI(Large Scale Integration:大規模集積回路)から構成されているとしてもよい。例えば、制御装置100は、第一読出部140を有するシステムLSIから構成されてもよい。
システムLSIは、複数の構成部を1個のチップ上に集積して製造された超多機能LSIであり、具体的には、マイクロプロセッサ、ROM(Read Only Memory)、RAM(Random Access Memory)などを含んで構成されるコンピュータシステムである。前記ROMには、コンピュータプログラムが記憶されている。前記マイクロプロセッサが、前記コンピュータプログラムに従って動作することにより、システムLSIは、その機能を達成する。
なお、ここでは、システムLSIとしたが、集積度の違いにより、IC、LSI、スーパーLSI、ウルトラLSIと呼称されることもある。また、集積回路化の手法はLSIに限るものではなく、専用回路又は汎用プロセッサで実現してもよい。LSI製造後に、プログラムすることが可能なFPGA(Field Programmable Gate Array)、あるいはLSI内部の回路セルの接続や設定を再構成可能なリコンフィギュラブル・プロセッサを利用してもよい。
さらには、半導体技術の進歩または派生する別技術によりLSIに置き換わる集積回路化の技術が登場すれば、当然、その技術を用いて機能ブロックの集積化を行ってもよい。バイオ技術の適用等が可能性としてありえる。
また、本発明の一態様は、このような電子機器制御システムだけではなく、電子機器制御システムに含まれる音声出力装置であってもよい。また、電子機器制御システム又は音声出力装置に含まれる特徴的な構成要素をステップとする電子機器制御方法又は音声出力方法であってもよい。また、本発明の一態様は、音声出力方法に含まれる特徴的な各ステップをコンピュータに実行させるコンピュータプログラムであってもよい。また、本発明の一態様は、そのようなコンピュータプログラムが記録された、コンピュータ読み取り可能な非一時的な記録媒体であってもよい。
なお、上記各実施の形態において、各構成要素は、専用のハードウェアで構成されるか、各構成要素に適したソフトウェアプログラムを実行することによって実現されてもよい。各構成要素は、CPUまたはプロセッサなどのプログラム実行部が、ハードディスクまたは半導体メモリなどの記録媒体に記録されたソフトウェアプログラムを読み出して実行することによって実現されてもよい。ここで、上記各実施の形態の音声出力装置などを実現するソフトウェアは、次のようなプログラムである。
すなわち、このプログラムは、コンピュータに、電子機器が認識可能な音声を出力する音声出力方法であって、前記電子機器に第一動作指示を行うための第一入力を操作者から受けた制御装置から、前記第一動作指示に対応する第一通信用情報を受信するステップと、前記第一通信用情報を受信した場合に、前記第一通信用情報に基づいて、前記第一動作指示のための第一音声を出力するステップと、を含む、音声出力方法を実行させる。
本発明は、音声認識可能な電子機器の動作を音声により指示する電子機器制御システム又は音声出力装置として利用することができる。
10、10A、10B、10C 電子機器制御システム
20 操作者
30 電子機器
40 表示装置
50 電源コード
60 通信ケーブル
100、100A、100B 制御装置
101 タッチパネル
102 操作ボタン
103 カメラ
104 マイクロホン
105、204 赤外線通信ポート
110、110B 第一入力部
120、120A、120B 送信部
130、130A、130B 第一記憶部
131、231A 第一音声データ
131A 第一音声データインデックス
131B 第二音声データ
140、140A、140B 第一読出部
150B 第二入力部
160B 書込部
200、200A、200B、200C 音声出力装置
201 筐体
202 コネクタ
203 外部インタフェース
205 電源端子
206 スピーカ
210、210A、210B 受信部
220、220A、220B、220C 出力部
230A、230C 第二記憶部
231C 第一言語音声データ
232C 第二言語音声データ
240A、240B、240C 第二読出部
250C 判定部

Claims (13)

  1. 音声認識可能な電子機器の動作を音声により指示する電子機器制御システムであって、
    制御装置と、
    前記制御装置と通信可能な音声出力装置と、を備え、
    前記制御装置は、
    操作者から、前記電子機器への第一動作指示が割り当てられた第一入力を受ける第一入力部と、
    前記第一入力部が前記第一入力を受けた場合に、前記第一入力に割り当てられた前記第一動作指示に対応する第一通信用情報を前記音声出力装置へ送信する送信部と、を備え、
    前記音声出力装置は、
    前記制御装置から前記第一通信用情報を受信する受信部と、
    前記受信部が前記第一通信用情報を受信した場合に、前記第一通信用情報に基づいて、前記第一動作指示のための第一音声を出力する出力部と、を備える、
    電子機器制御システム。
  2. 前記制御装置は、さらに、
    複数の第一動作指示に対応付けて複数の第一通信用情報を記憶している第一記憶部と、
    前記第一入力部が前記第一入力を受けた場合に、前記第一入力に割り当てられた前記第一動作指示に対応する前記第一通信用情報を前記第一記憶部から読み出す第一読出部と、を備える、
    請求項1に記載の電子機器制御システム。
  3. 前記制御装置は、さらに、
    前記操作者から、前記電子機器への第二動作指示と、前記第二動作指示に対応する第二通信用情報との入力を受ける第二入力部と、
    前記第二入力部が前記第二動作指示と前記第二通信用情報との入力を受けた場合に、前記第二動作指示に対応付けて前記第二通信用情報を前記第一記憶部に書き込む書込部を備え、
    前記第一入力部は、さらに、前記操作者から、前記第二動作指示が割り当てられた第二入力を受け、
    前記第一入力部が前記第二入力を受けた場合に、
    (i)前記第一読出部は、前記第二動作指示に対応する前記第二通信用情報を前記第一記憶部から読み出し、
    (ii)前記送信部は、前記第一読出部により読み出された前記第二通信用情報を前記音声出力装置に送信し、
    前記受信部は、さらに、前記制御装置から前記第二通信用情報を受信し、
    前記出力部は、前記受信部が前記第二通信用情報を受信した場合に、前記第二通信用情報に基づいて、前記第二動作指示のための第二音声を出力する、
    請求項2に記載の電子機器制御システム。
  4. 前記第一通信用情報及び前記第二通信用情報は、音声データである、
    請求項3に記載の電子機器制御システム。
  5. 前記第一通信用情報及び前記第二通信用情報は、音声データインデックスであり、
    前記音声出力装置は、さらに、
    複数の音声データインデックスに対応付けて複数の音声データを記憶している第二記憶部と、
    前記第一通信用情報又は前記第二通信用情報に対応する音声データを前記第二記憶部から読み出す第二読出部と、を備え、
    前記出力部は、前記第二読出部により読み出された音声データに基づいて前記第一音声又は前記第二音声を出力する、
    請求項3に記載の電子機器制御システム。
  6. 前記第一通信用情報は、第一音声データインデックスであり、
    前記第二通信用情報は、第二音声データであり、
    前記音声出力装置は、さらに、
    複数の第一音声データインデックスに対応付けて複数の第一音声データを記憶している第二記憶部と、
    前記受信部が前記第一通信用情報を受信した場合に、前記第一通信用情報である前記第一音声データインデックスに対応する第一音声データを前記第二記憶部から読み出す第二読出部と、を備え、
    前記出力部は、
    (i)前記受信部が前記第一通信用情報を受信した場合に、前記第二読出部により読み出された前記第一音声データに基づいて前記第一音声を出力し、
    (ii)前記受信部が前記第二通信用情報を受信した場合に、前記第二通信用情報である前記第二音声データに基づいて前記第二音声を出力する、
    請求項3に記載の電子機器制御システム。
  7. 前記出力部は、前記第一音声を第一言語で出力し、
    前記音声出力装置は、さらに、
    前記電子機器が前記第一言語での前記第一音声による前記第一動作指示を受け付けたか否かを判定する判定部を備え、
    前記出力部は、前記電子機器が前記第一言語での前記第一音声による前記第一動作指示を受け付けなかったと判定された場合に、さらに、前記第一音声を前記第一言語と異なる第二言語で出力する、
    請求項1〜6のいずれか1項に記載の電子機器制御システム。
  8. 前記第一入力部は、タッチパネル、操作ボタン、カメラ及びマイクロホンの少なくとも1つを含む、
    請求項1〜7のいずれか1項に記載の電子機器制御システム。
  9. 前記音声出力装置は、さらに、
    前記電子機器を着脱可能に保持する筐体と、
    前記筐体に保持された前記電子機器に接続され、前記電子機器に電力を供給するコネクタと、
    前記出力部として機能するスピーカと、を備える、
    請求項1〜8のいずれか1項に記載の電子機器制御システム。
  10. 前記音声出力装置は、さらに、表示装置に接続される外部インタフェースを備え、
    前記音声出力装置は、
    前記コネクタを介して、前記電子機器から映像音響信号を受信し、
    前記外部インタフェースを介して、前記映像音響信号を前記表示装置に出力する、
    請求項9に記載の電子機器制御システム。
  11. 音声認識可能な電子機器の動作を音声により指示する電子機器制御方法であって、
    制御装置を介して、操作者から、前記電子機器への第一動作指示が割り当てられた第一入力を受けるステップと、
    前記第一入力を受けた場合に、前記第一入力に割り当てられた前記第一動作指示に対応する第一通信用情報を前記制御装置から音声出力装置へ送信するステップと、
    前記音声出力装置が、前記第一通信用情報を受信した場合に、前記第一通信用情報に基づいて、前記第一動作指示のための第一音声を出力するステップと、を含む、
    電子機器制御方法。
  12. 電子機器が認識可能な音声を出力する音声出力装置であって、
    前記電子機器に第一動作指示を行うための第一入力を操作者から受けた制御装置から、前記第一動作指示に対応する第一通信用情報を受信する受信部と、
    前記受信部が前記第一通信用情報を受信した場合に、前記第一通信用情報に基づいて、前記第一動作指示のための第一音声を出力する出力部と、を備える、
    音声出力装置。
  13. 電子機器が認識可能な音声を出力する音声出力方法であって、
    前記電子機器に第一動作指示を行うための第一入力を操作者から受けた制御装置から、前記第一動作指示に対応する第一通信用情報を受信するステップと、
    前記第一通信用情報を受信した場合に、前記第一通信用情報に基づいて、前記第一動作指示のための第一音声を出力するステップと、を含む、
    音声出力方法。
JP2019541585A 2017-09-14 2017-09-14 電子機器制御システム、音声出力装置及びそれらの方法 Active JP6919710B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2017/033360 WO2019053864A1 (ja) 2017-09-14 2017-09-14 電子機器制御システム、音声出力装置及びそれらの方法

Publications (2)

Publication Number Publication Date
JPWO2019053864A1 true JPWO2019053864A1 (ja) 2020-08-27
JP6919710B2 JP6919710B2 (ja) 2021-08-18

Family

ID=65723562

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019541585A Active JP6919710B2 (ja) 2017-09-14 2017-09-14 電子機器制御システム、音声出力装置及びそれらの方法

Country Status (4)

Country Link
US (1) US11455993B2 (ja)
JP (1) JP6919710B2 (ja)
CN (1) CN111108755B (ja)
WO (1) WO2019053864A1 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7474084B2 (ja) 2020-03-17 2024-04-24 アイホン株式会社 インターホンシステム
CN112489413B (zh) * 2020-11-27 2022-01-11 京东方科技集团股份有限公司 遥控器的控制方法及系统、存储介质、电子设备

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03203797A (ja) * 1989-12-29 1991-09-05 Pioneer Electron Corp 音声リモートコントロール装置
JP2000020091A (ja) * 1998-07-03 2000-01-21 Olympus Optical Co Ltd 音声記録再生装置
JP2001175284A (ja) * 1999-12-15 2001-06-29 Olympus Optical Co Ltd 音声記録再生装置
JP2012194215A (ja) * 2011-03-15 2012-10-11 Panasonic Corp 音声読上げシステム、音声読上げ装置、音声操作装置及び音声読上げ方法

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5267323A (en) 1989-12-29 1993-11-30 Pioneer Electronic Corporation Voice-operated remote control system
JPH07154874A (ja) 1993-12-01 1995-06-16 Toshiba Corp キー入力応答装置
JPH09319297A (ja) * 1996-05-29 1997-12-12 Hitachi Ltd 音声筆談器
US5991726A (en) * 1997-05-09 1999-11-23 Immarco; Peter Speech recognition devices
JP2001053894A (ja) 1999-08-06 2001-02-23 Ricoh Co Ltd ファクシミリ装置
JP4581163B2 (ja) * 1999-10-29 2010-11-17 ダイキン工業株式会社 音声応答遠隔制御システムおよび音声応答遠隔制御装置
JP2002252884A (ja) 2001-02-23 2002-09-06 Sharp Corp ワイヤレスリモコン
US7127401B2 (en) * 2001-03-12 2006-10-24 Ge Medical Systems Global Technology Company, Llc Remote control of a medical device using speech recognition and foot controls
EP1691345A4 (en) * 2003-12-05 2008-08-13 Kenwood Corp DEVICE CONTROLLER, LANGUAGE DETECTION DEVICE, AGENT SETUP, DATA STRUCTURE, AND SETUP CONTROL METHOD
CN101115088A (zh) * 2007-08-07 2008-01-30 周运南 聋哑人专用手机
CN201622839U (zh) * 2009-12-16 2010-11-03 比亚迪股份有限公司 一种无线语音汽车远程控制系统
US9698999B2 (en) * 2013-12-02 2017-07-04 Amazon Technologies, Inc. Natural language control of secondary device
KR102188090B1 (ko) * 2013-12-11 2020-12-04 엘지전자 주식회사 스마트 가전제품, 그 작동방법 및 스마트 가전제품을 이용한 음성인식 시스템
KR102215579B1 (ko) * 2014-01-22 2021-02-15 삼성전자주식회사 대화형 시스템, 디스플레이 장치 및 그 제어 방법
KR102318006B1 (ko) * 2014-08-21 2021-10-27 삼성전자 주식회사 전자장치 및 전자장치의 오디오 출력 조절 방법
CN105185378A (zh) * 2015-10-20 2015-12-23 珠海格力电器股份有限公司 声控方法、声控系统及能够进行声控的空调
TW201717655A (zh) * 2015-11-05 2017-05-16 宏碁股份有限公司 語音控制方法及語音控制系統

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03203797A (ja) * 1989-12-29 1991-09-05 Pioneer Electron Corp 音声リモートコントロール装置
JP2000020091A (ja) * 1998-07-03 2000-01-21 Olympus Optical Co Ltd 音声記録再生装置
JP2001175284A (ja) * 1999-12-15 2001-06-29 Olympus Optical Co Ltd 音声記録再生装置
JP2012194215A (ja) * 2011-03-15 2012-10-11 Panasonic Corp 音声読上げシステム、音声読上げ装置、音声操作装置及び音声読上げ方法

Also Published As

Publication number Publication date
US20200202861A1 (en) 2020-06-25
JP6919710B2 (ja) 2021-08-18
WO2019053864A1 (ja) 2019-03-21
CN111108755A (zh) 2020-05-05
CN111108755B (zh) 2022-04-01
US11455993B2 (en) 2022-09-27

Similar Documents

Publication Publication Date Title
US8760265B2 (en) Remote control signal learning and processing by a host device and accessory
EP2698704B1 (en) Method and device for displaying image
EP2078384B1 (en) Remote control of device with media player wirelessly connected to a display
US10678563B2 (en) Display apparatus and method for controlling display apparatus
EP3267437B1 (en) Interactive peripheral device for television karaoke.
CN105159672B (zh) 远程协助方法和客户端
US20210398527A1 (en) Terminal screen projection control method and terminal
US20140092004A1 (en) Audio information and/or control via an intermediary device
KR101561362B1 (ko) 액세서리에 의한 텍스트 예측 결과들의 선택
KR20170093508A (ko) 오디오 처리 장치 및 오디오 처리 방법
KR102206866B1 (ko) 전자 장치 및 전자 장치에서 촬영 방법
KR20200097444A (ko) 음성을 기반으로 그래픽 데이터를 제공하는 전자 장치 및 그의 동작 방법
CN107801074B (zh) 显示系统及其控制方法
CN105554631B (zh) 音频切换方法、装置及电子设备
JP6919710B2 (ja) 電子機器制御システム、音声出力装置及びそれらの方法
JP2021177418A (ja) 電子機器の通訳機能提供方法およびイヤセット機器
CN109189313B (zh) 移动装置及其控制方法
CN111556406B (zh) 音频处理方法、音频处理装置及耳机
US20170126960A1 (en) Communication apparatus and method of controlling same
US20160239256A1 (en) Electronic Apparatus and Operation Mode Enabling Method Thereof
CN106776424A (zh) 接头及其控制方法、控制装置和电子设备
CN104951307A (zh) 设备控制方法、装置及开发板

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200819

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20210622

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20210705

R150 Certificate of patent or registration of utility model

Ref document number: 6919710

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150