JP2020118823A - 電子機器 - Google Patents
電子機器 Download PDFInfo
- Publication number
- JP2020118823A JP2020118823A JP2019009071A JP2019009071A JP2020118823A JP 2020118823 A JP2020118823 A JP 2020118823A JP 2019009071 A JP2019009071 A JP 2019009071A JP 2019009071 A JP2019009071 A JP 2019009071A JP 2020118823 A JP2020118823 A JP 2020118823A
- Authority
- JP
- Japan
- Prior art keywords
- voice
- memory
- voice command
- button
- electronic device
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Selective Calling Equipment (AREA)
Abstract
【課題】ユーザーが、容易に、電子機器を操作可能とすること。【解決手段】スピーカー装置1は、音声コマンドを記憶するためのメモリ3と、所定の操作に基づいて、メモリ3に記憶されている音声コマンドを、音声認識機能を有するクラウドサーバーに送信するSoC2と、を備える。所定の操作は、プリセットボタン8の操作である。また、プリセットボタン8は、複数であり、SoC2は、いずれかのプリセットボタン8への操作があった場合、プリセットボタン8に対応する、メモリ3に記憶されている音声コマンドを、クラウドサーバーに送信する。【選択図】図2
Description
本発明は、音声認識機能を利用する電子機器に関する。
音声認識機能を利用する電子機器の中には、所定のキーワード(以下、「ホットワード」という。)を認識した後、音声コマンドを受け付けるようになっているものがある(例えば、特許文献1参照。)。特許文献1では、ホットワードとして、「オーケーコンピュータ」が記載されている(図1参照。)。従って、ユーザーは、まず、ホットワードを発話した後、例えば、「音楽を再生して」等の音声コマンドを発話する。ユーザーは、音声コマンドにより、電子機器を制御できるため、ボタン等を操作する必要がなく、非常に便利である。しかし、ユーザーは、日常、定期的に行う操作に対しても、ホットワードを含む、音声コマンドを流暢に発話する必要がある。流暢に発話することは、簡単なように思われるが、実際は、簡単な作業ではなく、定期的に繰り返し行うことは、ユーザーにとって負担となる。
例えば、音楽サービスのお気に入りのプレイリストを聞きたいときの音声コマンドは、コマンド自体が長くなる。例えば、ユーザーは、「オッケーコンピュータ、音楽サービスAで、プレイリスト、夜のランニング用アールアンドビー、ミドルテンポ編をかけて。」と発話する必要がある。また、例えば、インターネットラジオで、お気に入りの放送局を聴きたいときの音声コマンドは、日本語・英語混在コマンドとなる場合がある。例えば、ユーザーは、「オッケーコンピュータ、インターネットラジオで、one-hundred eighty one dot FM soulをかけて。」と発話する必要がある。また、例えば、カスタムの音声コマンドであるカスタムスキルのスマートホーム機器へのコマンドは、元々の音声コマンドに比べ、冗長である。例えば、ユーザーは、「オッケーコンピュータ、家電リモコンでテレビをつけて。」と発話する必要がある。
上述したように、ユーザーにとって、音声コマンドを発話するのは、困難な場合がある。
本発明の目的は、ユーザーが、容易に、電子機器を操作可能とすることである。
第1の発明の電子機器は、音声コマンドを記憶するためのメモリと、所定の操作に基づいて、前記メモリに記憶されている音声コマンドを、音声認識機能を有するサーバーに送信する制御部と、を備えることを特徴とする。
本発明では、制御部は、所定の操作に基づいて、メモリに記憶されている音声コマンドを、音声認識機能を有するサーバーに送信する。これにより、ユーザーは、所定の操作を行うのみで、例えば、ユーザーが所望の音楽データが、サーバーから電子機器に送信され、電子機器が、音楽データに基づいて、音楽を再生するため、容易に、電子機器を操作することができる。また、サーバー側の仕様を変更する必要もなく、これらの機能を追加することができる。
第2の発明の電子機器は、第1の発明の電子機器において、ボタンを備え、前記所定の操作は、前記ボタンの操作であることを特徴とする。
本発明では、所定の操作は、ボタンの操作である。このため、ユーザーは、ボタンを操作することで、容易に、電子機器を操作することができる。
第3の発明の電子機器は、第2の発明の電子機器において、複数の前記ボタンを備え、
前記メモリは、複数の音声コマンドを記憶し、前記制御部は、いずれかの前記ボタンへの操作があった場合、前記ボタンに対応する、前記メモリに記憶されている音声コマンドを、前記サーバーに送信することを特徴とする。
前記メモリは、複数の音声コマンドを記憶し、前記制御部は、いずれかの前記ボタンへの操作があった場合、前記ボタンに対応する、前記メモリに記憶されている音声コマンドを、前記サーバーに送信することを特徴とする。
本発明では、制御部は、いずれかのボタンの操作があった場合、ボタンに対応する、メモリに記憶されている音声コマンドを、サーバーに送信する。これにより、ユーザーは、電子機器に複数の動作を行わせることができる。
第4の発明の電子機器は、第2又は第3の発明の電子機器において、マイクを更に備え、
前記制御部は、前記ボタンへの所定時間以上の操作があった場合、前記マイクにより音声を録音し、録音した音声を、音声コマンドとして、前記メモリに記憶することを特徴とする。
前記制御部は、前記ボタンへの所定時間以上の操作があった場合、前記マイクにより音声を録音し、録音した音声を、音声コマンドとして、前記メモリに記憶することを特徴とする。
本発明では、制御部は、ボタンへの所定時間以上の操作があった場合、マイクにより音声を録音し、録音した音声を、音声コマンドとして、メモリに記憶する。これにより、ユーザーは、マイクを長押しして、電子機器を録音モードとし、音声コマンドを発話することで、電子機器に、所望の音声コマンドを記憶させることができる。
第5の発明の電子機器は、第4の発明の電子機器において、前記制御部は、前記ボタンへの所定時間未満の操作があった場合、前記マイクによる音声の録音を終了することを特徴とする。
第6の発明の電子機器は、第2〜第5のいずれかの発明の電子機器において、音声を再生する音声再生器と、前記音声再生器により再生された音声が出力されるスピーカーと、をさらに備え、前記制御部は、前記ボタンの操作があった場合、前記メモリに記憶されている音声コマンドを、前記音声再生器により再生させることを特徴とする。
本発明では、制御部は、ボタンの操作があった場合、メモリに記憶されている音声コマンドを、音声再生器により再生させる。これにより、スピーカーから、音声コマンドが出力されるため、ユーザーは、実行される音声コマンドを理解することができる。
第7の発明の電子機器は、第4又は第5の発明の電子機器において、発光部を更に備え、前記制御部は、前記ボタンへの所定時間以上の操作があった場合、前記発光部を全点灯し、全点灯した後、前記発光部を徐々に消灯し、前記発光部の全点灯から全消灯までの時間は、前記マイクによる録音時間と一致していることを特徴とする。
本発明では、制御部は、ボタンへの所定時間以上の操作があった場合、発光部を全点灯し、全点灯した後、発光部を徐々に消灯する。また、発光部の全点灯から全消灯までの時間は、マイクによる録音時間と一致している。これにより、ユーザーは、電子機器による録音時間を理解することができる。
本発明によれば、ユーザーは、容易に、電子機器を操作することができる。
以下、本発明の実施形態について説明する。図1は、本実施形態に係るスピーカー装置1の外観を示す斜視図である。図1に示すように、スピーカー装置1は、円筒状である。スピーカー装置1の上面には、複数のプリセットボタン8、円環状のLED9(発光部)が設けられている。
図2は、本実施形態に係るスピーカー装置1を示すブロック図である。図2に示すように、スピーカー装置1(電子機器)は、SoC(System on Chip)2、メモリ3、音声再生器4、スピーカー5、無線モジュール6、マイク7、プリセットボタン8、LED9を備える。SoC2(制御部)は、CPU(Central Processing Unit)、DSP(Digital Signal Processor)等を有し、スピーカー装置1を構成する各部を制御する。メモリ3は、音声コマンド等を記憶するフラッシュメモリにより構成されている。音声再生器4は、音声を再生する。スピーカー5には、音声再生器4により再生された音声が出力される。
無線モジュール6は、Bluetooth(登録商標)規格、Wi−Fi規格に従った無線通信を行うためのものである。SoC2は、無線モジュール6を介して、楽曲を配信するサーバー等から、音声データを受信したり、メモリ3に記憶されている音声コマンドを、音声認識機能を有するクラウドサーバーに送信したりする。
マイク7は、音声を集音する。通常、SoC2は、マイク7が集音した音声を、無線モジュール6を介して、クラウドサーバーに送信する。マイク7が集音した音声が、ホットワード(所定のキーワード)であった場合、SoC2は、音声コマンドの受付を開始する。具体的には、クラウドサーバーは、音声認識機能を有しており、受信した音声が、ホットワードであった場合、音声コマンドの受付開始の指示(コマンド)を、スピーカー装置1に送信する。SoC2は、無線モジュール6を介して、音声コマンドの受付開始の指示を受信した場合、音声コマンドの受付を開始する。なお、ホットワードの認識は、サーバーではなく、スピーカー装置1のSoC2により行われるようになっていてもよい。
また、クラウドサーバーは、受信した音声コマンドに応じたコマンド等をスピーカー装置1に返信する。SoC2は、無線モジュール6を介して、クラウドサーバーが送信したコマンド等を受信する。例えば、ユーザーが「楽曲Aを再生」と発話したとする。この場合、例えば、再生を意味するコマンド「Play」と、テキスト「楽曲A」とが、クラウドサーバーからスピーカー装置1に送信される。
スピーカー装置1による音声コマンドの録音について説明する。SoC2は、いずれかのプリセットボタン8への所定時間以上の操作を受け付けた場合、すなわち、ユーザーにより、プリセットボタン8が長押しされた場合、マイク7により音声を録音し、録音した音声を、音声コマンドとして、メモリ3に記憶する。このとき、SoC2は、円環状のLED9を全点灯し、全点灯した後、LED9を徐々に、円周状に消灯する。ここで、LED8の全点灯から全消灯までの時間は、マイク7による最大録音時間(例えば、10秒)と一致している。従って、LED9は、全点灯から、録音時間に合わせて消灯していき、LED9による、録音時間のカウントダウン表示が行われる。
ユーザーは、プリセットボタン8の長押しの後、音声コマンドを発話する。これにより、ユーザーは、音声コマンドを、スピーカー装置1に記憶させることができる。SoC2は、最大録音時間が経過した場合、又は、プリセットボタン8の所定時間未満の操作を受け付けた場合、すなわち、ユーザーにより、プリセットボタン8が短押しされた場合、マイク7による音声の録音を終了する。SoC2は、録音した音声コマンドと、操作を受け付けたプリセットボタン8の情報と、を対応付けて、メモリ3に記憶する。
通常、ユーザーは、マイク7に対して、音声コマンドを発話し、図3(a)に示すように、SoC2は、マイク7により集音された音声を、クラウドサーバーに送信する。一方で、SoC2は、プリセットボタン8への操作(ここでは、所定時間未満以内の操作であり、ユーザーによるプリセットボタン8の短押しである)を受け付けた場合、プリセットボタン8に対応する、メモリ3に記憶されている音声コマンドをクラウドサーバーに送信する。また、SoC2は、プリセットボタン8に対応する、メモリ3に記憶されている音声コマンドを、音声再生器4により再生させる。これにより、スピーカー5から、音声コマンドが出力される。なお、スピーカー5からの音声コマンド出力は、ユーザーによる音声コマンドの確認用であり、スピーカー5から出力された音声コマンドは、マイク7により集音されず、音声コマンドとして使用されない。
また、図3(b)に示すように、メモリ3に記憶されている音声コマンドは、マイク7の経路とは、別の経路で、クラウドサーバーに送信される。これは、スピーカー装置1周囲の環境、また、スピーカー装置1の再生音量の影響を排除し、音声コマンドの精度を高めるためである。
以上説明したように、本実施形態では、SoC2は、所定の操作に基づいて、メモリ3に記憶されている音声コマンドを、音声認識機能を有するクラウドサーバーに送信する。これにより、ユーザーは、所定の操作を行うのみで、例えば、ユーザーが所望の音楽データが、クラウドサーバーからスピーカー装置に送信され、スピーカー装置1が、音楽データに基づいて、音楽を再生するため、容易に、スピーカー装置1を操作することができる。すなわち、長く複雑な音声コマンドの繰り返しの実行を、簡便化することができる。
また、クラウドサーバー、音楽配信サービス側の仕様を変更する必要もなく、お気に入りの音楽のプリセット再生機能を備えさせることができる。
また、本実施形態では、所定の操作は、プリセットボタン8の操作である。このため、ユーザーは、プリセットボタン8を操作することで、容易に、スピーカー装置1を操作することができる。
また、本実施形態では、SoC2は、いずれかのプリセットボタン8の操作があった場合、プリセットボタン8に対応する、メモリ3に記憶されている音声コマンドを、クラウドサーバーに送信する。これにより、ユーザーは、スピーカー装置1に複数の動作を行わせることができる。
また、本実施形態では、SoC2は、プリセットボタン8への所定時間以上の操作があった場合、マイク7により音声を録音し、録音した音声を、音声コマンドとして、メモリ3に記憶する。これにより、ユーザーは、マイク7を長押しして、スピーカー装置1を録音モードとし、音声コマンドを発話することで、スピーカー装置1に、所望の音声コマンドを記憶させることができる。
また、本実施形態では、SoC2は、プリセットボタン8の操作があった場合、メモリ3に記憶されている音声コマンドを、音声再生器4により再生させる。これにより、スピーカー5から、音声コマンドが出力されるため、ユーザーは、実行される音声コマンドを理解することができる。
また、本実施形態では、SoC2は、プリセットボタン8への所定時間以上の操作があった場合、LED9を全点灯し、全点灯した後、LED9を徐々に消灯する。また、LED9の全点灯から全消灯までの時間は、マイク7による録音時間と一致している。これにより、ユーザーは、スピーカー1による録音時間を理解することができる。
以上、本発明の実施形態について説明したが、本発明を適用可能な形態は、上述の実施形態には限られるものではなく、以下に例示するように、本発明の趣旨を逸脱しない範囲で適宜変更を加えることが可能である。
上述の実施形態においては、所定の操作は、プリセットボタン8の操作である。これに限らず、例えば、スピーカー装置1が、カメラを備えており、所定の操作は、ユーザーによる、カメラの前での所定のジェスチャ操作等であってもよい。
本発明は、音声認識機能を利用する電子機器に好適に採用され得る。
1 スピーカー装置(電子機器)
2 SoC(制御部)
3 メモリ
4 音声再生器
5 スピーカー
7 マイク
8 プリセットボタン
9 LED(発光部)
2 SoC(制御部)
3 メモリ
4 音声再生器
5 スピーカー
7 マイク
8 プリセットボタン
9 LED(発光部)
Claims (7)
- 音声コマンドを記憶するためのメモリと、
所定の操作に基づいて、前記メモリに記憶されている音声コマンドを、音声認識機能を有するサーバーに送信する制御部と、を備えることを特徴とする電子機器。 - ボタンを備え、
前記所定の操作は、前記ボタンの操作であることを特徴とする請求項1に記載の電子機器。 - 複数の前記ボタンを備え、
前記メモリは、複数の音声コマンドを記憶し、
前記制御部は、いずれかの前記ボタンへの操作があった場合、前記ボタンに対応する、前記メモリに記憶されている音声コマンドを、前記サーバーに送信することを特徴とする請求項2に記載の電子機器。 - マイクを更に備え、
前記制御部は、前記ボタンへの所定時間以上の操作があった場合、前記マイクにより音声を録音し、録音した音声を、音声コマンドとして、前記メモリに記憶することを特徴とする請求項2又は3に記載の電子機器。 - 前記制御部は、前記ボタンへの所定時間未満の操作があった場合、前記マイクによる音声の録音を終了することを特徴とする請求項4に記載の電子機器。
- 音声を再生する音声再生器と、
前記音声再生器により再生された音声が出力されるスピーカーと、をさらに備え、
前記制御部は、前記ボタンの操作があった場合、前記メモリに記憶されている音声コマンドを、前記音声再生器により再生させることを特徴とする請求項2〜5のいずれか1項に記載の電子機器。 - 発光部を更に備え、
前記制御部は、前記ボタンへの所定時間以上の操作があった場合、前記発光部を全点灯し、全点灯した後、前記発光部を徐々に消灯し、
前記発光部の全点灯から全消灯までの時間は、前記マイクによる録音時間と一致していることを特徴とする請求項4又は5に記載の電子機器。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019009071A JP2020118823A (ja) | 2019-01-23 | 2019-01-23 | 電子機器 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019009071A JP2020118823A (ja) | 2019-01-23 | 2019-01-23 | 電子機器 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2020118823A true JP2020118823A (ja) | 2020-08-06 |
Family
ID=71890664
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019009071A Pending JP2020118823A (ja) | 2019-01-23 | 2019-01-23 | 電子機器 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2020118823A (ja) |
-
2019
- 2019-01-23 JP JP2019009071A patent/JP2020118823A/ja active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6725006B2 (ja) | 制御装置および機器制御システム | |
US20090222270A2 (en) | Voice command interface device | |
US20120078635A1 (en) | Voice control system | |
US20140249673A1 (en) | Robot for generating body motion corresponding to sound signal | |
US20060235701A1 (en) | Activity-based control of a set of electronic devices | |
US20200280756A1 (en) | Remote control and integration of electronic devices in a media system | |
US11875801B2 (en) | Content playback system | |
JP6276503B2 (ja) | オーディオ装置 | |
JP2007213772A (ja) | 記録転送プログラム、記録転送装置及び記録転送方法 | |
JP2020118823A (ja) | 電子機器 | |
JP4651317B2 (ja) | 楽曲選択装置 | |
US11450347B2 (en) | Data group playback device and system and method for same | |
JP7331645B2 (ja) | 情報提供方法および通信システム | |
JP2006146996A (ja) | コンテンツ再生システム | |
WO2018100742A1 (ja) | コンテンツ再生機器、コンテンツ再生システム、及びコンテンツ再生機器の制御方法 | |
JP6677343B2 (ja) | 操作装置、コマンド処理装置、及びコンテンツ再生システム | |
KR101673999B1 (ko) | 독립적인 통신 기능을 지닌 음향 변환 장치 | |
US20100087954A1 (en) | Robot and robot control system | |
JP2020061046A (ja) | 音声操作装置、音声操作方法、コンピュータプログラムおよび音声操作システム | |
KR101657110B1 (ko) | 휴대용 노래반주 셋탑 박스 | |
JP2008158048A (ja) | カラオケシステム及びデジタル再生装置 | |
US12088983B2 (en) | In-ear wireless audio monitor system with integrated interface for controlling devices | |
JP2008033017A (ja) | データ呼出制御装置、データ呼出システム、データ呼出制御装置の音声認識語彙登録方法および車両 | |
JP2007311020A (ja) | 再生装置、再生方法、及び車載用再生装置 | |
JP2004258502A (ja) | カラオケ演奏装置における効果音発生機構および使用方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A711 Effective date: 20210928 |