JP2020118913A - 電子機器 - Google Patents

電子機器 Download PDF

Info

Publication number
JP2020118913A
JP2020118913A JP2019011848A JP2019011848A JP2020118913A JP 2020118913 A JP2020118913 A JP 2020118913A JP 2019011848 A JP2019011848 A JP 2019011848A JP 2019011848 A JP2019011848 A JP 2019011848A JP 2020118913 A JP2020118913 A JP 2020118913A
Authority
JP
Japan
Prior art keywords
answer
memory
electronic device
question
control unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2019011848A
Other languages
English (en)
Inventor
弘毅 仲江川
Koki Nakaegawa
弘毅 仲江川
宏淑 石河
Hiroyoshi Ishikawa
宏淑 石河
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Onkyo Corp
Original Assignee
Onkyo Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Onkyo Corp filed Critical Onkyo Corp
Priority to JP2019011848A priority Critical patent/JP2020118913A/ja
Publication of JP2020118913A publication Critical patent/JP2020118913A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Telephonic Communication Services (AREA)

Abstract

【課題】ユーザーが、容易に、再度、質問に対する回答を聴取可能とすること。【解決手段】スピーカー装置1は、質問に対する回答を記憶するためのメモリ4と、所定の操作に基づいて、メモリ4に記憶されている回答を再生するネットワークSoC2と、を備える。所定の操作は、ボタン9の操作である。メモリ4は、複数の回答を記憶している。ネットワークSoC2は、ボタン9の操作回数に基づいて、メモリ4に記憶されている回答を再生する。【選択図】図1

Description

本発明は、音声認識機能を利用する電子機器に関する。
音声認識機能を利用する電子機器として、マイクとスピーカーとを備えたスピーカー装置がある。このようなスピーカー装置において、所定のキーワード(以下、「ホットワード」という。)を認識した後、ユーザーからの質問等を受け付けるようになっているものがある(例えば、特許文献1参照。)。特許文献1では、ホットワードとして、「オーケーコンピュータ」が記載されている(図1参照。)。従って、ユーザーは、まず、ホットワードを発話する。そして、ユーザーは、例えば、スピーカー装置に対して、何らかの質問(例えば、「今日の天気を教えて。」)をし、スピーカー装置は、その質問に対し、回答(例えば、「今日の天気は、晴れです。」を行う。しかし、ユーザーは、スピーカー装置に質問した回答を、周囲の騒音、作業中等の要因により、聞き逃したり、聞き取れなかったりする場合がある。また、ユーザーは、長い回答や残しておきたい回答の場合、後で聞き返したい場合もある。
このような場合、ユーザーは、ホットワードと同じ質問をスピーカー装置に対して繰り返す必要があり、同じ質問を二度行うことを、面倒に感じる。1つ前の質問に対する回答であれば、ユーザーは、ホットワードを発話した後、例えば、「もう一度教えて。」とスピーカー装置に尋ねれば、スピーカー装置が、1つ前の質問に対する回答をするが、煩わしさはあまり減らない。また、ユーザーは、ウェブで回答の履歴を確認することはできるが、PC、スマートフォンのブラウザで確認をする必要があるため、作業は、更に面倒である。
特開2017−076117号公報
上述したように、ユーザーは、再度、同じ質問に対する回答を聴きたい場合、煩わしいという問題がある。
本発明の目的は、ユーザーが、容易に、再度、質問に対する回答を聴取可能とすることである。
第1の発明の電子機器は、質問に対する回答を記憶するためのメモリと、所定の操作に基づいて、前記メモリに記憶されている回答を再生する制御部と、を備えることを特徴とする。
本発明では、制御部は、所定の操作に基づいて、メモリに記憶されている回答を再生する。これにより、ユーザーは、容易に、再度、質問に対する回答を聴取することができる。
第2の発明の電子機器は、第1の発明の電子機器において、ボタンを更に備え、前記所定の操作は、前記ボタンの操作であることを特徴とする。
本発明では、所定の操作は、ボタンの操作である。このため、ユーザーは、ボタンを操作することで、容易に、再度、質問に対する回答を聴取することができる。
第3の発明の電子機器は、第1又は第2の発明の電子機器において、マイクを更に備え、前記制御部は、前記マイクにより集音された質問を、音声認識機能を有するサーバーに送信し、前記サーバーから送信される質問に対する回答を前記メモリに記憶することを特徴とする。
第4の発明の電子機器は、第1〜第3のいずれかの発明の電子機器において、前記制御部は、所定時間以上の長さの回答を前記メモリに記憶することを特徴とする。
本発明では、制御部は、所定時間以上の長さの回答をメモリに記憶する。これにより、ユーザーは、長い回答であっても、容易に、再度、聴取することができる。
第5の発明の電子機器は、第1〜第3のいずれかの発明の電子機器において、前記制御部は、周囲の環境雑音が、所定のレベル以上である場合、質問に対する回答を前記メモリに記憶することを特徴とする。
本発明では、制御部は、周囲の環境雑音が、所定のレベル以上である場合、質問に対する回答をメモリに記憶する。これにより、ユーザーは、周囲がうるさい環境の中で行われた回答を、再度、聴取することができる。
第6の発明の電子機器は、第2の発明の電子機器において、前記制御部は、前記サーバーから送信された回答を再生しているときに、前記ボタンの操作があった場合、再生している回答を前記メモリに記憶することを特徴とする。
本発明では、制御部は、サーバーから送信された回答を再生しているときに、ボタンの操作があった場合、再生している回答を前記メモリに記憶する。これにより、ユーザーは、ボタンを操作することで、再度、聴取したい回答を電子機器に記憶させることができる。
第7の発明の電子機器は、第2の発明の電子機器において、前記メモリは、複数の質問に対する回答を記憶し、前記制御部は、前記ボタンの操作回数に基づいて、前記メモリに記憶されている回答を再生することを特徴とする。
本発明では、制御部は、ボタンの操作回数に基づいて、メモリに記憶されている回答を再生する。これにより、ユーザーは、ボタンの操作回数を変更することで、所望の回答を聴取することができる。
第8の発明の電子機器は、第2の発明の電子機器において、前記メモリは、複数の質問に対する回答を記憶し、前記制御部は、前記メモリに記憶されている回答を再生してから所定時間内に、前記ボタンの操作があった場合に、他の回答を再生することを特徴とする。
本発明では、制御部は、メモリに記憶されている回答を再生してから所定時間内に、ボタンの操作があった場合に、他の回答を再生する。これにより、ユーザーは、再生された回答が、所望の回答ではない場合、ボタンを操作することで、他の回答を再生させることができる。
第9の発明の電子機器は、第3の発明の電子機器において、前記制御部は、前記マイクにより集音された質問と、前記サーバーから送信された回答と、を対応付けて、前記メモリに記憶することを特徴とする。
第10の発明の電子機器は、第9の発明の電子機器において、前記制御部は、前記メモリに記憶されている質問と、質問に対応する回答と、を連続して再生することを特徴とする。
本発明では、制御部は、メモリに記憶されている質問と、質問に対応する回答と、を連続して再生する。これにより、ユーザーは、再度、聴取したい回答を選択しやすくなる。
第11の発明の電子機器は、第1〜第10のいずれかの発明の電子機器において、前記制御部は、回答を、通常よりも、遅く、且つ、大きな音量で再生することを特徴とする。
本発明では、制御部は、回答を、通常よりも、遅く、且つ、大きな音量で再生する。これにより、ユーザーは、回答を聴取しやすい。
本発明によれば、ユーザーは、容易に、再度、質問に対する回答を聴取することができる。
本発明の実施形態に係るスピーカー装置の構成を示すブロック図である。
以下、本発明の実施形態について説明する。図1は、本実施形態に係るスピーカー装置1の構成を示すブロック図である。図1に示すように、スピーカー装置1(電子機器)は、ネットワークSoC(System on Chip)2、MCU(Micro Control Unit)3、メモリ4、DSP(Digital Signal Processor)5、増幅器6、スピーカー7、マイク8、ボタン9を備える。
ネットワークSoC2(制御部)は、CPU(Central Processing Unit)、DSP(Digital Signal Processor)等を有し、スピーカー装置1を構成する各部を制御する。また、ネットワークSoC2は、クラウドサーバー101と通信するためのネットワーク機能を備える。MCU3は、ボタン9の操作を受け付ける。メモリ4は、質問、及び、質問に対する回答等を記憶するフラッシュメモリにより構成されている。DSP5は、音声信号に、各種の音声信号処理を行う。増幅器6は、音声信号を増幅し、増幅した音声信号をスピーカー7に出力する。スピーカー7は、増幅器6から出力される音声信号に基づいて、音声を出力する。
マイク8は、音声を集音する。ネットワークSoC2は、マイク8が集音した音声を、クラウドサーバー101に送信する。マイク8が集音した音声が、ホットワード(所定のキーワード)であった場合、ネットワークSoC2は、音声コマンド(質問を含む)の受付を開始する。具体的には、クラウドサーバー101は、音声認識機能を有しており、受信した音声が、ホットワードであった場合、音声コマンドの受付開始の指示(コマンド)を、スピーカー装置1に送信する。ネットワークSoC2は、音声コマンドの受付開始の指示を受信した場合、音声コマンドの受付を開始する。なお、ホットワードの認識は、クラウドサーバー101ではなく、スピーカー装置1のネットワークSoC2又はDSP5により行われるようになっていてもよい。
また、クラウドサーバー101は、受信した音声コマンドに応じたコマンド等をスピーカー装置1に返信する。ネットワークSoC2は、クラウドサーバー101が送信したコマンド等を受信する。例えば、ユーザーが「楽曲Aを再生」と発話したとする。この場合、例えば、再生を意味するコマンド「Play」と、テキスト「楽曲A」とが、クラウドサーバー101からスピーカー装置1に送信される。
ネットワークSoC2は、クラウドサーバー101から送信された質問に対する回答(音声データ)をメモリ4に記憶する。例えば、ネットワークSoC2は、毎回、クラウドサーバー101から送信された質問に対する回答をメモリ4に記憶する。この場合、ネットワークSoC2は、最新の回答をメモリ4に記憶し、それ以前の回答をメモリ4から削除する。また、例えば、ネットワークSoC2は、所定時間以上の長さ(例えば、30秒以上の長さ)の回答を、メモリ4に記憶する。また、例えば、ネットワークSoC2は、マイク8により集音された周囲の環境雑音のレベルが、所定のレベル(例えば、70dB)以上である場合、質問に対する回答をメモリ4に記憶する。また、例えば、ネットワークSoC2は、クラウドサーバー101から送信された回答を再生しているときに、ボタン9の操作があった場合、再生している回答をメモリ4に記憶する。この場合、ネットワークSoC2は、回答の最初から、メモリ4に記憶する。
また、例えば、ネットワークSoC2は、マイク8により集音された質問と、クラウドサーバー101から送信された回答と、を対応付けて、メモリ4に記憶する。例えば、ユーザーが、「オッケー、コンピュータ」、「今日の天気は」とスピーカー装置1に質問したとする。この場合、ネットワークSoC2は、クラウドサーバー101に、マイク8により集音された質問を、クラウドサーバー101に送信する。ネットワークSoC2は、質問に対する回答として、「墨田区の今日の天気は晴れです」という回答(音声データ)を受信したとする。この場合、ネットワークSoC2は、「今日の天気は」という質問と、「墨田区の今日の天気は晴れです」という回答と、を対応付けて、メモリ4に記憶する。
ネットワークSoC2は、ユーザーによるボタン9の操作(所定の操作)があった場合、すなわち、MCU3がボタン9の操作を受け付けた場合、メモリ4に記憶されている回答を再生する。ネットワークSoC2は、DSP5によりメモリ4に記憶されている回答を読み出し、各種の信号処理行わせる。DSP5からの音声信号は、増幅器6により増幅され、スピーカー7に出力されることで、回答が再生される。
ここで、メモリ4は、複数の質問に対する回答を記憶しているとする。ネットワークSoC2は、ボタン9の操作回数に基づいて、メモリ4に記憶されている回答を再生する。例えば、ネットワークSoC2は、ボタン9の操作回数が1回であった場合、最も新しく記憶したメモリ4に記憶されている回答を再生する。また、例えば、ネットワークSoC2は、ボタン9の操作回数が3回であった場合、3回前に記憶したメモリ4に記憶されている回答を再生する。
また、ネットワークSoC2は、メモリ4に記憶されている回答を再生してから所定時間(例えば、10秒)内に、ボタン9の操作があった場合に、他の回答を再生する。例えば、ネットワークSoC2は、ボタン9の操作回数が3回であり、3回前に記憶したメモリ4に記憶されている回答を再生してから、10秒以内に、ボタン9の操作が2回あった場合、5回前に記憶したメモリ4に記憶されている回答を再生する。
また、ネットワークSoC2は、メモリ4に記憶されている質問と、質問に対応する回答と、を連続して再生する。例えば、「今日の天気は」という質問と、「墨田区の今日の天気は晴れです」という回答とが、連続して再生される。また、ネットワークSoC2は、回答を、通常よりも、遅く、且つ、大きな音量で再生する。
以上説明したように、本実施形態では、ネットワークSoC2は、ボタン9の操作に基づいて、メモリに記憶されている回答を再生する。これにより、ユーザーは、ボタン9を操作することで、容易に、再度、質問に対する回答を聴取することができる。
また、本実施形態では、例えば、ネットワークSoC2は、所定時間以上の長さの回答をメモリ4に記憶する。これにより、ユーザーは、長い回答であっても、容易に、再度、聴取することができる。
また、本実施形態では、例えば、ネットワークSoC2は、周囲の環境雑音が、所定のレベル以上である場合、質問に対する回答をメモリ4に記憶する。これにより、ユーザーは、周囲がうるさい環境の中で行われた回答を、再度、聴取することができる。
また、本実施形態では、例えば、ネットワークSoC2は、クラウドサーバー101から送信された回答を再生しているときに、ボタン9の操作があった場合、再生している回答をメモリ4に記憶する。これにより、ユーザーは、ボタン9を操作することで、再度、聴取したい回答をスピーカー装置1に記憶させることができる。
また、本実施形態では、ネットワークSoC2は、ボタン9の操作回数に基づいて、メモリ4に記憶されている回答を再生する。これにより、ユーザーは、ボタン9の操作回数を変更することで、所望の回答を聴取することができる。
また、本実施形態では、ネットワークSoC2は、メモリ4に記憶されている回答を再生してから所定時間内に、ボタン9の操作があった場合に、他の回答を再生する。これにより、ユーザーは、再生された回答が、所望の回答ではない場合、ボタン9を操作することで、他の回答を再生させることができる。
また、本実施形態では、ネットワークSoC2は、メモリ4に記憶されている質問と、質問に対応する回答と、を連続して再生する。これにより、ユーザーは、再度、聴取したい回答を選択しやすくなる。
また、本実施形態では、ネットワークSoC2は、回答を、通常よりも、遅く、且つ、大きな音量で再生する。これにより、ユーザーは、回答を聴取しやすい。
以上、本発明の実施形態について説明したが、本発明を適用可能な形態は、上述の実施形態には限られるものではなく、以下に例示するように、本発明の趣旨を逸脱しない範囲で適宜変更を加えることが可能である。
上述の実施形態においては、ネットワークSoC2は、ボタン9の操作に基づいて、メモリ4に記憶されている回答を再生する。これに限らず、例えば、スピーカー装置1が、カメラを備えており、ネットワークSoC2は、ユーザーによる、カメラの前での所定のジェスチャ操作等に基づいて、メモリ4に記憶されている回答を再生するようになっていてもよい。
本発明は、音声認識機能を利用する電子機器に好適に採用され得る。
1 スピーカー装置(電子機器)
2 ネットワークSoC(制御部)
4 メモリ
7 スピーカー
8 マイク
9 ボタン
101 クラウドサーバー

Claims (11)

  1. 質問に対する回答を記憶するためのメモリと、
    所定の操作に基づいて、前記メモリに記憶されている回答を再生する制御部と、を備えることを特徴とする電子機器。
  2. ボタンを更に備え、
    前記所定の操作は、前記ボタンの操作であることを特徴とする請求項1に記載の電子機器。
  3. マイクを更に備え、
    前記制御部は、前記マイクにより集音された質問を、音声認識機能を有するサーバーに送信し、
    前記サーバーから送信される質問に対する回答を前記メモリに記憶することを特徴とする請求項1又は2に記載の電子機器。
  4. 前記制御部は、所定時間以上の長さの回答を前記メモリに記憶することを特徴とする請求項1〜3のいずれか1項に記載の電子機器。
  5. 前記制御部は、周囲の環境雑音が、所定のレベル以上である場合、質問に対する回答を前記メモリに記憶することを特徴とする請求項1〜3のいずれか1項に記載の電子機器。
  6. 前記制御部は、前記サーバーから送信された回答を再生しているときに、前記ボタンの操作があった場合、再生している回答を前記メモリに記憶することを特徴とする請求項2に記載の電子機器。
  7. 前記メモリは、複数の質問に対する回答を記憶し、
    前記制御部は、前記ボタンの操作回数に基づいて、前記メモリに記憶されている回答を再生することを特徴とする請求項2に記載の電子機器。
  8. 前記メモリは、複数の質問に対する回答を記憶し、
    前記制御部は、前記メモリに記憶されている回答を再生してから所定時間内に、前記ボタンの操作があった場合に、他の回答を再生することを特徴とする請求項2に記載の電子機器。
  9. 前記制御部は、前記マイクにより集音された質問と、前記サーバーから送信された回答と、を対応付けて、前記メモリに記憶することを特徴とする請求項3に記載の電子機器。
  10. 前記制御部は、前記メモリに記憶されている質問と、質問に対応する回答と、を連続して再生することを特徴とする請求項9に記載の電子機器。
  11. 前記制御部は、回答を、通常よりも、遅く、且つ、大きな音量で再生することを特徴とする請求項1〜10のいずれか1項に記載の電子機器。
JP2019011848A 2019-01-28 2019-01-28 電子機器 Pending JP2020118913A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2019011848A JP2020118913A (ja) 2019-01-28 2019-01-28 電子機器

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2019011848A JP2020118913A (ja) 2019-01-28 2019-01-28 電子機器

Publications (1)

Publication Number Publication Date
JP2020118913A true JP2020118913A (ja) 2020-08-06

Family

ID=71892019

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019011848A Pending JP2020118913A (ja) 2019-01-28 2019-01-28 電子機器

Country Status (1)

Country Link
JP (1) JP2020118913A (ja)

Similar Documents

Publication Publication Date Title
CN110870201B (zh) 音频信号调节方法、装置、存储介质及终端
US8019094B2 (en) Audio processing system with function of automatic gain control and method thereof
CN107423364B (zh) 基于人工智能的回答话术播报方法、装置及存储介质
WO2019033987A1 (zh) 提示方法、装置、存储介质及终端
US20190212972A1 (en) Method and apparatus for playing audio files
JP6717940B2 (ja) オーディオファイルの再録音方法、装置及び記憶媒体
US11328722B2 (en) Systems and methods for generating a singular voice audio stream
JP6457326B2 (ja) 歌唱音声の伝送遅延に対応したカラオケシステム
CN108492826B (zh) 音频处理方法、装置、智能设备及介质
US20200258487A1 (en) Acoustic Device and Acoustic Control Program
JP2019113636A (ja) 音声認識システム
US20070116296A1 (en) Audio processing system and method for hearing protection in an ambient environment
JP2020118913A (ja) 電子機器
JP6170692B2 (ja) 通信障害時にデュエット歌唱を継続可能な通信カラオケシステム
JP5842364B2 (ja) 音量制御装置及び音量制御方法
US8204257B2 (en) System and method for increasing ring tone volume
JP2014167520A (ja) 通信障害時にデュエット歌唱を継続可能な通信カラオケシステム
JP2018159779A (ja) 音声再生態様決定装置、および音声再生態様決定プログラム
JP6468069B2 (ja) 電子機器制御システム、サーバー、及び、端末装置
JP2021085952A (ja) 音楽再生装置、音楽再生方法、及び、音楽再生プログラム
JP2010176042A (ja) 歌唱音声録音カラオケシステム
JP7178537B2 (ja) 再生アップデート方法、装置及び記憶媒体
WO2023013019A1 (ja) 発話フィードバック装置、発話フィードバック方法、プログラム
TW201015254A (en) Robot apparatus control system using a tone and robot apparatus
JP4985562B2 (ja) 録音装置、方法及びプログラム

Legal Events

Date Code Title Description
A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A711

Effective date: 20210928