JP2020134868A - 電子機器 - Google Patents

電子機器 Download PDF

Info

Publication number
JP2020134868A
JP2020134868A JP2019031633A JP2019031633A JP2020134868A JP 2020134868 A JP2020134868 A JP 2020134868A JP 2019031633 A JP2019031633 A JP 2019031633A JP 2019031633 A JP2019031633 A JP 2019031633A JP 2020134868 A JP2020134868 A JP 2020134868A
Authority
JP
Japan
Prior art keywords
image
voice command
camera
voice
electronic device
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2019031633A
Other languages
English (en)
Inventor
亮太 土屋
Ryota Tsuchiya
亮太 土屋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Onkyo Corp
Original Assignee
Onkyo Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Onkyo Corp filed Critical Onkyo Corp
Priority to JP2019031633A priority Critical patent/JP2020134868A/ja
Publication of JP2020134868A publication Critical patent/JP2020134868A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Collating Specific Patterns (AREA)

Abstract

【課題】ユーザーが、容易に、音声コマンド受付状態にできる電子機器を提供すること。【解決手段】スピーカー装置1は、カメラ9と、SoC2と、を備える。SoC2は、カメラ9が撮影した画像を、音声コマンドの受付を開始するための音声コマンド開始画像として受け付ける。SoC2は、カメラ9が撮影した画像が、音声コマンド開始画像である場合に、音声コマンドの受付を開始する。ユーザーは、例えば、音声コマンド開始画像として、自身の顔画像を登録する。【選択図】図1

Description

本発明は、音声認識機能を備える電子機器に関する。
音声認識機能を備える電子機器の中には、所定のキーワード(以下、「ホットワード」という。)を認識した後、音声コマンドを受け付けるようになっているものがある(例えば、特許文献1参照。)。特許文献1では、ホットワードとして、「オーケーコンピュータ」が記載されている(図1参照。)。
特開2017−076117号公報
しかしながら、ホットワードの認識後に、音声コマンドが受け付けられる場合、ユーザーは、音声コマンドを発声する前に、毎回、ホットワードを発声する必要があり、面倒である。また、電子機器が音楽再生している場合、ユーザーが、大きな声を出さなければ、電子機器がホットワードを認識できない場合がある。
本発明の目的は、ユーザーが、容易に、音声コマンド受付状態にできる電子機器を提供することである。
第1の発明の電子機器は、カメラと、制御部と、を備え、前記制御部は、前記カメラが撮影した画像が、所定の画像である場合に、音声コマンドの受付を開始することを特徴とする。
本発明では、制御部は、カメラが撮影した画像が、所定の画像である場合に、音声コマンドの受付を開始する。例えば、ユーザーは、所定の画像として、自身の顔画像を登録すれば、カメラに顔を向けるだけで、電子機器を、音声コマンドの受付状態とすることができる。このように、本発明によれば、ユーザーが、容易に、音声コマンド受け付け状態にできる電子機器を提供することができる。
第2の発明の電子機器は、第1の発明の電子機器において、前記制御部は、前記カメラが撮影した画像を、前記所定の画像として受け付けることを特徴とする。
第3の発明の電子機器は、第1又は第2の発明の電子機器において、前記所定の画像は、顔画像であることを特徴とする。
第4の発明のシステムは、第1〜第3のいずれかの発明の電子機器において、マイクをさらに備え、前記制御部は、前記マイクが集音した音声が、所定のキーワードである場合に、音声コマンドの受付を開始することを特徴とする。
本発明によれば、ユーザーが、容易に、音声コマンド受付状態にできる電子機器を提供することができる。
本発明の実施形態に係るスピーカー装置の構成を示すブロック図である。
以下、本発明の実施形態について説明する。図1は、本実施形態に係るスピーカー装置1を示すブロック図である。図1に示すように、スピーカー装置1(電子機器)は、SoC(System on Chip)2、記憶部3、D/Aコンバーター(以下、「DAC」という。)4、増幅器5、スピーカー6、無線モジュール7、マイク8、カメラ9を備える。SoC2(制御部)は、CPU(Central Processing Unit)、DSP(Digital Signal Processor)、メモリ等を有し、スピーカー装置1を構成する各部を制御する。記憶部3は、音楽サービスにアクセスするためのアプリケーション等を記憶するフラッシュメモリにより構成されている。DAC4は、デジタルオーディオデータを、アナログオーディオデータにD/A変換する。増幅器5は、DAC4がD/A変換したアナログオーディオデータを増幅する。スピーカー6は、増幅器5が増幅したアナログオーディオデータに基づいて、音声を出力する。
無線モジュール7は、Bluetooth(登録商標)規格、Wi−Fi規格に従った無線通信を行うためのものである。SoC2は、無線モジュール7を介して、楽曲を配信するサーバー等から、デジタルオーディオデータを受信する。
マイク8は、音声を集音する。SoC2は、マイク8が集音した音声を、無線モジュール7を介して、サーバーに送信する。マイク8が集音した音声が、ホットワード(所定のキーワード)であった場合、SoC2は、音声コマンドの受付を開始する。具体的には、サーバーは、音声認識機能を有しており、受信した音声が、ホットワードであった場合、音声コマンドの受付開始の指示(コマンド)を、スピーカー装置1に送信する。SoC2は、無線モジュール7を介して、音声コマンドの受付開始の指示を受信した場合、音声コマンドの受付を開始する。なお、ホットワードの認識は、サーバーではなく、スピーカー装置1のSoC2により行われるようになっていてもよい。
また、サーバーは、受信した音声に応じたコマンド等をスピーカー装置1に返信する。SoC2は、無線モジュール7を介して、サーバーが送信したコマンド等を受信する。例えば、ユーザーが「楽曲Aを再生」と発話したとする。この場合、例えば、再生を意味するコマンド「Play」と、テキスト「楽曲A」とが、サーバーからスピーカー装置1に送信される。
カメラ9は、画像を撮影する。SoC2は、カメラ9が撮影した画像が、所定の画像(以下、「音声コマンド開始画像」という。)である場合に、音声コマンドの受付を開始する。また、SoC2は、カメラ9が撮影した画像を、音声コマンドを開始するための音声コマンド開始画像として受け付ける。例えば、ユーザーは、音声により、スピーカー装置1を、音声コマンド開始画像の受付状態とすることができる。SoC2は、所定のキーワードにより、音声コマンド開始画像の受付状態となり、カメラ9により撮影された画像を、音声コマンド開始画像として受け付ける。ユーザーは、所定のキーワードを発した後、例えば、カメラ8に顔を向けることで、顔画像を、音声コマンド開始画像として登録することができる。
SoC2は、受け付けた音声コマンド開始画像がユーザーの顔画像であれば、カメラ9が撮影した画像が、ユーザーの顔画像である場合、音声コマンドの受付を開始する。なお、カメラ9が撮影した音声コマンド開始画像は、記憶部3に記憶されており、SoC2が、カメラ9が撮影した画像が音声コマンド開始画像であるか否かを判断し、カメラ9が撮影した画像が音声コマンド開始画像である場合に、音声コマンドの受付を開始するようになっていてもよい。また、カメラ9が撮影した音声コマンド開始画像は、サーバーに記憶されており、SoC2は、カメラ9が撮影した画像を、無線モジュール7を介して、サーバーに送信し、サーバーは、受信した画像が、音声コマンド開始画像であった場合、音声コマンドの受付開始の指示(コマンド)を、スピーカー装置1に送信し、SoC2は、無線モジュール7を介して、音声コマンドの受付開始の指示を受信した場合、音声コマンドの受付を開始するようになっていてもよい。
以上説明したように、本実施形態では、SoC2は、カメラ9が撮影した画像が、音声コマンド開始画像である場合に、音声コマンドの受付を開始する。例えば、ユーザーは、音声コマンド開始画像として、自身の顔画像を登録すれば、カメラ9に顔を向けるだけで、スピーカー装置1を、音声コマンドの受付状態とすることができる。このように、本発明によれば、ユーザーが、容易に、音声コマンド受付状態にできる電子機器を提供することができる。
以上、本発明の実施形態について説明したが、本発明を適用可能な形態は、上述の実施形態には限られるものではなく、本発明の趣旨を逸脱しない範囲で適宜変更を加えることが可能である。
本発明は、音声認識機能を備える電子機器に好適に採用され得る。
1 スピーカー装置(電子機器)
2 SoC(制御部)
8 マイク
9 カメラ

Claims (4)

  1. カメラと、
    制御部と、を備え、
    前記制御部は、前記カメラが撮影した画像が、所定の画像である場合に、音声コマンドの受付を開始することを特徴とする電子機器。
  2. 前記制御部は、前記カメラが撮影した画像を、前記所定の画像として受け付けることを特徴とする請求項1に記載の電子機器。
  3. 前記所定の画像は、顔画像であることを特徴とする請求項1又は2に記載の電子機器。
  4. マイクをさらに備え、
    前記制御部は、前記マイクが集音した音声が、所定のキーワードである場合に、音声コマンドの受付を開始することを特徴とする請求項1〜3のいずれか1項に記載の電子機器。
JP2019031633A 2019-02-25 2019-02-25 電子機器 Pending JP2020134868A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2019031633A JP2020134868A (ja) 2019-02-25 2019-02-25 電子機器

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2019031633A JP2020134868A (ja) 2019-02-25 2019-02-25 電子機器

Publications (1)

Publication Number Publication Date
JP2020134868A true JP2020134868A (ja) 2020-08-31

Family

ID=72262976

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019031633A Pending JP2020134868A (ja) 2019-02-25 2019-02-25 電子機器

Country Status (1)

Country Link
JP (1) JP2020134868A (ja)

Similar Documents

Publication Publication Date Title
KR102180489B1 (ko) 센서 신호들에 기초한 라이브니스 결정
US8909537B2 (en) Device capable of playing music and method for controlling music playing in electronic device
US9275638B2 (en) Method and apparatus for training a voice recognition model database
US11587560B2 (en) Voice interaction method, device, apparatus and server
US11328722B2 (en) Systems and methods for generating a singular voice audio stream
JP7120313B2 (ja) 生体認証装置、生体認証方法およびプログラム
JP7406874B2 (ja) 電子機器、その制御方法、およびそのプログラム
JP2019184809A (ja) 音声認識装置、音声認識方法
CN103338330A (zh) 一种图像处理方法、装置和终端
JP5251588B2 (ja) 携帯電話端末装置及び通話伝達の判断方法
US9880804B1 (en) Method of automatically adjusting sound output and electronic device
JP2020134868A (ja) 電子機器
JP6846753B2 (ja) コンピュータシステム、Web会議音声補助方法及びプログラム
KR20200056754A (ko) 개인화 립 리딩 모델 생성 방법 및 장치
US11699438B2 (en) Open smart speaker
JP7141226B2 (ja) 音声入力装置、及び遠隔対話システム
CN115019806A (zh) 声纹识别方法和装置
CN113286219A (zh) 具有录音功能的蓝牙耳机及其录音方法
JP6468069B2 (ja) 電子機器制御システム、サーバー、及び、端末装置
JP2014202800A (ja) 音声認識制御装置
JP7088703B2 (ja) 情報処理システム
TWI468983B (zh) 服務啟動方法及系統
US20230108378A1 (en) Power amplifier management
US20150161986A1 (en) Device-based personal speech recognition training
JP6998796B2 (ja) 音声出力装置、音声出力方法及びプログラム

Legal Events

Date Code Title Description
A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A711

Effective date: 20210928