JP2019175455A

JP2019175455A - ワイヤレススピーカの再生モードの切り替え方法、装置及びワイヤレススピーカ

Info

Publication number: JP2019175455A
Application number: JP2019059441A
Authority: JP
Inventors: フアン，ロンファン; Rongfang Huang; ウ，ハイクアン; Haiquan Wu; グ，ウェイフェン; Weifeng Gu; ジャン，エンキン; Enqin Zhang; カオ，レイ; Lei Cao; シ，ルイウェン; Ruiwen Shi
Original assignee: Shenzhen Grandsun Electronics Co Ltd
Current assignee: Shenzhen Grandsun Electronics Co Ltd
Priority date: 2018-03-26
Filing date: 2019-03-26
Publication date: 2019-10-10
Anticipated expiration: 2039-03-26
Also published as: US20190297415A1; US10785559B2; EP3547706B1; JP6773832B2; EP3547706A1; CN108536418A

Abstract

【課題】使用シーンに応じて自動的に再生モードを切り替えることができ、切り替え効率を向上させるワイヤレススピーカの再生モードの切り替え方法、装置、およびワイヤレススピーカを提供する。【解決手段】再生モードの切り替え方法は、カメラおよび／またはマイクロホンアレイによって現在の応用シーンにおけるユーザ情報を取得し、ユーザ情報に対応する再生モードに切り替えるようにワイヤレススピーカを制御する。【選択図】図１

Description

本発明は、スマートホーム技術の分野に関し、特に、ワイヤレススピーカの再生モードの切り替え方法、装置、ワイヤレススピーカおよびコンピュータ可読記憶媒体に関する。

現在、リズムの速い生活は、適切なエンターテインメントがストレスを解消するのに非常に効果的であることを人々が認識するようになってきており、家庭用エンターテイメントの消費は急速に伸び、速くも個々の家庭がスピーカを持つようになってきている。
しかしながら、ユーザが広い場所で従来のスピーカを使用する場合、スピーカの再生モードを切り替えるためにスピーカが配置されている位置に戻って手動で切り替える必要があることが多く、切り替え効率が低い。

これにより、本発明の実施例は、使用シーンに応じて自動的に再生モードを切り替えることができ、切り替え効率を向上させるワイヤレススピーカの再生モードの切り替え方法、装置、およびワイヤレススピーカを提供する。

本発明の実施例による第１の態様は、ワイヤレススピーカの再生モードの切り替え方法を提供し、前記ワイヤレススピーカはカメラとマイクロホンアレイを含み、前記方法は、
前記カメラおよび／またはマイクロホンアレイによって現在の応用シーンにおけるユーザ情報を取得し、
前記ユーザ情報に対応する再生モードに切り替えるように前記ワイヤレススピーカを制御することを含み、
前記ユーザ情報はユーザの年齢情報、ユーザの音声情報、ユーザの位置情報とユーザの数量情報の少なくとも１つを含む。

本発明の実施例による第２の態様はワイヤレススピーカの再生モードの切り替え装置を提供し、前記ワイヤレススピーカはカメラとマイクロホンアレイを含み、前記装置は、
前記カメラおよび／またはマイクロホンアレイによって現在の応用シーンにおけるユーザ情報を取得するために用いられる取得モジュールと、
前記ユーザ情報に対応する再生モードに切り替えるように前記ワイヤレススピーカを制御するために用いられる実行モジュールとを含み、
前記ユーザ情報はユーザの年齢情報、ユーザの音声情報、ユーザの位置情報とユーザの数量情報の少なくとも１つを含む。

本発明の実施例による第３の態様はワイヤレススピーカを提供し、それはメモリと、プロセッサと、メモリに記憶され、プロセッサ上で動作可能なコンピュータプログラムとを備え、上記プロセッサは、上記コンピュータプログラムを実行する時に上記第１の態様に記載の方法を実現する。

本発明の実施例による第４の態様はコンピュータ可読記憶媒体を提供し、上記コンピュータ可読記憶媒体にはコンピュータプログラムを記憶し、上記コンピュータプログラムは、プロセッサによって実行される時に上記第１の態様に記載の方法を実現する。

従来技術と比較し、本発明の実施例は、前記カメラおよび／またはマイクロホンアレイによって現在の応用シーンにおけるユーザ情報を取得し、ユーザ情報に対応する再生モードに切り替えるように前記ワイヤレススピーカを制御するという有益な効果を有する。本発明の実施例によって、使用シーンに応じて自動的に再生モードを切り替え、切り替え効率を高め、ユーザの待ち時間を短縮することができ、使いやすさと実用性が高い。

本発明の実施例における技術的解決手段をより明確に説明するために、以下に実施例または従来技術の説明で用いられる図面を簡単に説明するが、明らかなことに、以下の説明における図面は本発明のいくつかの実施例にすぎず、当業者は、創造的な労働をせずに、これらの図面に基づく他の図面を取得することができる。

本発明の実施例１による提供するワイヤレススピーカの再生モードの切り替え方法のフローチャットである。本発明の実施例２による提供するワイヤレススピーカの再生モードの切り替え方法のフローチャットである。本発明の実施例３による提供するワイヤレススピーカの再生モードの切り替え方法のフローチャットである。本発明の実施例４による提供するワイヤレススピーカの再生モードの切り替え方法のフローチャットである。本発明の実施例５による提供するワイヤレススピーカの再生モードの切り替え方法のフローチャットである。本発明の実施例６による提供するワイヤレススピーカの再生モードの切り替え装置の構造概略図である。本発明の実施例７による提供するワイヤレススピーカの構造概略図である。

以下の説明では、本発明の実施例を徹底的に理解するために、例えば特定のシステム構造、技術などについて具体的な詳細を提供するが、それらは本発明の実施例を説明するためのものであり、本発明を限定するものではない。しかしながら、本発明がこれらの具体的な詳細のない他の実施例においても実現可能であることは当業者であればわかるはずである。他の状況では、本発明の説明を、不必要な詳細に妨げられないように、周知のシステム、装置、回路、および方法についての詳細な説明を省略する。

本明細書および添付の特許請求の範囲で使用されるとき、用語「含む」は、記載された特徴、全体、ステップ、動作、要素および／またはモジュールの存在を示すが、１つまたは複数の他の特徴、全体、ステップ、動作、要素、モジュールおよび／またはそれらのセットの存在または追加を除外しないことに留意すべきである。

また、本明細書の明細書で使用される用語は、特定の実施例を説明するためのものにすぎず、本発明を限定することを意図していない。本発明の明細書および添付の特許請求の範囲において使用されるように、上下文書には他の状況を明示しない限り、単数形の「１」、「１つ」および「該」は複数形を含むことを意味する。
なお、本発明の明細書および添付の特許請求の範囲において使用される「および／または」という用語は、関連で列挙された項目のうちの１つまたは複数の任意の組み合せおよびすべての可能な組み合せを指す。

本明細書および添付の特許請求の範囲で使用されるように、「場合」という用語は、上下文書に応じて、「…のとき」または「一旦」または「確定に応じて」または「検出に応じて」と解釈され得る。同様に、「確定された場合」または「［説明する条件または事象］が検出された場合という連語は、上下文書に応じて、「一旦確定されると」または「確定に応じて」または「［説明する条件または事象］が検出されると」または「［説明する条件または事象］が検出されたことに応じて」と解釈され得る。

本実施例における各ステップの番号の大きさは、実行する順序の前後を意味するものではなく、各過程の実行順序はその機能と内部論理によって定めるものであり、本発明の実施例の実施過程へのいかなる限定を構成するものではいことを理解すべきである。
なお、本発明におけるワイヤレススピーカはカメラとマイクロホンアレイを含み、前記カメラと前記マイクロホンアレイはいずれもマスタ制御モジュールに接続される。

本発明に記載の技術的解決手段を説明するために、以下、特定の実施例によって説明する。
実施例１
図１は本発明の実施例１による提供するワイヤレススピーカの再生モードの切り替え方法のフローチャットであり、該方法は以下のステップを含むことができる：
Ｓ１０１、前記カメラおよび／またはマイクロホンアレイによって現在の応用シーンにおけるユーザ情報を取得する。

本発明の実施例において、前記ユーザ情報はユーザの年齢情報、ユーザの音声情報、ユーザの位置情報とユーザの数量情報の少なくとも１つを含む。
なお、前記ユーザの年齢情報は主に、ユーザがお年寄りであるかどうかを判定するために用いられる；前記ユーザの音声情報は主にプリセットしたウェイクアップキーワードがあるかどうかを判定するために用いられる；前記ユーザの位置情報は主にユーザの位置が前記ワイヤレススピーカの同じ側にあるかどうかを判定するために用いられる；前記ユーザの数量情報は主に現在の応用シーンに複数のユーザがいるかどうかを判定するために用いられる。

Ｓ１０２：前記ユーザ情報に対応する再生モードに切り替えるように前記ワイヤレススピーカを制御する。
本発明の実施例において、前記再生モードは第１の再生モード、第２の再生モード、第３の再生モード、第４の再生モードと現在の３６０度再生モードの少なくとも１つを含む。
任意選択的に、前記ワイヤレススピーカは、Ｗｉｆｉスピーカを含む。

本発明の実施例において、前記カメラおよび／またはマイクロホンアレイによって現在の応用シーンにおけるユーザ情報を取得し、前記ユーザ情報に対応する再生モードに切り替えるように前記ワイヤレススピーカを制御し、それにより、従来技術において再生モードを手動で切り替える必要があるという不都合な問題を解決し、切り替え効率を向上させ、使いやすさと実用性が高い。

実施例２
図２は本発明の実施例２による提供するワイヤレススピーカの再生モードの切り替え方法のフローチャットであり、上記の実施例１におけるステップＳ１０１とＳ１０２への更なる詳細化および説明であり、該方法は以下のステップを含むことができる：
Ｓ２０１：前記カメラによって現在の応用シーンにおけるユーザの顔画像を取得し、前記顔画像における顔特徴を抽出し、前記顔特徴に基づいて前記ユーザの年齢情報を確定し、前記ユーザの年齢情報を現在の応用シーンにおけるユーザ情報とする。

ここでは、ユーザの年齢情報は具体的な年齢値であってもよく、所属する年齢区間であってもよい。
任意選択的に、現在の応用シーンにおけるプリセットエリア内のユーザの顔画像を取得した後、顔認識アルゴリズムを利用して前記ユーザの年齢値または所属する年齢区間を確定する。
任意選択的に、声紋認識技術と組み合わせて前記ユーザの年齢値または所属する年齢区間をさらに確定する。

Ｓ２０２：前記ユーザの年齢情報が第１のプリセット条件を満たす場合、前記年齢情報に対応する第１の再生モードに切り替えるように前記ワイヤレススピーカを制御する。
任意選択的に、前記第１のプリセット条件は年齢６５歳以上を含み、ユーザの年齢値または年齢区間が該区間内にあれば、現在の３６０度再生モードをお年寄りモードに切り替える。
ここでは、前記第１の再生モードはお年寄りモードであり、前記お年寄りモードは主に聴力があまり良くないお年寄り向けであり、お年寄りに敏感ではない特定の周波数のゲインを一定の方向に増加させることによって、音楽や映画の再生効果を高め、それによりお年寄りの音楽鑑賞や映画鑑賞のニーズを満たす。

１例として特定の応用シーンを取り上げると、就業日に、お年寄りが一人で在宅し、前記ワイヤレススピーカはカメラによってお年寄りの顔画像を取得し、ユーザの特徴を認識し、現在の３６０度再生モードをお年寄りモードに自動的に切り替え、お年寄りのために演劇やラジオ放送を再生する。

本発明の実施例において、前記カメラによって現在の応用シーンにおけるユーザの顔画像を取得し、前記顔画像における顔特徴を抽出し、前記顔特徴に基づいて前記ユーザの年齢情報を確定し、前記ユーザの年齢情報を現在の応用シーンにおけるユーザ情報とし、前記ユーザの年齢情報が第１のプリセット条件を満たす場合、前記年齢情報に対応する第１の再生モードに切り替えるように前記ワイヤレススピーカを制御し、広い場所で再生モードを手動で切り替える必要によって行動不便なお年寄りにもたらした不都合を解決し、切り替え効率を高め、ユーザによい経験を与え、使いやすさと実用性が高い。

実施例３
図３は本発明の実施例３による提供するワイヤレススピーカの再生モードの切り替え方法のフローチャットであり、上記の実施例１におけるステップＳ１０１とＳ１０２へのより詳細におよび説明であり、該方法は以下のステップを含むことができる：
Ｓ３０１：前記カメラによって現在の応用シーンにおけるユーザの顔画像を取得し、前記顔画像における顔特徴を抽出し、前記顔特徴に基づいて前記ユーザの年齢情報を確定する。
ここでは、上記ステップＳ３０１は実施例２におけるステップＳ２０１と同様であり、ここでは再び説明しない。

Ｓ３０２：前記ユーザの年齢情報が第１のプリセット条件を満たさない場合、前記マイクロホンアレイによって現在の応用シーンにおけるユーザの音声情報を取得する。
ここでは、前記ワイヤレススピーカは本体の筐体周囲に配置されるマイクロホンアレイによって周囲環境の音声情報を監視し、音声情報を監視した後、内蔵されたウェイクアップワード検出モジュールによってウェイクアップ情報が含まれているかどうかを検出する。

Ｓ３０３：前記音声情報にはプリセットしたウェイクアップキーワードが含まれる場合、前記音声情報に対応する第２の再生モードに切り替えるように前記ワイヤレススピーカを制御する。
任意選択的に、前記プリセットしたウェイクアップキーワードは通常の敏感なワードであり、前記ワイヤレススピーカが成功にウェイクアップされた後、ユーザは音箱に対して、天気の相談、時事の相談など、自分の関心のあるトピックについて相談することができることを理解すべきである。

ここでは、前記第２の再生モードはフォローモードであり、前記フォローモードとは前記ワイヤレススピーカの方向が前記ユーザ音声の出所方向に従うことを意味する。前記フォローモードでのフォロー方向はユーザの音声方向の変化によって何回も変化することができることを理解すべきである。
前記フォローモードでのワイヤレススピーカは、例えば、ユーザが位置する方向でユーザによって提起された質問に答えるといったクラウドサービス機能をユーザに提供することができることに留意すべきである。

１例として特定の応用シーンを取り上げると、ある母親がプリセットしたウェイクアップ情報を通じて前記ワイヤレススピーカをウェイクアップした後に、明日の天気を聞くと、前記ワイヤレススピーカはプリセットしたウェイクアップ情報を検出した後に自動的にフォローモードに切り替え、音声出所の方向で答える。

本発明の実施例において、前記カメラによって現在の応用シーンにおけるユーザの顔画像を取得し、前記顔画像における顔特徴を抽出し、前記顔特徴に基づき前記ユーザの年齢情報を確定し、前記ユーザの年齢情報が第１のプリセット条件を満たさない場合、前記マイクロホンアレイによって現在の応用シーンにおけるユーザの音声情報を取得し、前記音声情報にはプリセットしたウェイクアップキーワードが含まれる場合、前記音声情報に対応する第２の再生モードに切り替えるように前記ワイヤレススピーカを制御し、ここでは、前記第２の再生モードはフォローモードであり、従来技術における必要に応じて再生モードを自動的に切り替えることができないという問題を解決し、切り替え効率を高め、ユーザによい経験を与え、使いやすさと実用性が高い。

実施例４
図４は本発明の実施例４による提供するワイヤレススピーカの再生モードの切り替え方法のフローチャットであり、上記の実施例１におけるステップＳ１０１とＳ１０２へのより詳細におよび説明であり、該方法は以下のステップを含むことができる：
Ｓ４０１：前記カメラによって現在の応用シーンにおけるユーザの顔画像を取得し、前記顔画像における顔特徴を抽出し、前記顔特徴に基づいて前記ユーザの年齢情報を確定する。
Ｓ４０２：前記ユーザの年齢情報が第１のプリセット条件を満たさない場合、前記マイクロホンアレイによって現在の応用シーンにおけるユーザの音声情報を取得する。
ここでは、上記ステップＳ４０１−Ｓ４０２は実施例３におけるステップＳ３０１−Ｓ３０２と同様で、ここでは再び説明しない。

Ｓ４０３：前記音声情報にはプリセットしたウェイクアップキーワードが含まれていない場合、前記音声情報に基づき、ユーザの位置情報を確定し、任意の２つの位置の距離がいずれもプリセット閾値を超えていない場合、前記音声情報の類似度を算出し、算出された前記音声情報の類似度および前記ユーザの位置情報に基づき、ユーザの数量情報を確定する。
任意選択的に、声紋認識アルゴリズムと組み合わせて応用シーンに現れた複数のユーザを識別する。

ユーザが往復移動しているために、前記位置情報にＮ個の異なる位置が含まれ、前記現在の応用シーンにＮ個のユーザを含むことが完全に確定されていない場合、現在の応用シーンにおけるユーザ数量をより正確に確定して対応するモードに切り替えて再生するために、本発明の実施例は任意の２つの位置の距離がいずれもプリセット閾値を超えていない時、前記音声情報の類似度を確定し、２つの位置での音声情報類似度が高ければ（例えば、プリセット値より高い）、プリセット閾値を超えていない２つの位置でのユーザを同一ユーザとして、すべての位置でのユーザ判定を完了するまで上記過程を繰り返して、ユーザの数量情報を生成し、ここではＮは１より大きい整数である。
任意選択的に、前記カメラによってユーザの数量情報を取得する。
Ｓ４０４：前記ユーザの数量が第２のプリセット条件を満たし、前記ユーザの位置がいずれも前記ワイヤレススピーカの同じ側にある場合、第３の再生モードまたは第４再生モードに切り替えるように前記ワイヤレススピーカを制御する。

ここでは、第３の再生モードはシネマモードであり、第４再生モードはステレオモードであり、前記シネマモードは主に映画館の効果をシミュレートするために使用され、ユーザにサラウンドサウンドの感覚を与える。前記ステレオモードはオーディオデータを左、右チャンネルでそれぞれ処理した後に異なる拡声器に出力し、それによりステレオ効果を達成する。
前記ワイヤレススピーカは自体の位置と前記ユーザの位置情報とを比較することで、前記ユーザが前記ワイヤレススピーカの同じ側にいるかどうかを判定することができる。

１例として特定の応用シーンを取り上げると、子供たちがソファーのそばで遊んでいて、前記ワイヤレススピーカが子供向けの歌を再生し、マイクロホンアレイによって彼らの音声情報を取得した後、複数の子供がいて、それらが皆、前記ワイヤレススピーカの同じ側にいると分析した場合、ステレオモードまたはシネマモードに自動的に切り替える。

本発明の実施例において、前記カメラによって現在の応用シーンにおけるユーザの顔画像を取得し、前記顔画像における顔特徴を抽出し、前記顔特徴に基づき前記ユーザの年齢情報を確定し、前記ユーザの年齢情報が第１のプリセット条件を満たさない場合、前記マイクロホンアレイによって現在の応用シーンにおけるユーザの音声情報を取得し、前記音声情報にプリセットしたウェイクアップキーワードが含まれない場合、前記音声情報に基づき、ユーザの位置情報を確定し、任意の２つの位置の距離がいずれもプリセット閾値を超えていない場合、前記音声情報の類似度を算出し、算出された前記音声情報の類似度および前記ユーザの位置情報に基づき、ユーザの数量情報を確定し、前記ユーザの数量が第２のプリセット条件を満たし、前記ユーザの位置がいずれも前記ワイヤレススピーカの同じ側にいる場合、第３の再生モードまたは第４再生モードに切り替えるように前記ワイヤレススピーカを制御し、直接に、環境の変化によって対応する再生モードに自動的に切り替えることができ、ユーザへの依頼性を低下し、切り替え効率を高め、ユーザによい経験を与え、使いやすさと実用性が高い。

実施例５
図５は本発明の実施例４による提供するワイヤレススピーカの再生モードの切り替え方法のフローチャットであり、上記の実施例１におけるステップＳ１０１とＳ１０２へのより詳細におよび説明であり、該方法は以下のステップを含むことができる：
Ｓ５０１：前記カメラによって現在の応用シーンにおけるユーザの顔画像を取得し、前記顔画像における顔特徴を抽出し、前記顔特徴に基づいて前記ユーザの年齢情報を確定する。
Ｓ５０２：前記ユーザの年齢情報が第１のプリセット条件を満たさない場合、前記マイクロホンアレイによって現在の応用シーンにおけるユーザの音声情報を取得する。
Ｓ５０３：前記音声情報にはプリセットしたウェイクアップキーワードが含まれていない場合、前記音声情報に基づき、ユーザの位置情報を確定し、任意の２つの位置の距離がいずれもプリセット閾値を超えていない場合、前記音声情報の類似度を算出し、算出された前記音声情報の類似度および前記ユーザの位置情報に基づき、ユーザの数量情報を確定する。

ここでは、上記ステップＳ５０１−Ｓ５０３は実施例四におけるステップＳ４０１−Ｓ４０３と同様で、ここでは再び説明しない。
Ｓ５０４：前記ユーザの数量情報が第２のプリセット条件を満たし、前記ユーザの位置が前記ワイヤレススピーカの同じ側にない場合、現在の再生モードのままで前記ワイヤレススピーカを制御する。
ここでは、前記現在再生モードは３６０度モードであり、前記ワイヤレススピーカのデフォルトの再生モードであり、前記３６０度モードは全方位再生モードであり、ユーザが各方向で同じ音質効果を聞こえるようにすることができる。

１例として特定の応用シーンを取り上げると、週末のパーティーでは、前記ワイヤレススピーカをリビングルームの真ん中にあるコーヒーテーブルの上に置いてあり、友人や家族達が音楽を聴きながらコミュニケーションをとり、子供たちはリビングルームとダイニングルームで走り、母親たちはダイニングルー厶で料理を用意している場合、前記ワイヤレススピーカはマイクロホンアレイによって現在の応用シーンに異なる方向からの複数のユーザが含まれることを識別し、それで現在の３６０度モードのままで音楽を再生し続ける。

本発明の実施例において、前記カメラによって現在の応用シーンにおけるユーザの顔画像を取得し、前記顔画像における顔特徴を抽出し、前記顔特徴に基づき前記ユーザの年齢情報を確定し、前記ユーザの年齢情報が第１のプリセット条件を満たさない場合、前記マイクロホンアレイによって現在の応用シーンにおけるユーザの音声情報を取得し、前記音声情報にプリセットしたウェイクアップキーワードが含まれていない場合、前記音声情報に基づき、ユーザの位置情報を確定し、任意の２つの位置の距離がいずれもプリセット閾値を超えていない場合、前記音声情報の類似度を算出し、算出された前記音声情報の類似度および前記ユーザの位置情報に基づき、ユーザの数量情報を確定し、前記ユーザの数量情報が第２のプリセット条件を満たし、前記ユーザの位置が前記ワイヤレススピーカの同じ側にない場合、現在の再生モードのままで前記ワイヤレススピーカを制御し、応用シーンにおけるユーザがそれぞれ異なる方向からのものと識別した後、デフォルトの再生モードのままで再生し続け、前記ワイヤレススピーカの切り替え頻度を低下させ、前記ワイヤレススピーカの耐用年数を延長するとともに、ユーザに持続的な再生効果を提供し、ユーザへよい経験を与え、使いやすさと実用性が高い。

実施例６
図６は本発明の実施例６による提供するワイヤレススピーカの再生モードの切り替え装置の構造概略図であり、説明しやすいため、本発明の実施例に関連する部分のみを示す。
該ワイヤレススピーカの再生モードの切り替え装置は前記ワイヤレススピーカに内蔵されるソフトウェアユニット、ハードウェアユニットまたはソフトユニットとハードユニットとの組み合わせであってもよく、単独のペンダントとして前記ワイヤレススピーカに組み込まれてもよい。

前記ワイヤレススピーカの再生モードの切り替え装置は、
カメラおよび／またはマイクロホンアレイによって現在の応用シーンにおけるユーザ情報を取得するために用いられる取得モジュール６１と、
前記ユーザ情報に対応する再生モードに切り替えるように前記ワイヤレススピーカを制御するために用いられる実行モジュール６２とを含み、
ここでは、前記ワイヤレススピーカはカメラとマイクロホンアレイを含み、前記ユーザ情報はユーザの年齢情報、ユーザの音声情報、ユーザの位置情報とユーザの数量情報の少なくとも１つを含む。

任意選択的に、前記取得モジュール６１は具体的に、
前記カメラによって現在の応用シーンにおけるユーザの顔画像を取得し、前記顔画像における顔特徴を抽出し、前記顔特徴に基づいて前記ユーザの年齢情報を確定し、前記ユーザの年齢情報を現在の応用シーンにおけるユーザ情報とするために用いられる第１の取得ユニットと、
前記ユーザの年齢情報が第１のプリセット条件を満たさない場合、前記マイクロホンアレイによって現在の応用シーンにおけるユーザの音声情報を取得するために用いられる第２の取得ユニットと、
前記ユーザの年齢情報が第１のプリセット条件を満たせず、前記音声情報にはプリセットしたウェイクアップキーワードを含まない場合、前記音声情報に基づき、ユーザの位置情報を確定し、任意の２つの位置の距離がいずれもプリセット閾値を超えていない場合、前記音声情報の類似度を算出し、算出された前記音声情報の類似度および前記ユーザの位置情報に基づき、ユーザの数量情報を確定するために用いられる第３の取得ユニットとを含む。

任意選択的に、前記実行モジュール６２は具体的に、
前記ユーザの年齢情報が第１のプリセット条件を満たす場合、前記年齢情報に対応する第１の再生モードであるお年寄りモードに切り替えるように前記ワイヤレススピーカを制御するために用いられる第１の実行ユニットと、
前記音声情報にはプリセットしたウェイクアップキーワードが含まれる場合、前記音声情報に対応する第２の再生モードであるフォローモードに切り替えるように前記ワイヤレススピーカを制御するために用いられる第２の実行ユニットと、
前記ユーザの数量が第２のプリセット条件を満たし、且つ前記ユーザの位置がいずれも前記ワイヤレススピーカの同じ側にある場合、第３の再生モードであるシネマモードまたは第４の再生モードであるステレオモードに切り替えるように前記ワイヤレススピーカを制御するために用いられる第３の実行ユニットと、
前記ユーザの数量情報が第２のプリセット条件を満たし、且つ前記ユーザの位置が前記ワイヤレススピーカの同じ側にない場合、現在の再生モードである３６０度モードのままで前記ワイヤレススピーカを制御するために用いられる第４の実行ユニットとを含む。

実施例７
図７は本発明の実施例７による提供するワイヤレススピーカの構造概略図である。図７に示すように、該実施例のブルートゥーススピーカ７は、プロセッサ７０と、メモリ７１と、前記メモリ７１に記憶されかつ前記プロセッサ７０上で動作可能なコンピュータプログラム７２とを含む。前記プロセッサ７０は前記コンピュータプログラム７２を実行する時に上記方法の実施例１におけるステップ、例えば図１に示されるステップＳ１０１からＳ１０２を実現し、あるいは上記方法の実施例２におけるステップ、例えば図２に示されるステップＳ２０１からＳ２０２を実現する。または、上記方法の実施例３におけるステップ、例えば図３に示されるステップＳ３０１からＳ３０３を実現する。

または、上記方法の実施例４におけるステップ、例えば図４に示されるステップＳ４０１からＳ４０４を実現する。または、上記方法の実施例５におけるステップ、例えば図５に示されるステップＳ５０１からＳ５０４を実現する。前記プロセッサ７０は前記コンピュータプログラム７２を実行する時に上記各装置の実施例における各モジュール／ユニットの機能、例えば図３に示めされるモジュール６１から６２の機能を実現する。

例示的には、前記コンピュータプログラム７２は、１つまたは複数のモジュール／ユニットに分割されることができ、前記１つまたは複数のモジュール／ユニットは前記メモリ７１に記憶され、かつ前記プロセッサ７０によって実行されて本発明を達成する。前記１つまたは複数のモジュール／ユニットは、特定の機能を達成することができる一連のコンピュータプログラムコマンドセグメントであってもよく、前記コマンドセグメントは、前記ワイヤレススピーカ７における前記コンピュータプログラム７２の実行過程を説明するために利用される。例えば、前記コンピュータプログラム７２は取得モジュール、実行モジュールに分割されてもよく、各モジュールの具体的な機能は以下に示すように、
取得モジュールがカメラおよび／またはマイクロホンアレイによって現在の応用シーンにおけるユーザ情報を取得するために用いられ、
実行モジュールは前記ユーザ情報に対応する再生モードに切り替えるように前記ワイヤレススピーカを制御するために用いられ、
前記ワイヤレススピーカ、プロセッサ７０、メモリ７１を含むことができるが、それらに限定されない。当業者であれば理解できるように、図７はワイヤレススピーカ７の１例に過ぎず、ワイヤレススピーカ７に対して制限するものではなく、図示したものより多いまたは少ない構成要素、またはいくつかの構成要素、あるいは異なる構成要素を組み合わせてもよい、例えば、前記ワイヤレススピーカは、入出力装置、ネットワークアクセス装置、バスなどをさらに含むことができる。

前記プロセッサ７０は中央処理ユニット（ＣｅｎｔｒａｌＰｒｏｃｅｓｓｉｎｇＵｎｉｔ、ＣＰＵ）であってもよく、他の汎用プロセッサ、デジタル信号プロセッサ（ＤｉｇｉｔａｌＳｉｇｎａｌＰｒｏｃｅｓｓｏｒ、ＤＳＰ）、特定用途向け集積回路（ＡｐｐｌｉｃａｔｉｏｎＳｐｅｃｉｆｉｃＩｎｔｅｇｒａｔｅｄＣｉｒｃｕｉｔ、ＡＳＩＣ）、フィールドプログラマブルゲートアレイ（Ｆｉｅｌｄ−ＰｒｏｇｒａｍｍａｂｌｅＧａｔｅＡｒｒａｙ、ＦＰＧＡ）または他のプログラマブルロジックデバイス、ディスクリートゲートまたはトランジスタロジックデバイス、ディスクリートハードウェアコンポーネントなどであってもよい。汎用プロセッサは、マイクロプロセッサ、該プロセッサ、または任意の通用プロセッサなどであってもよい。

前記メモリ７１は、ワイヤレススピーカ７のハードディスクやメモリなど、前記ワイヤレススピーカ７の内部記憶ユニットであってもよい。前記メモリ７１は、前記ワイヤレススピーカ７の外部記憶装置、例えば前記ワイヤレススピーカ７に設けられたプラグインハードディスク、スマートメモリカード（ＳｍａｒｔＭｅｄｉａＣａｒｄ，ＳＭＣ）、セキュアデジタル（ＳｅｃｕｒｅＤｉｇｉｔａｌ，ＳＤ）カード、フラッシュカード（ＦｌａｓｈＣａｒｄ）などであってもよい。さらに、前記メモリ７１は、前記ワイヤレススピーカ７の内部記憶ユニットと外部記憶装置の両方を含んでもよい。前記メモリ７１は、前記コンピュータプログラム、および前記ワイヤレススピーカに必要な他のプログラムおよびデータを記憶するために使用される。前記メモリ７１は、出力された、または出力されようとしているデータを一時的に記憶するためにも使用することができる。

当業者は、より便宜および簡潔に説明するために、上述のシステム、装置およびユニットの具体的な作業過程が前述の方法の実施例における対応過程を参照することができ、詳細がここでは再び説明されないことを明確に理解できる。
上記の実施例では、各実施例についての説明が異なり、ある実施例で詳細に説明されていないまたは記載されていない部分は、他の実施例の関連説明を参照することができる。

当業者は、本明細書に開示された実施例に説明された各実施例のモジュール、ユニット、および／または方法ステップによって、電子ハードウェアまたはコンピュータソフトウェアと電子ハードウェアとの組み合わせで実現できることを認識するであろう。これらの機能がハードウェアで実行されるかソフトウェアで実行されるかは、技術的解決手段の特定の応用および設計上の制約条件に従うものである。当業者は、それぞれの特定の応用に対して、説明した機能を実現するために異なる方法を使用することができるが、そのような実現は本発明の範囲を超えたと見なされるべきではない。

本願によって提供されるいくつかの実施例では、開示されたシステム、装置、および方法は他の方法で実現されてもよいことが理解されるべきである。例えば、上述した装置の実施例は単なる例示であり、例えば、前記ユニットの分割は、論理的な機能の分割のみであり、実際に実現する時に他の分割方式、例えば複数のユニット又はモジュールを組み合わせてもよく、別のシステムに集積してもよく、あるいは、いくつかの特徴を無視するか、実行しなくてもよい。または、表示または検討した相互の結合または直接結合または通信接続は、いくつかのインターフェース、装置またはユニットを介した間接結合または通信接続でもよく、電気的、機械的または他の形態でもよい。

分離した構成要素として説明されたユニットは物理的に分離されてもされなくてもよく、ユニットとして表示された構成要素は物理的なユニットでもそうでなくてもよく、すなわち一箇所にあってもよく、複数のネットワークユニットに分布されてもよい。本実施例の解決手段の目的を達成するために、実際の必要性に応じてそのうちの一部またはすべてのユニットを選択することができる。
また、本発明の各実施例における各機能ユニットは、１つの処理ユニットに集積されていてもよく、各ユニットが物理的に別々に存在していてもよく、２つ以上のユニットが１つのユニットに集積されてもよい。上記の集積されたユニットは、ハードウェアの形態またはソフトウェア機能ユニットの形態で実現することができる。

前記集積されたユニットは、ソフトウェア機能ユニットの形で実現され、かつ独立型の製品として販売または使用される時、コンピュータの可読記憶媒体に記憶することができる。このような理解に基づき、本発明は、上述の実施例の方法における全部または一部の流れを実現し、コンピュータプログラムによって関連するハードウェアを指示することで達成してもよく、前記コンピュータプログラムは、コンピュータ可読記憶媒体に記憶することができ、該コンピュータプログラムはプロセッサによって実行される時、上述の各方法の実施例のステップを実現することができる。ここでは、前記コンピュータプログラムは、ソースコード、オブジェクトコード、実行可能ファイル、または何らかの中間形式の形態であり得るコンピュータプログラムコードを含む。前記コンピュータ可読媒体は、前記コンピュータプログラムコードを搬送可能な任意のエンティティまたはデバイス、記録媒体、ＵＳＢメモリ、ポータブルハードディスク、磁気ディスク、光ディスク、コンピュータメモリ、読み取り専用メモリ（ＲＯＭ、Ｒｅａｄ−ＯｎｌｙＭｅｍｏｒｙ）、ランダムアクセスメモリ（ＲＡＭ、ＲａｎｄｏｍＡｃｃｅｓｓＭｅｍｏｒｙ）、電気搬送波信号、電気通信信号およびソフトウェア配布媒体などを含むことができる。前記コンピュータ可読媒体に含まれる内容は、司法管轄区域における立法および特許実務の要件に応じて、適切に増減することができることに留意すべきであり、例えば、いくつかの司法管轄区域において、立法および特許実務に従って、コンピュータ可読媒体は電気搬送波信号および電気通信信号を含まない。

以上に記載のように、以上の実施例は本発明の技術的解決手段を説明するのみに使用され、それらを限定するものではない。上記の実施例を参照して本発明を詳細に説明したが、当業者であれば、上記の各実施例で説明された技術的解決手段を、その本質が本発明の各実施例の趣旨および範囲から逸脱することなく、修正するか、またはその一部の技術的特徴に同等置換を加えることができることを理解されたい。

Claims

ワイヤレススピーカの再生モードの切り替え方法であって、前記ワイヤレススピーカはカメラとマイクロホンアレイを含み、前記方法は、
前記カメラおよび／またはマイクロホンアレイによって現在の応用シーンにおけるユーザ情報を取得し、
前記ユーザ情報に対応する再生モードに切り替えるように前記ワイヤレススピーカを制御することを含み、
前記ユーザ情報はユーザの年齢情報、ユーザの音声情報、ユーザの位置情報とユーザの数量情報の少なくとも１つを含む、ことを特徴とするワイヤレススピーカの再生モードの切り替え方法。
前記の、前記カメラおよび／またはマイクロホンアレイによって現在の応用シーンにおけるユーザ情報を取得することは、
前記カメラによって現在の応用シーンにおけるユーザの顔画像を取得し、
前記顔画像における顔特徴を抽出し、
前記顔特徴に基づいて前記ユーザの年齢情報を確定し、前記ユーザの年齢情報を現在の応用シーンにおけるユーザ情報とすることを含み、
それに対応して、前記ユーザ情報に対応する再生モードに切り替えるように前記ワイヤレススピーカを制御することは、
前記ユーザの年齢情報が第１のプリセット条件を満たす場合、前記年齢情報に対応する第１の再生モードであるお年寄りモードに切り替えるように前記ワイヤレススピーカを制御する、ことを含むことを特徴とする請求項１に記載の方法。
前記の、前記ユーザ情報に対応する再生モードに切り替えるように前記ワイヤレススピーカを制御することは、
前記ユーザの年齢情報が第１のプリセット条件を満たさない場合、前記マイクロホンアレイによって現在の応用シーンにおけるユーザの音声情報を取得し、
前記音声情報にはプリセットしたウェイクアップキーワードが含まれる場合、前記音声情報に対応する第２の再生モードであるフォローモードに切り替えるように前記ワイヤレススピーカを制御することをさらに含む、ことを特徴とする請求項２に記載の方法。
前記ユーザの年齢情報が第１のプリセット条件を満たさない場合、前記マイクロホンアレイによって現在の応用シーンにおけるユーザの音声情報を取得した後に、さらに、
前記音声情報にはプリセットしたウェイクアップキーワードを含まない場合、前記音声情報に基づき、ユーザの位置情報を確定し、
任意の２つの位置の距離がいずれもプリセット閾値を超えていない場合、前記音声情報の類似度を算出し、
算出された前記音声情報の類似度および前記ユーザの位置情報に基づき、ユーザの数量情報を確定し、
前記ユーザの数量が第２のプリセット条件を満たし、且つ前記ユーザの位置がいずれも前記ワイヤレススピーカの同じ側にある場合、第３の再生モードであるシネマモードまたは第４の再生モードであるステレオモードに切り替えるように前記ワイヤレススピーカを制御することを含む、ことを特徴とする請求項３に記載の方法。
算出された前記音声情報の類似度および前記ユーザの位置情報に基づき、ユーザの数量情報を確定した後に、さらに、
前記ユーザの数量情報が第２のプリセット条件を満たし、且つ前記ユーザの位置が前記ワイヤレススピーカの同じ側にない場合、現在の再生モードである３６０度モードのままで前記ワイヤレススピーカを制御する、ことを特徴とする請求項４に記載の方法。
ワイヤレススピーカの再生モードの切り替え装置であって、前記ワイヤレススピーカはカメラとマイクロホンアレイを含み、前記装置は、
前記カメラおよび／またはマイクロホンアレイによって現在の応用シーンにおけるユーザ情報を取得するために用いられる取得モジュールと、
前記ユーザ情報に対応する再生モードに切り替えるように前記ワイヤレススピーカを制御するために用いられる実行モジュールとを含み、
前記ユーザ情報はユーザの年齢情報、ユーザの音声情報、ユーザの位置情報とユーザの数量情報の少なくとも１つを含む、ことを特徴とするワイヤレススピーカの再生モードの切り替え装置。
前記取得モジュールは具体的に、
前記カメラによって現在の応用シーンにおけるユーザの顔画像を取得し、前記顔画像における顔特徴を抽出し、前記顔特徴に基づいて前記ユーザの年齢情報を確定し、前記ユーザの年齢情報を現在の応用シーンにおけるユーザ情報とするために用いられる第１の取得ユニットと、
前記ユーザの年齢情報が第１のプリセット条件を満たさない場合、前記マイクロホンアレイによって現在の応用シーンにおけるユーザの音声情報を取得するために用いられる第２の取得ユニットと、
前記ユーザの年齢情報が第１のプリセット条件を満たせず、前記音声情報にはプリセットしたウェイクアップキーワードを含まない場合、前記音声情報に基づき、ユーザの位置情報を確定し、任意の２つの位置の距離がいずれもプリセット閾値を超えていない場合、前記音声情報の類似度を算出し、算出された前記音声情報の類似度および前記ユーザの位置情報に基づき、ユーザの数量情報を確定するために用いられる第３の取得ユニットとを含む、ことを特徴とする請求項６に記載の装置。
前記実行モジュールは具体的に、
前記ユーザの年齢情報が第１のプリセット条件を満たす場合、前記年齢情報に対応する第１の再生モードであるお年寄りモードに切り替えるように前記ワイヤレススピーカを制御するために用いられる第１の実行ユニットと、
前記音声情報にはプリセットしたウェイクアップキーワードが含まれる場合、前記音声情報に対応する第２の再生モードであるフォローモードに切り替えるように前記ワイヤレススピーカを制御するために用いられる第２の実行ユニットと、
前記ユーザの数量が第２のプリセット条件を満たし、且つ前記ユーザの位置がいずれも前記ワイヤレススピーカの同じ側にある場合、第３の再生モードであるシネマモードまたは第４の再生モードであるステレオモードに切り替えるように前記ワイヤレススピーカを制御するために用いられる第３の実行ユニットと、
前記ユーザの数量情報が第２のプリセット条件を満たし、且つ前記ユーザの位置が前記ワイヤレススピーカの同じ側にない場合、現在の再生モードである３６０度モードのままで前記ワイヤレススピーカを制御するために用いられる第４の実行ユニットとを含む、ことを特徴とする請求項６に記載の装置。
メモリと、プロセッサと、前記メモリに記憶され、前記プロセッサ上で動作可能なコンピュータプログラムとを備えるワイヤレススピーカであって、前記プロセッサは、前記コンピュータプログラムを実行する時に請求項１から５のいずれか一項に記載の方法のステップを実現する、ことを特徴とするワイヤレススピーカ。
コンピュータプログラムを記憶したコンピュータ可読記憶媒体であって、コンピュータプログラムは、プロセッサによって実行される時に請求項１から５のいずれか一項に記載の方法のステップを実現する、ことを特徴とするコンピュータ可読記憶媒体。
前記ユーザの年齢情報はユーザがお年寄りであるかどうかを判定するために用いられ、前記ユーザの音声情報はプリセットされたウェイクアップキーワードがあるかどうかを判定するために用いられ、前記ユーザの位置情報はユーザの位置が前記ワイヤレススピーカの同一側にあるかどうかを判定するために用いられ、前記ユーザの数量情報は主に現在の応用シーンに複数のユーザがいるかどうかを判定するために用いられる、ことを特徴とする請求項１に記載の方法。
前記第１のプリセット条件はユーザの年齢が６５歳以上であることを含む、ことを特徴とする請求項２に記載の方法。
前記ワイヤレススピーカがフォローモードにあるとき、ユーザーは自身で興味を持つトピックについて前記スピーカに相談することができる、ことを特徴とする請求項３に記載の方法。
前記シネマモードは主に映画館の効果ををシミュレートし、ユーザにサラウンドサウンドの感覚を提供するために用いられ、前記ステレオモードはオーディオデータを左、右チャンネルでそれぞれ処理した後に異なるスピーカに出力し、それによりステレオ効果を達成する、ことを特徴とする請求項４に記載の方法。
前記ワイヤレススピーカは、Ｗｉ−Ｆｉスピーカである、ことを特徴とする請求項６に記載の装置。
前記マイクロホンアレイは前記ワイヤレススピーカの本体の筐体周囲に配置される、ことを特徴とする請求項６に記載の装置。