JP2019175455A - ワイヤレススピーカの再生モードの切り替え方法、装置及びワイヤレススピーカ - Google Patents
ワイヤレススピーカの再生モードの切り替え方法、装置及びワイヤレススピーカ Download PDFInfo
- Publication number
- JP2019175455A JP2019175455A JP2019059441A JP2019059441A JP2019175455A JP 2019175455 A JP2019175455 A JP 2019175455A JP 2019059441 A JP2019059441 A JP 2019059441A JP 2019059441 A JP2019059441 A JP 2019059441A JP 2019175455 A JP2019175455 A JP 2019175455A
- Authority
- JP
- Japan
- Prior art keywords
- user
- information
- wireless speaker
- playback mode
- age
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 52
- 230000001815 facial effect Effects 0.000 claims description 31
- 238000004590 computer program Methods 0.000 claims description 21
- 230000000694 effects Effects 0.000 claims description 7
- 239000000284 extract Substances 0.000 claims description 5
- 238000012545 processing Methods 0.000 claims description 3
- 230000006870 function Effects 0.000 description 8
- 230000008569 process Effects 0.000 description 6
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 238000004891 communication Methods 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 125000002066 L-histidyl group Chemical group [H]N1C([H])=NC(C([H])([H])[C@](C(=O)[*])([H])N([H])[H])=C1[H] 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000012790 confirmation Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000033764 rhythmic process Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R1/00—Details of transducers, loudspeakers or microphones
- H04R1/20—Arrangements for obtaining desired frequency or directional characteristics
- H04R1/22—Arrangements for obtaining desired frequency or directional characteristics for obtaining desired frequency characteristic only
- H04R1/28—Transducer mountings or enclosures modified by provision of mechanical or acoustic impedances, e.g. resonator, damping means
- H04R1/2869—Reduction of undesired resonances, i.e. standing waves within enclosure, or of undesired vibrations, i.e. of the enclosure itself
- H04R1/2884—Reduction of undesired resonances, i.e. standing waves within enclosure, or of undesired vibrations, i.e. of the enclosure itself by means of the enclosure structure, i.e. strengthening or shape of the enclosure
- H04R1/2888—Reduction of undesired resonances, i.e. standing waves within enclosure, or of undesired vibrations, i.e. of the enclosure itself by means of the enclosure structure, i.e. strengthening or shape of the enclosure for loudspeaker transducers
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S7/00—Indicating arrangements; Control arrangements, e.g. balance control
- H04S7/30—Control circuits for electronic adaptation of the sound field
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/168—Feature extraction; Face representation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/172—Classification, e.g. identification
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R1/00—Details of transducers, loudspeakers or microphones
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R1/00—Details of transducers, loudspeakers or microphones
- H04R1/08—Mouthpieces; Microphones; Attachments therefor
- H04R1/083—Special constructions of mouthpieces
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R1/00—Details of transducers, loudspeakers or microphones
- H04R1/20—Arrangements for obtaining desired frequency or directional characteristics
- H04R1/32—Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only
- H04R1/40—Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers
- H04R1/406—Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers microphones
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/178—Human faces, e.g. facial parts, sketches or expressions estimating age from face image; using age information for improving recognition
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2420/00—Details of connection covered by H04R, not provided for in its groups
- H04R2420/07—Applications of wireless loudspeakers or wireless microphones
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2400/00—Details of stereophonic systems covered by H04S but not provided for in its groups
- H04S2400/15—Aspects of sound capture and related signal processing for recording or reproduction
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- Theoretical Computer Science (AREA)
- Human Computer Interaction (AREA)
- General Health & Medical Sciences (AREA)
- General Physics & Mathematics (AREA)
- Oral & Maxillofacial Surgery (AREA)
- Otolaryngology (AREA)
- Multimedia (AREA)
- Audiology, Speech & Language Pathology (AREA)
- General Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Circuit For Audible Band Transducer (AREA)
- Telephone Function (AREA)
- User Interface Of Digital Computer (AREA)
Abstract
Description
しかしながら、ユーザが広い場所で従来のスピーカを使用する場合、スピーカの再生モードを切り替えるためにスピーカが配置されている位置に戻って手動で切り替える必要があることが多く、切り替え効率が低い。
前記カメラおよび/またはマイクロホンアレイによって現在の応用シーンにおけるユーザ情報を取得し、
前記ユーザ情報に対応する再生モードに切り替えるように前記ワイヤレススピーカを制御することを含み、
前記ユーザ情報はユーザの年齢情報、ユーザの音声情報、ユーザの位置情報とユーザの数量情報の少なくとも1つを含む。
前記カメラおよび/またはマイクロホンアレイによって現在の応用シーンにおけるユーザ情報を取得するために用いられる取得モジュールと、
前記ユーザ情報に対応する再生モードに切り替えるように前記ワイヤレススピーカを制御するために用いられる実行モジュールとを含み、
前記ユーザ情報はユーザの年齢情報、ユーザの音声情報、ユーザの位置情報とユーザの数量情報の少なくとも1つを含む。
なお、本発明の明細書および添付の特許請求の範囲において使用される「および/または」という用語は、関連で列挙された項目のうちの1つまたは複数の任意の組み合せおよびすべての可能な組み合せを指す。
なお、本発明におけるワイヤレススピーカはカメラとマイクロホンアレイを含み、前記カメラと前記マイクロホンアレイはいずれもマスタ制御モジュールに接続される。
実施例1
図1は本発明の実施例1による提供するワイヤレススピーカの再生モードの切り替え方法のフローチャットであり、該方法は以下のステップを含むことができる:
S101、前記カメラおよび/またはマイクロホンアレイによって現在の応用シーンにおけるユーザ情報を取得する。
なお、前記ユーザの年齢情報は主に、ユーザがお年寄りであるかどうかを判定するために用いられる;前記ユーザの音声情報は主にプリセットしたウェイクアップキーワードがあるかどうかを判定するために用いられる;前記ユーザの位置情報は主にユーザの位置が前記ワイヤレススピーカの同じ側にあるかどうかを判定するために用いられる;前記ユーザの数量情報は主に現在の応用シーンに複数のユーザがいるかどうかを判定するために用いられる。
本発明の実施例において、前記再生モードは第1の再生モード、第2の再生モード、第3の再生モード、第4の再生モードと現在の360度再生モードの少なくとも1つを含む。
任意選択的に、前記ワイヤレススピーカは、Wifiスピーカを含む。
図2は本発明の実施例2による提供するワイヤレススピーカの再生モードの切り替え方法のフローチャットであり、上記の実施例1におけるステップS101とS102への更なる詳細化および説明であり、該方法は以下のステップを含むことができる:
S201:前記カメラによって現在の応用シーンにおけるユーザの顔画像を取得し、前記顔画像における顔特徴を抽出し、前記顔特徴に基づいて前記ユーザの年齢情報を確定し、前記ユーザの年齢情報を現在の応用シーンにおけるユーザ情報とする。
任意選択的に、現在の応用シーンにおけるプリセットエリア内のユーザの顔画像を取得した後、顔認識アルゴリズムを利用して前記ユーザの年齢値または所属する年齢区間を確定する。
任意選択的に、声紋認識技術と組み合わせて前記ユーザの年齢値または所属する年齢区間をさらに確定する。
任意選択的に、前記第1のプリセット条件は年齢65歳以上を含み、ユーザの年齢値または年齢区間が該区間内にあれば、現在の360度再生モードをお年寄りモードに切り替える。
ここでは、前記第1の再生モードはお年寄りモードであり、前記お年寄りモードは主に聴力があまり良くないお年寄り向けであり、お年寄りに敏感ではない特定の周波数のゲインを一定の方向に増加させることによって、音楽や映画の再生効果を高め、それによりお年寄りの音楽鑑賞や映画鑑賞のニーズを満たす。
図3は本発明の実施例3による提供するワイヤレススピーカの再生モードの切り替え方法のフローチャットであり、上記の実施例1におけるステップS101とS102へのより詳細におよび説明であり、該方法は以下のステップを含むことができる:
S301:前記カメラによって現在の応用シーンにおけるユーザの顔画像を取得し、前記顔画像における顔特徴を抽出し、前記顔特徴に基づいて前記ユーザの年齢情報を確定する。
ここでは、上記ステップS301は実施例2におけるステップS201と同様であり、ここでは再び説明しない。
ここでは、前記ワイヤレススピーカは本体の筐体周囲に配置されるマイクロホンアレイによって周囲環境の音声情報を監視し、音声情報を監視した後、内蔵されたウェイクアップワード検出モジュールによってウェイクアップ情報が含まれているかどうかを検出する。
任意選択的に、前記プリセットしたウェイクアップキーワードは通常の敏感なワードであり、前記ワイヤレススピーカが成功にウェイクアップされた後、ユーザは音箱に対して、天気の相談、時事の相談など、自分の関心のあるトピックについて相談することができることを理解すべきである。
前記フォローモードでのワイヤレススピーカは、例えば、ユーザが位置する方向でユーザによって提起された質問に答えるといったクラウドサービス機能をユーザに提供することができることに留意すべきである。
図4は本発明の実施例4による提供するワイヤレススピーカの再生モードの切り替え方法のフローチャットであり、上記の実施例1におけるステップS101とS102へのより詳細におよび説明であり、該方法は以下のステップを含むことができる:
S401:前記カメラによって現在の応用シーンにおけるユーザの顔画像を取得し、前記顔画像における顔特徴を抽出し、前記顔特徴に基づいて前記ユーザの年齢情報を確定する。
S402:前記ユーザの年齢情報が第1のプリセット条件を満たさない場合、前記マイクロホンアレイによって現在の応用シーンにおけるユーザの音声情報を取得する。
ここでは、上記ステップS401−S402は実施例3におけるステップS301−S302と同様で、ここでは再び説明しない。
任意選択的に、声紋認識アルゴリズムと組み合わせて応用シーンに現れた複数のユーザを識別する。
任意選択的に、前記カメラによってユーザの数量情報を取得する。
S404:前記ユーザの数量が第2のプリセット条件を満たし、前記ユーザの位置がいずれも前記ワイヤレススピーカの同じ側にある場合、第3の再生モードまたは第4再生モードに切り替えるように前記ワイヤレススピーカを制御する。
前記ワイヤレススピーカは自体の位置と前記ユーザの位置情報とを比較することで、前記ユーザが前記ワイヤレススピーカの同じ側にいるかどうかを判定することができる。
図5は本発明の実施例4による提供するワイヤレススピーカの再生モードの切り替え方法のフローチャットであり、上記の実施例1におけるステップS101とS102へのより詳細におよび説明であり、該方法は以下のステップを含むことができる:
S501:前記カメラによって現在の応用シーンにおけるユーザの顔画像を取得し、前記顔画像における顔特徴を抽出し、前記顔特徴に基づいて前記ユーザの年齢情報を確定する。
S502:前記ユーザの年齢情報が第1のプリセット条件を満たさない場合、前記マイクロホンアレイによって現在の応用シーンにおけるユーザの音声情報を取得する。
S503:前記音声情報にはプリセットしたウェイクアップキーワードが含まれていない場合、前記音声情報に基づき、ユーザの位置情報を確定し、任意の2つの位置の距離がいずれもプリセット閾値を超えていない場合、前記音声情報の類似度を算出し、算出された前記音声情報の類似度および前記ユーザの位置情報に基づき、ユーザの数量情報を確定する。
S504:前記ユーザの数量情報が第2のプリセット条件を満たし、前記ユーザの位置が前記ワイヤレススピーカの同じ側にない場合、現在の再生モードのままで前記ワイヤレススピーカを制御する。
ここでは、前記現在再生モードは360度モードであり、前記ワイヤレススピーカのデフォルトの再生モードであり、前記360度モードは全方位再生モードであり、ユーザが各方向で同じ音質効果を聞こえるようにすることができる。
図6は本発明の実施例6による提供するワイヤレススピーカの再生モードの切り替え装置の構造概略図であり、説明しやすいため、本発明の実施例に関連する部分のみを示す。
該ワイヤレススピーカの再生モードの切り替え装置は前記ワイヤレススピーカに内蔵されるソフトウェアユニット、ハードウェアユニットまたはソフトユニットとハードユニットとの組み合わせであってもよく、単独のペンダントとして前記ワイヤレススピーカに組み込まれてもよい。
カメラおよび/またはマイクロホンアレイによって現在の応用シーンにおけるユーザ情報を取得するために用いられる取得モジュール61と、
前記ユーザ情報に対応する再生モードに切り替えるように前記ワイヤレススピーカを制御するために用いられる実行モジュール62とを含み、
ここでは、前記ワイヤレススピーカはカメラとマイクロホンアレイを含み、前記ユーザ情報はユーザの年齢情報、ユーザの音声情報、ユーザの位置情報とユーザの数量情報の少なくとも1つを含む。
前記カメラによって現在の応用シーンにおけるユーザの顔画像を取得し、前記顔画像における顔特徴を抽出し、前記顔特徴に基づいて前記ユーザの年齢情報を確定し、前記ユーザの年齢情報を現在の応用シーンにおけるユーザ情報とするために用いられる第1の取得ユニットと、
前記ユーザの年齢情報が第1のプリセット条件を満たさない場合、前記マイクロホンアレイによって現在の応用シーンにおけるユーザの音声情報を取得するために用いられる第2の取得ユニットと、
前記ユーザの年齢情報が第1のプリセット条件を満たせず、前記音声情報にはプリセットしたウェイクアップキーワードを含まない場合、前記音声情報に基づき、ユーザの位置情報を確定し、任意の2つの位置の距離がいずれもプリセット閾値を超えていない場合、前記音声情報の類似度を算出し、算出された前記音声情報の類似度および前記ユーザの位置情報に基づき、ユーザの数量情報を確定するために用いられる第3の取得ユニットとを含む。
前記ユーザの年齢情報が第1のプリセット条件を満たす場合、前記年齢情報に対応する第1の再生モードであるお年寄りモードに切り替えるように前記ワイヤレススピーカを制御するために用いられる第1の実行ユニットと、
前記音声情報にはプリセットしたウェイクアップキーワードが含まれる場合、前記音声情報に対応する第2の再生モードであるフォローモードに切り替えるように前記ワイヤレススピーカを制御するために用いられる第2の実行ユニットと、
前記ユーザの数量が第2のプリセット条件を満たし、且つ前記ユーザの位置がいずれも前記ワイヤレススピーカの同じ側にある場合、第3の再生モードであるシネマモードまたは第4の再生モードであるステレオモードに切り替えるように前記ワイヤレススピーカを制御するために用いられる第3の実行ユニットと、
前記ユーザの数量情報が第2のプリセット条件を満たし、且つ前記ユーザの位置が前記ワイヤレススピーカの同じ側にない場合、現在の再生モードである360度モードのままで前記ワイヤレススピーカを制御するために用いられる第4の実行ユニットとを含む。
図7は本発明の実施例7による提供するワイヤレススピーカの構造概略図である。図7に示すように、該実施例のブルートゥーススピーカ7は、プロセッサ70と、メモリ71と、前記メモリ71に記憶されかつ前記プロセッサ70上で動作可能なコンピュータプログラム72とを含む。前記プロセッサ70は前記コンピュータプログラム72を実行する時に上記方法の実施例1におけるステップ、例えば図1に示されるステップS101からS102を実現し、あるいは上記方法の実施例2におけるステップ、例えば図2に示されるステップS201からS202を実現する。または、上記方法の実施例3におけるステップ、例えば図3に示されるステップS301からS303を実現する。
取得モジュールがカメラおよび/またはマイクロホンアレイによって現在の応用シーンにおけるユーザ情報を取得するために用いられ、
実行モジュールは前記ユーザ情報に対応する再生モードに切り替えるように前記ワイヤレススピーカを制御するために用いられ、
前記ワイヤレススピーカ、プロセッサ70、メモリ71を含むことができるが、それらに限定されない。当業者であれば理解できるように、図7はワイヤレススピーカ7の1例に過ぎず、ワイヤレススピーカ7に対して制限するものではなく、図示したものより多いまたは少ない構成要素、またはいくつかの構成要素、あるいは異なる構成要素を組み合わせてもよい、例えば、前記ワイヤレススピーカは、入出力装置、ネットワークアクセス装置、バスなどをさらに含むことができる。
上記の実施例では、各実施例についての説明が異なり、ある実施例で詳細に説明されていないまたは記載されていない部分は、他の実施例の関連説明を参照することができる。
また、本発明の各実施例における各機能ユニットは、1つの処理ユニットに集積されていてもよく、各ユニットが物理的に別々に存在していてもよく、2つ以上のユニットが1つのユニットに集積されてもよい。上記の集積されたユニットは、ハードウェアの形態またはソフトウェア機能ユニットの形態で実現することができる。
Claims (16)
- ワイヤレススピーカの再生モードの切り替え方法であって、前記ワイヤレススピーカはカメラとマイクロホンアレイを含み、前記方法は、
前記カメラおよび/またはマイクロホンアレイによって現在の応用シーンにおけるユーザ情報を取得し、
前記ユーザ情報に対応する再生モードに切り替えるように前記ワイヤレススピーカを制御することを含み、
前記ユーザ情報はユーザの年齢情報、ユーザの音声情報、ユーザの位置情報とユーザの数量情報の少なくとも1つを含む、ことを特徴とするワイヤレススピーカの再生モードの切り替え方法。 - 前記の、前記カメラおよび/またはマイクロホンアレイによって現在の応用シーンにおけるユーザ情報を取得することは、
前記カメラによって現在の応用シーンにおけるユーザの顔画像を取得し、
前記顔画像における顔特徴を抽出し、
前記顔特徴に基づいて前記ユーザの年齢情報を確定し、前記ユーザの年齢情報を現在の応用シーンにおけるユーザ情報とすることを含み、
それに対応して、前記ユーザ情報に対応する再生モードに切り替えるように前記ワイヤレススピーカを制御することは、
前記ユーザの年齢情報が第1のプリセット条件を満たす場合、前記年齢情報に対応する第1の再生モードであるお年寄りモードに切り替えるように前記ワイヤレススピーカを制御する、ことを含むことを特徴とする請求項1に記載の方法。 - 前記の、前記ユーザ情報に対応する再生モードに切り替えるように前記ワイヤレススピーカを制御することは、
前記ユーザの年齢情報が第1のプリセット条件を満たさない場合、前記マイクロホンアレイによって現在の応用シーンにおけるユーザの音声情報を取得し、
前記音声情報にはプリセットしたウェイクアップキーワードが含まれる場合、前記音声情報に対応する第2の再生モードであるフォローモードに切り替えるように前記ワイヤレススピーカを制御することをさらに含む、ことを特徴とする請求項2に記載の方法。 - 前記ユーザの年齢情報が第1のプリセット条件を満たさない場合、前記マイクロホンアレイによって現在の応用シーンにおけるユーザの音声情報を取得した後に、さらに、
前記音声情報にはプリセットしたウェイクアップキーワードを含まない場合、前記音声情報に基づき、ユーザの位置情報を確定し、
任意の2つの位置の距離がいずれもプリセット閾値を超えていない場合、前記音声情報の類似度を算出し、
算出された前記音声情報の類似度および前記ユーザの位置情報に基づき、ユーザの数量情報を確定し、
前記ユーザの数量が第2のプリセット条件を満たし、且つ前記ユーザの位置がいずれも前記ワイヤレススピーカの同じ側にある場合、第3の再生モードであるシネマモードまたは第4の再生モードであるステレオモードに切り替えるように前記ワイヤレススピーカを制御することを含む、ことを特徴とする請求項3に記載の方法。 - 算出された前記音声情報の類似度および前記ユーザの位置情報に基づき、ユーザの数量情報を確定した後に、さらに、
前記ユーザの数量情報が第2のプリセット条件を満たし、且つ前記ユーザの位置が前記ワイヤレススピーカの同じ側にない場合、現在の再生モードである360度モードのままで前記ワイヤレススピーカを制御する、ことを特徴とする請求項4に記載の方法。 - ワイヤレススピーカの再生モードの切り替え装置であって、前記ワイヤレススピーカはカメラとマイクロホンアレイを含み、前記装置は、
前記カメラおよび/またはマイクロホンアレイによって現在の応用シーンにおけるユーザ情報を取得するために用いられる取得モジュールと、
前記ユーザ情報に対応する再生モードに切り替えるように前記ワイヤレススピーカを制御するために用いられる実行モジュールとを含み、
前記ユーザ情報はユーザの年齢情報、ユーザの音声情報、ユーザの位置情報とユーザの数量情報の少なくとも1つを含む、ことを特徴とするワイヤレススピーカの再生モードの切り替え装置。 - 前記取得モジュールは具体的に、
前記カメラによって現在の応用シーンにおけるユーザの顔画像を取得し、前記顔画像における顔特徴を抽出し、前記顔特徴に基づいて前記ユーザの年齢情報を確定し、前記ユーザの年齢情報を現在の応用シーンにおけるユーザ情報とするために用いられる第1の取得ユニットと、
前記ユーザの年齢情報が第1のプリセット条件を満たさない場合、前記マイクロホンアレイによって現在の応用シーンにおけるユーザの音声情報を取得するために用いられる第2の取得ユニットと、
前記ユーザの年齢情報が第1のプリセット条件を満たせず、前記音声情報にはプリセットしたウェイクアップキーワードを含まない場合、前記音声情報に基づき、ユーザの位置情報を確定し、任意の2つの位置の距離がいずれもプリセット閾値を超えていない場合、前記音声情報の類似度を算出し、算出された前記音声情報の類似度および前記ユーザの位置情報に基づき、ユーザの数量情報を確定するために用いられる第3の取得ユニットとを含む、ことを特徴とする請求項6に記載の装置。 - 前記実行モジュールは具体的に、
前記ユーザの年齢情報が第1のプリセット条件を満たす場合、前記年齢情報に対応する第1の再生モードであるお年寄りモードに切り替えるように前記ワイヤレススピーカを制御するために用いられる第1の実行ユニットと、
前記音声情報にはプリセットしたウェイクアップキーワードが含まれる場合、前記音声情報に対応する第2の再生モードであるフォローモードに切り替えるように前記ワイヤレススピーカを制御するために用いられる第2の実行ユニットと、
前記ユーザの数量が第2のプリセット条件を満たし、且つ前記ユーザの位置がいずれも前記ワイヤレススピーカの同じ側にある場合、第3の再生モードであるシネマモードまたは第4の再生モードであるステレオモードに切り替えるように前記ワイヤレススピーカを制御するために用いられる第3の実行ユニットと、
前記ユーザの数量情報が第2のプリセット条件を満たし、且つ前記ユーザの位置が前記ワイヤレススピーカの同じ側にない場合、現在の再生モードである360度モードのままで前記ワイヤレススピーカを制御するために用いられる第4の実行ユニットとを含む、ことを特徴とする請求項6に記載の装置。 - メモリと、プロセッサと、前記メモリに記憶され、前記プロセッサ上で動作可能なコンピュータプログラムとを備えるワイヤレススピーカであって、前記プロセッサは、前記コンピュータプログラムを実行する時に請求項1から5のいずれか一項に記載の方法のステップを実現する、ことを特徴とするワイヤレススピーカ。
- コンピュータプログラムを記憶したコンピュータ可読記憶媒体であって、コンピュータプログラムは、プロセッサによって実行される時に請求項1から5のいずれか一項に記載の方法のステップを実現する、ことを特徴とするコンピュータ可読記憶媒体。
- 前記ユーザの年齢情報はユーザがお年寄りであるかどうかを判定するために用いられ、前記ユーザの音声情報はプリセットされたウェイクアップキーワードがあるかどうかを判定するために用いられ、前記ユーザの位置情報はユーザの位置が前記ワイヤレススピーカの同一側にあるかどうかを判定するために用いられ、前記ユーザの数量情報は主に現在の応用シーンに複数のユーザがいるかどうかを判定するために用いられる、ことを特徴とする請求項1に記載の方法。
- 前記第1のプリセット条件はユーザの年齢が65歳以上であることを含む、ことを特徴とする請求項2に記載の方法。
- 前記ワイヤレススピーカがフォローモードにあるとき、ユーザーは自身で興味を持つトピックについて前記スピーカに相談することができる、ことを特徴とする請求項3に記載の方法。
- 前記シネマモードは主に映画館の効果ををシミュレートし、ユーザにサラウンドサウンドの感覚を提供するために用いられ、前記ステレオモードはオーディオデータを左、右チャンネルでそれぞれ処理した後に異なるスピーカに出力し、それによりステレオ効果を達成する、ことを特徴とする請求項4に記載の方法。
- 前記ワイヤレススピーカは、Wi−Fiスピーカである、ことを特徴とする請求項6に記載の装置。
- 前記マイクロホンアレイは前記ワイヤレススピーカの本体の筐体周囲に配置される、ことを特徴とする請求項6に記載の装置。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810250963.5A CN108536418A (zh) | 2018-03-26 | 2018-03-26 | 一种无线音箱播放模式切换的方法、装置及无线音箱 |
CN201810250963.5 | 2018-03-26 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2019175455A true JP2019175455A (ja) | 2019-10-10 |
JP6773832B2 JP6773832B2 (ja) | 2020-10-21 |
Family
ID=63484247
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019059441A Active JP6773832B2 (ja) | 2018-03-26 | 2019-03-26 | ワイヤレススピーカの再生モードの切り替え方法、装置及びワイヤレススピーカ |
Country Status (4)
Country | Link |
---|---|
US (1) | US10785559B2 (ja) |
EP (1) | EP3547706B1 (ja) |
JP (1) | JP6773832B2 (ja) |
CN (1) | CN108536418A (ja) |
Families Citing this family (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109407843A (zh) * | 2018-10-22 | 2019-03-01 | 珠海格力电器股份有限公司 | 控制多媒体播放的方法及装置、存储介质、电子装置 |
CN111667843B (zh) * | 2019-03-05 | 2021-12-31 | 北京京东尚科信息技术有限公司 | 终端设备的语音唤醒方法、系统、电子设备、存储介质 |
KR20190106921A (ko) * | 2019-08-30 | 2019-09-18 | 엘지전자 주식회사 | 커뮤니케이션 로봇 및 그의 구동 방법 |
CN111026263B (zh) * | 2019-11-26 | 2021-10-15 | 维沃移动通信有限公司 | 一种音频播放方法及电子设备 |
CN111182389A (zh) * | 2019-12-09 | 2020-05-19 | 广东小天才科技有限公司 | 一种视频播放的方法以及音箱设备 |
CN111491251A (zh) * | 2019-12-26 | 2020-08-04 | 马艺 | 音箱阵列运行管控平台 |
CN111787101B (zh) * | 2020-06-30 | 2022-07-26 | 北京百度网讯科技有限公司 | 终端执行的音箱控制方法及应用于音箱的控制方法 |
CN112078498B (zh) * | 2020-09-11 | 2022-03-18 | 广州小鹏汽车科技有限公司 | 一种车辆智能座舱的声音输出控制方法和智能座舱 |
US11442753B1 (en) * | 2020-10-14 | 2022-09-13 | Wells Fargo Bank, N.A. | Apparatuses, computer-implemented methods, and computer program products for displaying dynamic user interfaces to multiple users on the same interface |
CN113207060B (zh) * | 2020-12-28 | 2023-07-18 | 汉桑(南京)科技股份有限公司 | 一种音响参数确定方法和系统 |
US11895466B2 (en) | 2020-12-28 | 2024-02-06 | Hansong (Nanjing) Technology Ltd. | Methods and systems for determining parameters of audio devices |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007280442A (ja) * | 2006-04-03 | 2007-10-25 | Pioneer Electronic Corp | 情報再生装置、リスト作成方法、リスト作成プログラムおよび記録媒体 |
JP2008177745A (ja) * | 2007-01-17 | 2008-07-31 | Yamaha Corp | 放収音システム |
JP2009301323A (ja) * | 2008-06-13 | 2009-12-24 | Hitachi Ltd | 画像表示装置 |
JP2014137627A (ja) * | 2013-01-15 | 2014-07-28 | Sony Corp | 入力装置、出力装置および記憶媒体 |
JP2017500785A (ja) * | 2013-11-22 | 2017-01-05 | アップル インコーポレイテッド | ハンズフリー・ビームパターン構成 |
Family Cites Families (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011504710A (ja) * | 2007-11-21 | 2011-02-10 | ジェスチャー テック,インコーポレイテッド | メディア嗜好 |
JP2013057705A (ja) * | 2011-09-07 | 2013-03-28 | Sony Corp | 音声処理装置、音声処理方法および音声出力装置 |
CN103177750A (zh) | 2011-12-20 | 2013-06-26 | 富泰华工业(深圳)有限公司 | 音频播放装置及其控制方法 |
US9225307B2 (en) * | 2012-06-28 | 2015-12-29 | Sonos, Inc. | Modification of audio responsive to proximity detection |
US8965033B2 (en) * | 2012-08-31 | 2015-02-24 | Sonos, Inc. | Acoustic optimization |
CN102945672B (zh) * | 2012-09-29 | 2013-10-16 | 深圳市国华识别科技开发有限公司 | 一种多媒体设备语音控制系统及方法 |
EP2955934B1 (en) * | 2013-02-05 | 2017-09-20 | Toa Corporation | Amplification system |
CN104053060A (zh) | 2013-03-15 | 2014-09-17 | 富泰华工业(深圳)有限公司 | 智能电视及其电视节目播放方法 |
US9769552B2 (en) * | 2014-08-19 | 2017-09-19 | Apple Inc. | Method and apparatus for estimating talker distance |
CN106548792A (zh) * | 2015-09-17 | 2017-03-29 | 阿里巴巴集团控股有限公司 | 智能音箱装置、移动终端及音乐播放处理方法 |
US9699580B2 (en) * | 2015-09-28 | 2017-07-04 | International Business Machines Corporation | Electronic media volume control |
WO2017120469A1 (en) * | 2016-01-06 | 2017-07-13 | Tvision Insights, Inc. | Systems and methods for assessing viewer engagement |
CN106250095A (zh) * | 2016-07-29 | 2016-12-21 | 捷开通讯(深圳)有限公司 | 一种播放模式自动选择方法、系统及电子设备 |
CN106341756B (zh) * | 2016-08-29 | 2020-07-31 | 北海爱飞数码科技有限公司 | 个性化智能音箱 |
CN106648524A (zh) * | 2016-09-30 | 2017-05-10 | 四川九洲电器集团有限责任公司 | 一种音频播放方法及音频播放设备 |
CN106792341A (zh) * | 2016-11-23 | 2017-05-31 | 广东小天才科技有限公司 | 一种音频输出方法、装置及终端设备 |
CN107632814A (zh) * | 2017-09-25 | 2018-01-26 | 珠海格力电器股份有限公司 | 音频信息的播放方法、装置和系统、存储介质、处理器 |
-
2018
- 2018-03-26 CN CN201810250963.5A patent/CN108536418A/zh active Pending
-
2019
- 2019-03-25 US US16/364,123 patent/US10785559B2/en active Active
- 2019-03-26 EP EP19165081.1A patent/EP3547706B1/en active Active
- 2019-03-26 JP JP2019059441A patent/JP6773832B2/ja active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007280442A (ja) * | 2006-04-03 | 2007-10-25 | Pioneer Electronic Corp | 情報再生装置、リスト作成方法、リスト作成プログラムおよび記録媒体 |
JP2008177745A (ja) * | 2007-01-17 | 2008-07-31 | Yamaha Corp | 放収音システム |
JP2009301323A (ja) * | 2008-06-13 | 2009-12-24 | Hitachi Ltd | 画像表示装置 |
JP2014137627A (ja) * | 2013-01-15 | 2014-07-28 | Sony Corp | 入力装置、出力装置および記憶媒体 |
JP2017500785A (ja) * | 2013-11-22 | 2017-01-05 | アップル インコーポレイテッド | ハンズフリー・ビームパターン構成 |
Also Published As
Publication number | Publication date |
---|---|
US20190297415A1 (en) | 2019-09-26 |
US10785559B2 (en) | 2020-09-22 |
EP3547706B1 (en) | 2023-05-10 |
JP6773832B2 (ja) | 2020-10-21 |
EP3547706A1 (en) | 2019-10-02 |
CN108536418A (zh) | 2018-09-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6773832B2 (ja) | ワイヤレススピーカの再生モードの切り替え方法、装置及びワイヤレススピーカ | |
US11251763B2 (en) | Audio signal adjustment method, storage medium, and terminal | |
CN107509153B (zh) | 声音播放器件的检测方法、装置、存储介质及终端 | |
CN110580141B (zh) | 移动终端 | |
CN114175686B (zh) | 音频处理方法和系统及相关非暂时性介质 | |
US11614785B2 (en) | Network identification of portable electronic devices while changing power states | |
CN111083678B (zh) | 蓝牙音箱的播放控制方法、系统及智能设备 | |
WO2018072391A1 (zh) | 一种听力保护方法、装置及系统 | |
WO2019033987A1 (zh) | 提示方法、装置、存储介质及终端 | |
US20190179605A1 (en) | Audio device and a system of audio devices | |
CN109413537A (zh) | 音频信号播放方法、装置及耳机 | |
US11758326B2 (en) | Wearable audio device within a distributed audio playback system | |
US20220164162A1 (en) | Power management and distributed audio processing techniques for playback devices | |
WO2019033940A1 (zh) | 音量调节方法、装置、终端设备及存储介质 | |
US20150049879A1 (en) | Method of audio processing and audio-playing device | |
CN113676595B (zh) | 音量调节方法、终端设备以及计算机可读存储介质 | |
US20150181353A1 (en) | Hearing aid for playing audible advertisement or audible data | |
US20230401028A1 (en) | Vocal guidance engines for playback devices | |
CN111107226A (zh) | 应用于移动终端的音量控制方法 | |
CN111081237B (zh) | 音箱的播放控制方法、系统及智能设备 | |
CN102821337B (zh) | 音效切换方法和音响系统 | |
US20220377468A1 (en) | Systems and methods for hearing assistance | |
US11943823B2 (en) | Techniques to reduce time to music for a playback device | |
CN206524936U (zh) | 一种智能侦测wifi音箱 | |
Smaka | Introducing ReSound LiNX, Made for iPhone Hearing Aid. |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20190327 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20200529 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20200604 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20200903 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20200917 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20201001 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6773832 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |