JP2016107978A - 顔認識を使用した調整スピーカ - Google Patents

顔認識を使用した調整スピーカ Download PDF

Info

Publication number
JP2016107978A
JP2016107978A JP2015226572A JP2015226572A JP2016107978A JP 2016107978 A JP2016107978 A JP 2016107978A JP 2015226572 A JP2015226572 A JP 2015226572A JP 2015226572 A JP2015226572 A JP 2015226572A JP 2016107978 A JP2016107978 A JP 2016107978A
Authority
JP
Japan
Prior art keywords
user
speaker
coordinates
location
control signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2015226572A
Other languages
English (en)
Other versions
JP6829541B2 (ja
Inventor
マイケル トレステン クリストファー
Michael Trestain Christopher
マイケル トレステン クリストファー
ジェイムズ ハンメ ブラッドフォード
James Hamme Bradford
ジェイムズ ハンメ ブラッドフォード
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Harman International Industries Inc
Original Assignee
Harman International Industries Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Harman International Industries Inc filed Critical Harman International Industries Inc
Publication of JP2016107978A publication Critical patent/JP2016107978A/ja
Application granted granted Critical
Publication of JP6829541B2 publication Critical patent/JP6829541B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/005Circuits for transducers, loudspeakers or microphones for combining the signals of two or more microphones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R1/00Details of transducers, loudspeakers or microphones
    • H04R1/20Arrangements for obtaining desired frequency or directional characteristics
    • H04R1/32Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only
    • H04R1/323Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only for loudspeakers
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/50Context or environment of the image
    • G06V20/59Context or environment of the image inside of a vehicle, e.g. relating to seat occupancy, driver state or inner lighting conditions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/161Detection; Localisation; Normalisation
    • G06V40/166Detection; Localisation; Normalisation using acquisition arrangements
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/172Classification, e.g. identification
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10KSOUND-PRODUCING DEVICES; METHODS OR DEVICES FOR PROTECTING AGAINST, OR FOR DAMPING, NOISE OR OTHER ACOUSTIC WAVES IN GENERAL; ACOUSTICS NOT OTHERWISE PROVIDED FOR
    • G10K11/00Methods or devices for transmitting, conducting or directing sound in general; Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
    • G10K11/004Mounting transducers, e.g. provided with mechanical moving or orienting device
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • H04S7/302Electronic adaptation of stereophonic sound system to listener position or orientation
    • H04S7/303Tracking of listener position or orientation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2201/00Details of transducers, loudspeakers or microphones covered by H04R1/00 but not provided for in any of its subgroups
    • H04R2201/02Details casings, cabinets or mounting therein for transducers covered by H04R1/02 but not provided for in any of its subgroups
    • H04R2201/025Transducer mountings or cabinet supports enabling variable orientation of transducer of cabinet
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2203/00Details of circuits for transducers, loudspeakers or microphones covered by H04R3/00 but not provided for in any of its subgroups
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2499/00Aspects covered by H04R or H04S not otherwise provided for in their subgroups
    • H04R2499/10General applications
    • H04R2499/13Acoustic transducers and sound field adaptation in vehicles

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • General Health & Medical Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Oral & Maxillofacial Surgery (AREA)
  • Otolaryngology (AREA)
  • Stereophonic System (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Fittings On The Vehicle Exterior For Carrying Loads, And Devices For Holding Or Mounting Articles (AREA)
  • Details Of Audible-Bandwidth Transducers (AREA)
  • Obtaining Desirable Characteristics In Audible-Bandwidth Transducers (AREA)
  • Image Analysis (AREA)

Abstract

【課題】可動スピーカの向きを調整するために顔認識を使用する方法を提供すること。【解決手段】方法は、1つまたは複数のカメラによって取り込まれた画像データに基づきユーザの場所に関する受信を行うこと、上記ユーザの場所に基づき空間の1つまたは複数の座標を識別すること、上記1つまたは複数の座標に基づき、上記1つまたは複数の座標に関して求める音響環境を達成するために、スピーカの方向を変えるために、上記スピーカに結合された少なくとも1つのアクチュエータを調整する1つまたは複数のコンピュータプロセッサを使用して制御信号を生成すること、上記スピーカの方向が変わる一方、上記1つまたは複数のカメラは空間に固定したままにすることから構成される。【選択図】図3

Description

本開示は、可動スピーカに関し、特に可動スピーカの向きを調整するために顔認識を使用する方法に関するものである。
車両に音声を出力するために、一般的に固定スピーカが使用されている。例えば、自動車などの車両には、車両の運転手と乗客のための音声(例えば、音楽、録音書籍、ラジオ番組など)を出力するために一般的に複数のスピーカが固定して配置されている。しかし、固定されたスピーカは、聴取環境内の異なる場所にいる乗客に応じて調整することができない。1つの特定のスピーカの配置は、一定の身長の乗客のために最適であるが、身長がそれより高いか、低い乗客には最適ではないこともある。また、固定されたスピーカによる音声出力の方向は、車両内の乗客の数に応じて変化しない。例えば、スピーカの配置は4人の乗客が車両内に存在していることを前提に最適なパフォーマンスを提供するように設計されている場合、乗客が4人より少ないとき、スピーカの配置のパフォーマンスは、他のスピーカ配置のパフォーマンスほど最適でないこともある。
本開示の一実施形態による方法は、カメラで撮影した画像データに基づいて、ユーザの場所に関する受信をし、ユーザの場所に基づいて空間内の1つまたは複数の座標を特定することを含んでいる。また、その方法は、1つまたは複数の座標に基づいて、少なくとも1つのアクチュエータを調整するための制御信号を生成することを含み、制御信号は、スピーカの音声出力領域が1つまたは複数の座標を含むように、スピーカの向きを変えるように構成されている。
本開示の別の実施形態は、可動スピーカ、可動スピーカに機械的に結合されたアクチュエータ及び計算装置を備えたシステムである。計算装置は、カメラで撮像した画像データに基づいて、ユーザの場所に関する受信を行い、ユーザの場所に基づいて空間内の1つまたは複数の座標を特定するように構成されている。計算装置は、1つまたは複数の座標に基づいてアクチュエータを調整するための制御信号を生成するように構成されている。制御信号は、可動スピーカの音声出力領域が1つまたは複数の座標を含むように可動スピーカの向きを変えるように構成されている。
本開示の別の実施形態は、スピーカを調整するためのコンピュータプログラム製品であり、このコンピュータプログラム製品は、1つまたは複数のコンピュータプロセッサによって実行可能でコンピュータ読み取り可能なプログラムコードを含んでいる。プログラムコードは、カメラで撮像した画像データに基づいて、ユーザの場所に関する受信を行い、ユーザの場所に基づいて空間内の1つまたは複数の座標を特定するように構成されている。また、プログラムコードは、1つまたは複数の座標に基づいて少なくとも1つのアクチュエータを調整するための制御信号を生成するように構成され、制御信号は、可動スピーカの音声出力領域が1つまたは複数の座標を含むように可動スピーカの向きを変えるように構成されている。
本発明は、例えば以下の項目を提供する。
(項目1)
1つまたは複数のカメラによって取り込まれた画像データに基づきユーザの場所に関する受信を行うこと、上記ユーザの場所に基づき空間の1つまたは複数の座標を識別すること、上記1つまたは複数の座標に基づき、上記1つまたは複数の座標に関して求める音響環境を達成するために、スピーカの方向を変えるために、上記スピーカに結合された少なくとも1つのアクチュエータを調整する1つまたは複数のコンピュータプロセッサを使用して制御信号を生成すること、上記スピーカの方向が変わる一方、上記1つまたは複数のカメラは空間に固定したままにすることから構成される方法。
(項目2)
上記ユーザの場所は二次元または三次元空間の1つにある上記ユーザの顔で識別し、更に、上記ユーザの上記識別された顔を使用して、上記ユーザに関連付けられたユーザの好みを識別すること及び上記ユーザの好みに基づき上記ユーザが所在する車両のパラメータを変更することから構成される項目1の上記方法。
(項目3)
上記ユーザの場所は上記ユーザと上記1つまたは複数のカメラからの距離に基づく奥行測定から構成される上記項目のいずれかの上記方法。
(項目4)
上記制御信号を生成することは、更に、上記1つまたは複数の座標を所定の機能を使用する制御信号に変換することから構成される上記項目のいずれかの上記方法。
(項目5)
上記制御信号は上記スピーカが上記1つまたは複数の座標に向くように上記スピーカを調整するように構成される上記項目のいずれかの上記方法。
(項目6)
上記1つまたは複数の座標は三次元空間の経路を定義し、上記制御信号は上記領域の上記音声出力が上記経路を追跡するように上記アクチュエータを調整するように構成される上記項目のいずれかの上記方法。
(項目7)
上記1つまたは複数のカメラによって取り込まれた画像データに基づき複数のユーザに対応する複数の場所に関する受信を行うこと及び上記複数の場所に基づき複数のアクチュエータの複数の制御信号を生成することを更に含み、上記各アクチュエータが複数のスピーカのそれぞれ1つを調整して構成される上記項目のいずれかの上記方法。
(項目8)
上記複数のスピーカは車両内にあり、上記複数の場所は上記車両内の上記複数のユーザのそれぞれの場所を特定する上記項目のいずれかの上記方法。
(項目9)
可動スピーカと、上記可動スピーカに機械的に結合されたアクチュエータと、1つまたは複数のカメラによって取り込まれた画像データに基づきユーザの場所を受信し、上記ユーザの場所に基づき空間の1つまたは複数の座標を識別し、上記1つまたは複数の座標に基づき、上記1つまたは複数の座標に関して求める音響環境を達成するために、可動スピーカの方向を変えるために、結合された上記アクチュエータを調整するように構成された制御信号を生成し、上記可動スピーカの方向が変わる一方、上記1つまたは複数のカメラは空間に固定したままにするように構成される計算装置を含むシステム。
(項目10)
上記ユーザの場所は二次元または三次元空間の1つにある上記ユーザの顔で識別する上記項目のいずれかの上記システム。
(項目11)
上記可動スピーカは上記ユーザを収容する車両内に設けられている上記項目のいずれかの上記システム。
(項目12)
上記可動スピーカに機械的に結合された少なくとも2つのアクチュエータを更に含み、上記計算装置は上記少なくとも2つのアクチュエータのそれぞれの制御信号を決定するように構成されており、上記可動スピーカの上記音声出力領域が上記1つまたは複数の座標を含んでいる上記項目のいずれかの上記システム。
(項目13)
上記それぞれの制御信号は上記移動可能スピーカが上記1つまたは複数の座標に向くように上記可動スピーカを調整するように構成される上記項目のいずれかの上記システム。
(項目14)
上記1つまたは複数の座標は空間にいる上記ユーザの身体部の予測場所に対応する上記項目のいずれかの上記システム。
(項目15)
複数のアクチュエータ及び複数のスピーカを更に含み、上記計算装置は上記1つまたは複数のカメラによって取り込まれた画像データに基づき複数のユーザに対応する複数の場所に関する受信を行い、上記複数の場所に基づき上記複数のアクチュエータの制御信号を生成するように構成されており、上記アクチュエータの各々は上記複数のスピーカのそれぞれ1つを調整するように構成される上記項目のいずれかの上記システム。
(項目16)
スピーカを調整するコンピュータプログラム製品であって、上記コンピュータプログラム製品は、コンピュータ読取可能プログラムコードを有するコンピュータ読取可能記憶媒体から構成され、1つまたは複数のコンピュータプロセッサによって実行可能な上記コンピュータ読取可能プログラムコードは、1つまたは複数のカメラによって取り込まれた画像データに基づきユーザの場所に関する受信を行い、上記ユーザの場所に基づき空間の1つまたは複数の座標を識別し、上記1つまたは複数の座標に基づき、上記1つまたは複数の座標に関して求める音響環境を達成するために、スピーカの方向を変えるために、上記スピーカに結合された少なくとも1つのアクチュエータを調整するように構成された制御信号を生成し、上記スピーカの方向が変わる一方、上記1つまたは複数のカメラは空間に固定したままにする上記コンピュータプログラム製品。
(項目17)
上記ユーザの場所は二次元または三次元空間の1つにある上記ユーザの顔で識別する上記項目のいずれかの上記コンピュータプログラム製品。
(項目18)
上記ユーザの場所は上記ユーザと上記1つまたは複数のカメラからの距離に基づく奥行測定から構成される上記項目のいずれかの上記コンピュータプログラム製品。
(項目19)
上記制御信号の生成は、上記1つまたは複数の座標を所定の機能を使用し制御信号に変換することから構成され、上記奥行測定は少なくとも1つの入力を上記所定の機能にすることを更に含む、上記項目のいずれかの上記コンピュータプログラム製品。
(項目20)
上記制御信号は上記スピーカを上記1つまたは複数の座標に向けるように上記スピーカを調整するように構成される上記項目のいずれかの上記コンピュータプログラム製品。
(摘要)
本明細書における実施形態は、人の場所に基づいて調整をするオーディオシステムを記述している。つまり、固定スピーカに依存する代わりに、オーディオシステムは、ユーザの場所またはユーザの人数に基づいてオーディオシステムのパフォーマンスを最適にするために、1つまたは複数のスピーカの音声出力の方向を調整する。そうするために、オーディオシステムはカメラとユーザの場所及び/またはカメラの前のユーザの人数を識別する追跡アプリケーションを備えている。この情報を使用して、オーディオシステムは、スピーカの音声出力の方向を変えるためにスピーカに結合された1つまたは複数のアクチュエータを調整する。ユーザが動き移動するにつれて、オーディオシステムは連続的にスピーカを調整してシステムのパフォーマンスを最適化する。
ユーザの場所に基づいて、可動スピーカを調整するシステムを示す。 顔認識に基づいて、スピーカを調節するためのシステムのブロック図である。 顔認識に基づいて、スピーカを調整する方法を示す。 顔認識に基づいて、スピーカが向く場所を特定する図を示す。 顔認識に基づいて、スピーカが向く場所を特定する図を示す。 顔認識に基づいて、スピーカが向く場所を特定する図を示す。 車両内の乗客の数に基づいて、スピーカの配置を調整することを示す。 車両内の乗客の数に基づいて、スピーカの配置を調整することを示す。 車両内の乗客の数に基づいて、スピーカの配置を調整することを示す。 車両内の乗客の数に基づいて、スピーカの配置を調整することを示す。 顔認識に基づいて、可動スピーカを調整するための経路を特定するためのシステムである。
理解を容易にするために、図面に共通する同一の要素を指定するために、可能な場合、同一の参照記数が使用されている。1つの実施形態に開示された要素は、特定の列挙なしに他の実施形態に利用されてもよいと考えられる。ここで参照する図面は、特に記載がない限り、一定の縮尺で描かれていると理解されるべきではない。また、図面は、提示及び説明の明確化のために、多くの場合、単純化されているか、詳細または構成要素が省略されている。図面及び記載は、以下に考察される原理の説明に資するもので、同じ名称は同じ要素を示す。
本明細書の実施形態では、ユーザの場所に基づいて調整するオーディオシステムが記載されている。音声出力の方向を変えることができない固定されたスピーカに依存する代わりに、本明細書に記載のオーディオシステムは、場所やユーザの数に応じて、1つまたは複数のスピーカの音声出力の方向を調整する。これを行うために、オーディオシステムは、カメラと、ユーザの場所及び/またはカメラの前のユーザの人数を特定する顔認識アプリケーションを含んでもよい。この情報を使用して、オーディオシステムは、スピーカの音声出力の方向、すなわち、スピーカが向いている方向に変えるためにスピーカに結合された1つまたは複数のアクチュエータを調整する。例えば、顔認識アプリケーションは、3D空間におけるユーザの場所を特定することができ、それに応答して、オーディオシステムは、その場所に向くようにスピーカを調整する。ユーザが移動し、場所を変え続けると、オーディオシステムは、継続的にシステムのパフォーマンスを最適化するためにスピーカを調整することができる。
一態様では、顔認識アプリケーションは、カメラの前で、複数のユーザを検出する。オーディオシステムは、ユーザのさまざまな場所に基づいて、スピーカを調整することができる。例えば、スピーカは、音声出力の方向が2人のユーザの間にあるように移動し、最適なパフォーマンスを達成することができる。また、オーディオシステムは、複数の調整可能なスピーカを含み、スピーカの1つがユーザの1人に対向し、別のもう一つのスピーカが別のスピーカに向くように調整することができる。ユーザの数または場所にかかわらず、オーディオシステムは、オーディオパフォーマンスを最適化(すなわち、改善)するために、スピーカの向きを変えるために予めプログラムされてもよい。
図1は、ユーザの場所に基づいて、可動スピーカ105を調整するためのオーディオシステム100である。システム100は、スピーカ105、アクチュエータ110、カメラ115及びユーザ120を含んでいる。示されているように、スピーカ105は、電気信号の入力に応答して音を生成する任意の装置であってもよい。スピーカ105は、アクチュエータ110に結合され、スピーカ105の音声出力方向を1つまたは複数の軸、例えば、上下、左右、斜め、円形の動きなどに沿って、変える。ここに示されているアクチュエータ110は、スピーカ105が向いている方向を調整するために収縮または拡張ができるピストン・アクチュエータである。2つのアクチュエータの110A及び110Bを制御することにより、システム100は、特定のポイントまたは領域に向くようにスピーカ105を移動させる。例えば、スピーカ105の前面における領域は2Dまたは3Dのグリッドに分割することができ、アクチュエータ110を調整することにより、システム100が2Dまたは3Dのグリッド内のポイントまたは領域に向くようにスピーカ105を移動させることができる。更に、一実施例では、スピーカ105の方向がポイントまたは領域に向くように変わるが、カメラ115の向きが固定されたままである。
ここに示されているピストン・アクチュエータ110は、適切なアクチュエータのほんの一例である。アクチュエータ110は、スピーカ105の向きを調整するために、ボール及びソケット、スクリュ、ギアシステム、チェーンなどを使用できる。更に、アクチュエータ110は、動きを生成するために機械、電気、油圧、または空気圧システムのような任意のタイプの駆動システムを使用できる。図1は、2つのアクチュエータ110を示しているが、他の実施例におけるスピーカ105は、1つのアクチュエータ110のみによって移動させることができる。一態様では、アクチュエータ110はスピーカ105に直接結合していなくてもよい。例えば、リモートアクチュエータ110によって生成される力をスピーカ105に伝動するためにケーブルを使用することができる。そうすることにより、スピーカ105の形数を削減し、スピーカ105が車両のダッシュボードまたはフロントガラスとドアを分離する支柱といったスペースが制限された領域に収まるようにできる。
カメラ115は、受け入れた電磁信号(例えば、赤外線または可視光の信号)に基づいて、画像を撮像するための1つまたは複数のセンサを備えることができる。例えば、カメラ115は、約390〜700ナノメートル(すなわち、可視光)の電磁信号を検出するための可視光センサ、赤外線投光器を使用する測距システムと三次元空間の画像を撮像するセンサ、またはその両方を組合せたものを備えることができる。カメラ115によって撮像された情報は、2Dまたは3D情報のいずれであってもよい。一態様では、奥行(すなわち、ユーザ120とカメラ115の間の距離)は知られ得る。例えば、オーディオシステムは、ユーザ120がカメラ115とスピーカ105から所定の距離でソファに座っている部屋のために設計されてもよい。2Dの情報のみを用いて、オーディオシステム110は、ソファ上のユーザ120の場所に基づいて、スピーカ105を調整する。また、奥行が知られていない場合がある。従って、カメラ110は、ユーザ120とカメラ115の間の距離を決定するための3D情報を撮像する。
カメラ115によって撮像された情報を使用して、オーディオシステム100は1D、2D、または3D空間におけるユーザ120の動きを追跡する。ユーザ120の場所に基づいて(例えば、ユーザの顔または耳の場所)、オーディオシステム100は、オーディオシステム100のパフォーマンスを最適化するために、スピーカ105の向きを変えるためにアクチュエータ110に指示をする。例えば、スピーカ105は、ユーザ120の耳向いている場合、最適なパフォーマンスが得られる。ユーザ120が動くと、アクチュエータ110がスピーカ105の方向を変え、3D空間内のユーザの耳の場所に向け続ける。
図2は、顔認識に基づいて、スピーカ105を調整するためのシステム200のブロック図である。システム200は、カメラ115、計算装置210及びスピーカシステム235を備えている。カメラ115は、カメラ115とユーザの間の距離を決定するための奥行き情報を収集するための奥行きセンサ205を備えている。しかし、上述したように、他の例では、カメラ115は奥行き情報を収集しないことがある。
カメラ115は、プロセッサ215とメモリ220を備えた計算装置210に結合されている。計算装置210は、本明細書に記載の態様及び実施例を実行するために、ノートパソコン、タブレット、サーバ、デスクトップコンピュータなどのような汎用計算装置、または専用計算装置であってもよい。プロセッサ215は、本明細書に記載の機能を実行するのに適したいかなる処理エレメントでもよい。プロセッサ215は、単一の処理要素または複数の処理要素を表すことができ、それぞれ1つまたは複数の処理コアを備えることができる。メモリ220は、ハードディスク、RAM、フラッシュメモリなどを備えることができる揮発性または不揮発性メモリであってもよい。ここに示すように、メモリ220は、顔認識アプリケーション225及びアクチュエータ制御器230を備える。顔認識アプリケーション225は、カメラ115によって撮像された2Dまたは3Dデータを受信して、カメラ115前の領域内のユーザを特定する。顔認識アプリケーション225は、2Dまたは3D空間内のユーザの場所(例えば、ユーザの顔の場所)を特定する1つまたは複数の座標を生成することができる。これらの座標を使用して、アクチュエータ制御器230は、システム200のパフォーマンスを最適化するために、スピーカ105を移動させるために、アクチュエータ110に対応する制御信号を決定する。例えば、スピーカ105がユーザの耳に向いているときに、パフォーマンスが改善されている場合、アクチュエータ制御部240は、スピーカ105をユーザの耳の方向に向くように制御信号を決定する。
一態様では、アクチュエータ制御器230は、顔認識アプリケーション225によって提供される座標をアクチュエータ110の制御信号に変換するための変換関数またはアルゴリズムを備えることができる。例えば、アプリケーション225は、カメラ115の前でユーザの場所を特定するx、y及びz座標の1つまたは複数を元に戻すことができる。変換関数は、x、y及びz座標を入力として使用することができ、アクチュエータ110に対応する制御信号を出力し、その結果、スピーカ105がユーザの方に向く。変換関数は、自由空間内の1つまたは複数のポイントがアクチュエータ110の特定の設定にマッピングされる設定段階中に生成することができる。これらのマッピングは、その後、自由空間の座標のセットをアクチュエータ110に対応する設定にマッピングできる変換関数を形成するために一般化することができる。しかし、これは、2Dまたは3Dの座標をスピーカ105が受信した座標の方向に向くようにするアクチュエータ信号に変換する変換関数を生成する1つの非限定的な方法に過ぎない。
一態様では、アクチュエータ制御器230は、異なる座標を特定するために、顔認識アプリケーション225によって提供される座標を使用することができる。例えば、顔認識アプリケーション225は、3D空間内のユーザの鼻の座標を元に戻すことがある。しかし、スピーカ105をユーザの耳に向けるように、アクチュエータ制御器230は、ユーザの耳がありそうな場所を推定するために事前に定義された調整パラメータを使用してもよい。調整パラメータは、カメラ115からのユーザの距離に基づいて変わってもよい。例えば、調整パラメータは、ユーザがカメラ115に近いときに大きくなる。調整パラメータを使用して、座標を変更することにより、アクチュエータ制御器230は、例えばアクチュエータ制御信号を決定するために変換関数への入力として使用できるユーザの耳に対応する座標を生成することができる。
別の例では、アクチュエータ制御器230は、何人のユーザが検出されたかに応じて、顔認識アプリケーション225によって提供される座標を変える。例えば、アプリケーション225は、3つの異なるユーザのための座標を出力すると、アクチュエータ制御器230は、ユーザ間の場所を特定する座標を平均化することができる。このようにして、システム200内のユーザの数または場所にかかわらず、アクチュエータ制御器230は、スピーカ105を調整するために、顔認識アプリケーション225によって提供される座標を変えるように設計することができる。
スピーカシステム235は、図1に記載されたアクチュエータ110と、スピーカ105を備えている。スピーカシステム235は、これらのコンポーネントの両方をカプセル化する単一のボディ、またはコンポーネントの支持構造体を備えることができる。一例では、アクチュエータ110は、スピーカ105から離れていてもよく、スピーカシステム235は、スピーカ105にアクチュエータ110からの動力を伝達するためのケーブル、チェーン、または空気圧ホースなどの機械的要素を含んでもよい。
図3は、顔認識を使用してスピーカを調整する方法300である。理解を高めるために、方法300のブロックは、図4Aから4Cまでに示されたシステムと連携して記載されている。ブロック305では、顔認識アプリケーション225は、カメラ115で撮像されたデータを用いて顔を特定する。図4Aのシステム400に示されるように、顔認識アプリケーション225は、ユーザ401の周囲で境界ボックス405を特定する。本明細書で提供される例は、カメラ115で撮像されたデータに基づいてユーザ401を特定するための特定のアルゴリズムに限定されるものではない。この例では、アプリケーション225は、ユーザ401の頭部を中心とする境界ボックス405を特定するが、他の例では、顔認識アプリケーション225は、ユーザの顔の幾何学的な中央を特定する単一座標またはユーザ401の異なる特徴、例えば、目、耳、口などに対応する複数の座標を元に戻すことができる。
顔認識アプリケーション225は、境界ボックス405の座標をアクチュエータ制御器230に送信する。方法300のブロック310において、アクチュエータ制御器230は、境界ボックス405の座標を使用してポイントまたは領域を特定する。例えば、1人のユーザ401のみが、顔認識アプリケーション225によって特定されたときに、アクチュエータ制御器230は、スピーカ105をユーザの耳に向けることができる。一例では、顔認識アプリケーション225は、ユーザの耳の座標を特定し、アクチュエータ制御器230に提供することができる。しかし、図4Aに示す例では、アクチュエータ制御器230は、境界ボックス405の座標を使用してユーザの耳の場所を計算する。
図4Bのシステム420に示されるように、アクチュエータ制御器230は、ユーザ401とカメラ115またはスピーカ105の間の距離に応じて異なる場合がある調整パラメータを使用して、耳の場所425を決定する。例えば、調整パラメータは、耳の場所425の座標を与える境界ボックス405の左側の中間座標から減算される所定の値であってもよい。もちろん、調整パラメータの種類や値は、顔認識アプリケーション225によって提供された座標に応じて変わることがある。つまり、アプリケーション225は、示された境界ボックス405を出力するときと比べて、ユーザの鼻の座標を出力する別の調整パラメータが必要とされている。更に上記のように、顔認識アプリケーション225が複数のユーザを特定する際に、アクチュエータ制御器230は、座標を異なって変えるができる。例えば、ユーザの耳の場所425を推定する代わりに、アクチュエータ制御器230は、複数のユーザの間の領域またはポイントを特定するために、顔認識アプリケーション225によって提供された座標を使用してもよい。
ブロック315において、アクチュエータ制御器230は、アプリケーション225からの座標を使用して、特定のポイントまたは領域をアクチュエータ制御信号に変換する。制御器230は、ポイント(すなわち、ユーザの耳の場所425)をそのポイントに向くようにスピーカ105の向きを変える制御信号にマッピングする変換関数またはアルゴリズムを使用することができる。アクチュエータ110は、これらの信号を受信し、スピーカ105が向いている方向を変える。領域410は、スピーカの音声出力が最大音量であるスピーカ105の前方の領域(例えば、スピーカ105からの音声出力の90%を含んでいる)を示している。示すように、ユーザ401は、領域410の外側にいる。このように、ユーザ401は、領域410内にいた場合よりも劣ったオーディオ演奏を経験することがある。
ブロック320において、制御信号に応答して、アクチュエータ110は、図4Cに示すように、領域410によって定義された音声出力がユーザの耳の場所425を含むように、スピーカ105が向いている向きを調整する。一例では、スピーカ105の向きは、ユーザの耳の場所425が少なくとも領域410内にあるように調節される。つまり、スピーカ105が向いている方向が場所425と交差するまでスピーカ105を移動させることの代わりに、場所425が領域410内であることのみが必要である。正確な場所合わせを必要としないことにより、システム450は、ユーザ401の経験を向上させ、アプリケーション225を実行するときに、より安価なカメラ115を使用し、処理時間を節約することができるが、精度の低い座標を出力することもある。それにもかかわらず、これらの座標は、スピーカ105が直接にユーザの耳に向いていない場合であっても、場所425が領域410内にあることを確保する制御信号を導出するのに十分に正確であろう。また、カメラ115は、スピーカ105から物理的に分離されているので、音声出力領域410が変えられるとき(すなわち、スピーカ105の向きが変えられる)、カメラ115の向きが現在の向きに固定されたままにすることができる。別の言い方をすれば、カメラ115は同じ方向を向き続けるが、スピーカ105の音声出力領域410は変わる。
図5A及び図5Bは、車両500の乗客に基づいて、スピーカ配置を調整することを記載している。具体的には、図5A及び5Bは、車両500の前半を示すが、後部座席やリアスピーカは(もしあれば)省略されている。図5A及び5Bの上面図で示すように、車両500は、カメラ115及びダッシュボード上または車両500のピラーに取り付けられた2つのスピーカ505を備えている。記述を明確にするために、スピーカ505を移動させるために使用されるアクチュエータ及びカメラ115によって撮像されたデータを処理し、アクチュエータのための制御信号を決定するために使用される計算装置が省略されている。それにもかかわらず、一実施例では、計算装置は、車両を動作させるために使用されるオンボードコンピュータまたは車両500に組み込まれたインフォテインメントシステムに搭載されている。
カメラ115によって撮像されたデータに基づいて、計算装置における顔認識アプリケーションは、車両500にいる乗客の数と、2Dまたは3D空間にいる乗客の場所を判断する。図5Aにおいては、計算装置は、場所510(すなわち、運転者)に位置している車両500内に1人の乗客のみがいると判断する。これに応答して、計算装置におけるアクチュエータ制御装置は、スピーカ505を向けるポイントまたは領域を特定する。
一態様では、ポイントまたは領域は、スピーカ505Aとスピーカ505Bの両方にとって同じであってもよい。例えば、両方のスピーカは同じ3Dポイントに向いている。代わりに、計算装置は、スピーカ505のための別のポイントまたは領域を計算することができる。例えば、スピーカ505Aは運転者の左耳に向く一方、スピーカ505Bは運転者の右耳に向くことが可能である。そうすると、オーディオシステムがスピーカら505に異なる音を出力することが可能になるか、運転手のためのより多くの没入型体験を提供するために、サラウンドサウンドを使用できる。しかし、両方のスピーカ505のために出力される音が同じである場合は、両方のスピーカ505をユーザの前の共通ポイントに向くことがより最適な配置である。スピーカ505Aが運転手の左耳を対象とし、スピーカ505Bが運転者の右耳に向いている場合、運転手と2つのスピーカの間の異なる距離のため、運転者が不快になるほど音の異なるレベルがある。もちろん、一実施例では、計算装置は、各スピーカを異なる耳の方へ向ける場合、スピーカ505Bの音声出力を増加させる(またはスピーカ505Aの出力を減少させる)ことにより、距離の違いを補償することができる。それにも関わらず、使用者の場所510を追跡することによって、オーディオシステムは、オーディオ演奏を最適化するためにスピーカ505を調整することができる。
図5Bでは、計算装置は、車両500に2人の乗客が存在していることを判断している。つまり、場所510に1人と場所515に1人がいる。乗客を特定するために、カメラ115は、運転席と右前方の乗客座席の両方がその視野内にあるように配置されている。車両500における乗客の場所を特定するために、顔認識アプリケーションは、カメラ115によって生成された画像データを走査する。この例では、図5Aに示すように、1人ではなく2人の乗客がいるため、オーディオシステムによるスピーカの調整が異なる。例えば、スピーカ505Bが乗客に向くように調整されていることに対して、計算装置は、スピーカ505Aを運転者に向くように調整できる。一実施形態では、スピーカ505Aの音声出力が運転者の耳に均等に聞こえるように、スピーカ505Aは運転手の鼻のような顔の中心部の場所に向くことができる。同様に、スピーカ505Bは、その出力が両方の耳に均等に聞こえるように、場所515といった乗客の顔の中央場所に向くように調整できる。しかし、別の最適化された解決方法は、スピーカ505A及び505Bを運転手または同乗者の耳の一方に直接向けることである。使用される特定の解決方法は、ユーザの好み、使用するスピーカの種類、車両500などの特定の音響によって変化し得る。
図5A及び5Bは、計算装置が、車両内の乗客の数に基づいて、スピーカが調整される方法を変更することを示している。より一般的に言えば、オーディオシステムのパフォーマンスを向上させるための特定の技術は、カメラ115の視野内にあるユーザ数に基づいて変更することができる。例えば、オーディオシステムは、車両ではなく、部屋の中に存在するユーザの数に応じてスピーカの異なる配置を使用する家庭用エンタテインメント・システムであってもよい。
ユーザの場所及び/または特定されたユーザの数を考慮することに加えて、計算装置は、指定したユーザの好みに応じてシステムのパフォーマンスを最適化することができる。例えば、ユーザの顔の場所を認識することに加えて、顔認識アプリケーションは、ユーザの顔の特徴に基づいて、ユーザの名前を特定することができる。ユーザが特定されると、計算装置は、ユーザに関連付けられた好みを検索することができる。例えば、ユーザAがユーザBと比べて、より低いくあまり高くない音を好むかもしれない。また、ユーザAはステレオサウンドを好むが、ユーザBはサラウンドサウンドを好む。計算装置は、パフォーマンスを最適化する際に、これらの設定を考慮できる。例えば、ユーザAが運転手である場合に、計算装置は、スピーカ505の高低に対して低音の比率を変えることができる。一態様では、システムは、スピーカ505によって出力される音声に対して、オーディオ信号が処理される方法の修正(例えば、イコライゼーションや遅延の変更)などのような他の電気的変更を加えることができる。
車両500は、自動車として示されているが、本明細書に記載の実施形態は、ボート、オートバイ、飛行機など他の乗り物のタイプに適用することができる。また、車両500は、オーディオシステムのパフォーマンスを特定し、最適化するために、任意の数のスピーカやカメラを備えることができる。
図6A及び6Bは、車両600における乗客の数に基づいて、スピーカの配置を調整することを示す。図6A及び6Bの上面図に示すように、車両600は、カメラ115A及び115Bと4つのスピーカ605を備えている。スピーカ605A及び605Bは車両600の前方に装着され、スピーカ605C及び605Dは車両600の後部に取り付けられている。明確にするために、スピーカ605を移動させるアクチュエータ及びカメラ115によって撮像されたデータを処理し、アクチュエータの制御信号を決定するために使用される計算装置が省略されている。一実施形態では、計算装置は、車両を動作させるためのオンボードコンピュータまたは車両600に組み込まれたインフォテインメントシステムに搭載されている。
カメラ115A及び115Bによって撮像されたデータに基づいて、計算装置における顔認識アプリケーションは、車両600に存在している乗客の数と、2Dまたは3D空間に存在している乗客の場所を判断する。そのために、カメラ115Aは、車両600の前方に配置され、カメラ115Bは車両600の後部に取り付けられている。車両600の後方ビューがカメラ115Aに対して2フロントシートによって相対的に閉塞されるので、2つのカメラが好ましい。しかし、他の実施形態において、車両600は、車両600の前方と後方の乗客を特定するために、カメラ115のみを使用してもよい。
図6Aでは、計算装置は、場所610(すなわち、運転席)に位置している車両600で1人の乗客のみが存在していると判断する。すなわち、リアカメラ115Bによって提供される画像データに基づいて、顔認識アプリケーションは、乗客が車両600の後部座席に存在しないと判断する一方、フロントカメラ115Aによって提供される画像データは、運転手が場所610に存在していることを示す。それに応答して、計算装置は、オーディオシステムのパフォーマンスを最適化するためにスピーカ605が向くポイントまたは領域を特定する。一実施形態では、4つのスピーカ605すべてが場所610に関連付けられた同じ3Dポイントに向く。例えば、計算装置は、ユーザに対して相対的に中央場所を計算し、4つのスピーカ605がこの場所に向けられるように、それぞれのアクチュエータ信号を生成してもよい。また、左の2つのスピーカ(スピーカ605Aと605C)は、運転者の左耳に向きながら、右の2つのスピーカ(スピーカ605B及び605D)は、運転手の右耳の方を向いてもよい。あるいは、計算装置は、運転者にサラウンドサウンド体験を提供するために、すべてのスピーカ605を異なる3Dポイントまたは領域に向けるようにスピーカ605を配置してもよい。
これまでに考察した通り、計算装置は顔認識アプリケーションを使用して、ユーザを独自の方法で識別することによって、オーディオシステムを最適化し得る。例えば、計算装置は、顔認識アプリケーションを使用してユーザがより低音またはより高音を好むかどうかを考慮し、ユーザの好みに合ったパラメータに変更することができる。一実施例においては、計算装置は、計算装置が判断した好みを入力するI/Oインターフェイスを備えることができる。あるいは、計算装置はオーディオまたはビデオパラメータを変更するために、ユーザの好みを計算装置と共有する車両600の情報システムに結合してもよい。その代わりとして、または追加として、計算装置は、履歴情報を使用して、ユーザの好みを学習してもよい。例えば、ユーザAのみが車両の乗客であるとき、最初、計算装置は、4つの全てのスピーカ605を中央場所に向けてもよい。I/Oインターフェイスを使用し、ユーザAは、彼女がその車両のただ1人の乗客であるとき、計算装置に、彼女はサラウンドサウンドが好みであると知らせ得る。このように、計算装置は、特定のユーザまたはグループのために、オーディオ/ビデオパラメータまたはその他のパラメータ(例えば、席やハンドル調整)を学習し調整することができる。
図6Bにおいて、計算装置は、場所610、615、620及び625に座っている車両600の乗客がいることを判断する。場所620及び625にいる後部座席の乗客のために、計算装置は、場所625の方を向いている右後ろのスピーカ605Dと場所620の方を向いている左後ろのスピーカ605Cを調整する。スピーカ605C及び605Dの両方とも、これらの場所の乗客の耳の1つの方を向いてもよい。それと対照的に、場所610及び615にいる前席の乗客のために、計算装置は、右前のスピーカ605Bと左前スピーカ605Aを場所610及び615の間の場所630の方を向くように調整する。そうするために、計算装置は、場所610及び615の座標を平均して場所630を識別してもよい。そのため、図6Bは、車両600の前半部分のスピーカ605の最適配置と車両600の後半部分のスピーカ605の最適配置が異なっていることを図示している。別の言い方をすれば、車両600内のユーザに最適なパフォーマンスを提供するように、計算装置は車両600内のユーザの異なる場所に応じて異なるスピーカ配置を用い得る。例えば、異なる場所には異なる音響学的性質があり、すなわち同じユーザが異なる場所へ移動しても、計算装置はなお、より改善されたパフォーマンスを提供するように異なるスピーカ配置を用いる。例えば、ユーザAが運転席にいる場合、計算装置はユーザの耳に直接向くようにスピーカ605Aを調整し得る。しかし、ユーザAが車両の後部にいるとすれば、計算装置はスピーカ605Cをユーザの後頭部の中心部分に向くように指示してもよい。
本明細書において記載された異なった実施例、実施形態及び態様によって、1人または複数のユーザのオーディオ経験を最適化するスピーカ配置を調整することが考察される。「最適の」の使用は、スピーカ配置が最良の配置でなければならないという意味を意図しているのではなく、むしろ、最適なまたは最適化された配置は、スピーカが固定されたままの状態で、ユーザの経験に関係するスピーカ配置を改善することである。言い換えれば、本明細書において記載された実施例は、スピーカが向いている方向を変えるために、アクチュエータを使用して鑑賞経験を改善し、1人または複数のユーザの現行位置に適合する。
図7は、顔認識に基づき可動スピーカ105を方向付ける経路715を識別するシステム700である。場合によっては、経路に沿った物体の方向移動を模擬するサウンド経験を生成することが望ましい。そうするために、システム700は、ユーザ701、カメラ115、顔認識アプリケーション225、アクチュエータ制御器230及びスピーカ105を有している。カメラ115は、ユーザ701を含んだ画像データを取り込み、そのデータは顔認識アプリケーション225に送信される。アプリケーション225は、ユーザの顔の場所を3Dまたは2D空間において画定する境界ボックス705を識別する顔認識アルゴリズムを使用する。勿論、その他の顔認識アルゴリズムは境界ボックス705とは異なる手段を使用してユーザの顔を識別し得る。
顔認識アプリケーション225は、境界ボックス705の座標をアクチュエータ制御器230に送信する。この実施例において、座標を使用してスピーカ105の指すポイントまたはポイントの認識を識別する代わりに、アクチュエータ制御器230は経路715を決定する。スピーカ105の音声出力に経路715を追跡するように指示することによって、スピーカ105は、動いている音源(例えば、ユーザ701上を飛んでいる鳥または航空機あるいはユーザ701のそばを通り過ぎて走っている人)から生成されるサウンドを模擬するために使用され得る。一態様では、アクチュエータ制御器230は、移動音源から生成されるサウンドを模擬するために、オーディオシステムからのコマンドの受信に応答して、経路715を決定してもよい。例えば、オーディオ制御器(例えば、ムービまたはビデオゲーム制御器)が、特定のサウンドの経路715を決定するために、アクチュエータ制御器230にインストラクションを送るまで、アクチュエータ制御器230は待ってもよい。一実施例においては、オーディオ制御器とアクチュエータ制御器230が同期され、アクチュエータ制御器230が経路715を追跡するために、スピーカ105を動かすにつれて、オーディオ制御器は移動音源に対応するサウンドを出力する。例えば、スピーカ105の出力域710が経路715に沿って移動するとともに、スピーカ105は鳥のさえずり音を出力する。
経路715を決定するために、オーディオ制御器はアクチュエータ制御器230の音または音声出力の動きのタイプを知らせてもよい。図7の経路715は線状であるが、他の実施例では、経路715は1つまたは複数の曲線、ループなどでもよい。例えば、経路715はユーザ701の頭部辺りを回っている鳥またはユーザの耳の辺りでぶんぶん言っている蚊を模擬してもよい。そのため、この情報に従って、アクチュエータ制御器230は経路715を識別するために、境界ボックス705の座標を使用する。示された実施例では、アクチュエータ制御器230は、境界ボックス705の上部左隅に対する3Dスペースの第1ポイントを識別する第1所定オフセットと境界ボックス705の上部右隅に対する3Dスペースの第2ポイントを識別する第2所定オフセットを使用し得る。そして、アクチュエータ制御器230は、第1及び第2ポイント間のラインを描くことによって経路715を生成する。
アクチュエータ制御器230は、スピーカ105を使用し、模擬されることになるサウンドに従って経路715を別に計算してもよい。例えば、ユーザ701の耳の辺りでぶんぶん言っている蚊のために、アクチュエータ制御器230は、境界ボックス705の座標を使用して、耳の位置を推定し、ランダム番号発生器を使用してユーザの耳の近くのランダム経路を決定する。その代わりとして、アクチュエータ制御器230は、ユーザ701の頭部上のポイントを識別する所定の垂直オフセットを使用してもよい。そして、アクチュエータ制御器230は、経路715として使用するユーザ701上のポイントにおいて中心となる円を計算する。このようにして、アクチュエータ制御器230は、サウンドの異なった移動音源を模擬するために、経路715を計算する異なった手法を使用するように構成され得る。
システム700は、映画、テレビ番組、ビデオゲームなどのようなオーディオ/ビデオプレゼンテーションと一緒に使用してもよい。例えば、システム700は、1人または複数のユーザの場所を識別するために、劇場内にインストールされ、顧客に適合したオーディオ経験を各ユーザまたはグループのユーザに提供し得る。一実施例では、システム700は、異なった個々の経路715に沿ってスピーカ105のそれぞれの出力領域710を移動するそれぞれのアクチュエータを使用する複数のスピーカ105(例えば、劇場における各ユーザ用スピーカ)を有する。もしくは、複数のスピーカ105が、ユーザ701の近くの異なった音源を真似るために使用され得る。別のスピーカ105がユーザ701のそばをヒューという音で通り過ぎる、例えば、弾丸や矢の音を真似る経路を追跡する一方で、もう1つのスピーカ105は、ユーザ701上を鳥のさえずりが通り過ぎるのを真似る経路を追跡するようにしてもよい。システム700は、対応するビデオプレゼンテーションがない場合に、オーディオプレゼンテーションにも使用してもよい。例えば、システム700は、アニマトロニック/パペットショウに使用し、または実演俳優のステージ演技中に、ユーザ701ためにより臨場感のある環境を与えるために使用し得る。
さまざまな実施形態の記述が、例示目的で呈示されたが、開示された実施形態に網羅することや制限することを意図するものではない。当業者にとって、記述された実施形態の範囲と趣旨を逸脱することなく、多くの修正や変形がなされることは明らかであろう。本明細書で使用する用語は、実施形態の原理、実際の用途及び市場で見られる技術の改良を最もよく説明するため、あるいは、当業者以外の者が、本明細書で開示されている実施形態を理解し得るように選択されたものである。
これまでの記述においては、本開示で呈示された実施形態を参照する。しかし、本開示の範囲は、具体的に記述された実施形態に限定されることはない。代わりに、これまでの記述と要素の組み合わせたものが、異なった実施形態であるかどうかに関係なく、意図された実施形態の具体化を促進し、実施するために考慮される。更に、本明細書で開示された実施形態は、他の可能な解決策や先行技術に比べて、より利益を達成し得るが、所与の実施形態で格別の便益を達成したかどうかが、本開示の範囲を限定することにはならない。このため、記述の態様、特徴、実施形態及び便益は、単に例示的なものであり、特許請求の範囲で明示的に言及された場合を除き、添付の特許請求の範囲の要件または制限とはみなされない。
本開示の態様は、本明細書においては、一般的に、「回路」、「モジュール」または「システム」と称する、全てがハードウエア実施形態、全てがソフトウエア実施形態(ファームウエア、レジデントソフトウエア、マイクロコードなど)またはソフトウエアとハードウエアを組み合わせた実施形態をとり得るものである。
本開示は、システム、方法及び/またはコンピュータプログラム製品であってもよい。コンピュータプログラム製品は、プロセッサが本開示の態様を実行するコンピュータ読取可能プログラムインストラクションを有するコンピュータ読取可能記憶媒体(またはメディア)を含んでもよい。
コンピュータ読取可能記憶媒体は、インストラクション実行デバイスによって使用されるために保存し格納する有形デバイスであってもよい。コンピュータ読取可能記憶媒体は、例えば、電子記憶装置、磁気記憶装置、光学記憶装置、電磁記憶装置、半導体記憶装置またはそれらの適切な組み合わせを含んでいるが、それに限らない。コンピュータ読取可能記憶媒体のより具体的な例示リストは、全て網羅してはいないが、携帯コンピュータディスケット、ハードディスク、ランダム・アクセス・メモリ(RAM)、読取専用メモリ(ROM)、消去可能プログラマブル読取専用メモリ(EPROMまたはフラッシュメモリ)、スタティック・ランダム・アクセス・メモリ(SRAM)、携帯コンパクト読取専用メモリ(CD−ROM),デジタル・バーサタイル・ディスク(DVD)、メモリスティック、フロッピー(登録商標)ディスク、パンチカードのような機械的符号化装置、インストラクション記憶溝の隆起構造及び前述のデバイスの好適な組み合わせを含んでいる。本明細書において使用するコンピュータ読取可能記憶媒体は、無線電波または導波管あるいはその他の伝送媒体(例えば、光ファイバケーブルを通過する光パルス)を介して伝播するその他の自由に伝播する電磁波または有線を介して送信される電気信号のようなものは、一時的な信号それ自体と解釈されない。
本明細書に記載のコンピュータ読取プログラムインストラクションは、コンピュータ読取可能記憶媒体から、コンピューティング/プロセッシング装置に、またはネットワーク、例えば、インターネット、ローカルエリア・ネット・ワーク、ワイドエリア・ネット・ワーク及び/または無線ネットワーク経由で外部コンピュータあるいは外部記憶装置にそれぞれダウンロードされ得る。ネットワークは、銅線ケーブル、光伝送回旋線、無線伝送、ルータ、ファイアウオール、スイッチ、ゲートウエイコンピュータ及び/またはエッジサーバから構成されてもよい。コンピューティング/プロセッシング装置のネットワーク・アダプタ・カードまたはインターフェイスは、ネットワークからコンピュータ読取可能プログラムインストラクションを受信し、コンピュータ読取可能プログラムインストラクションをそれぞれコンピューティング/プロセッシング装置内のコンピュータ読取可能記憶媒体で格納するために送出する。
本開示の操作を実行するコンピュータ読取可能プログラムインストラクションは、アッセンブルインストラクション、インストラクション・セット・アーキテクチャ(ISA)インストラクション、マシンインストラクション、マシン依存インストラクション、マイクロコード、ファームウエアインストラクション、状況設定データ、または1つまたは複数のプログラム言語の組み合わせで記述されたソースコードまたはオブジェクトコードのいずれかであり、Smalltalk、C++などのオブジェクト・オリエンテッド・プログラム言語および“C”プログラム言語または類似のプログラム言語のような従来の手順のプログラム言語を含んでいる。コンピュータ読取可能プログラムインストラクションは、ユーザのコンピュータ上で全て実行し、スタンドアロンソフトウエアパッケージとしてユーザのコンピュータ上で部分的に実行する、ユーザのコンピュータ上で部分的に実行し、遠隔コンピュータ上で部分的に実行する、または遠隔コンピュータ上あるいはサーバ上で全て実行するようにしてもよい。後者のシナリオにおいては、遠隔コンピュータは、ローカルエリア・ネット・ワーク(LAN)またはワイドエリア・ネット・ワーク(WAN)を含むいずれかのタイプのネットワークを介してユーザのコンピュータに接続され、あるいはその接続は外部コンピュータに対して(例えば、インターネット・サービス・プロバイダを使用するインターネットを介して)なされ得る。実施形態によっては、本開示の態様を実行するために、例えば、プログラマブル・ロジック回路、フィールド・プログラマブル・ゲート・アレイ(FPGA)、またはプログラマブル・ロジック・アレイ(PLA)を含む電子回路が、電子回路を個人的な適応にするコンピュータ読取可能プログラムインストラクションの状態情報を利用して、コンピュータ読取可能プログラムインストラクションを実行してもよいものもある。
本開示の態様は、本開示の実施形態に従う方法、装置(システム)、コンピュータプログラム製品のフローチャート説明図及び/またはブロックダイアグラムを参照して、本明細書において記述されている。フローチャート説明図及び/またはブロックダイアグラムの各ブロック、及びフローチャート説明図及び/またはブロックダイアグラムにおけるブロックの組み合わせは、コンピュータ読取可能プログラムインストラクションによって実行され得る。
コンピュータ読取可能プログラムインストラクションは、汎用コンピュータ、特定目的コンピュータまたはプログラマブルデータ処理装置、またはマシンを製作するその他のプログラマブルデータ処理装置のプロセッサに提供されてもよく、そのインストラクションは、コンピュータまたはその他のプログラマブルデータ処理装置のプロセッサを経由して実行されるが、フローチャート及び/またはブロックダイアグラムの1つのまたは複数のブロックにおいて特定される機能/動作を実行する手段を創出する。コンピュータ読取可能プログラムインストラクションは、コンピュータ、プログラマブルデータ処理装置及び/または特定の方法で機能するその他の装置に指示できるコンピュータ読取可能記憶媒体にもまた格納されうるので、インストラクションを格納したコンピュータ読取可能記憶媒体は、フローチャート及び/またはブロックダイアグラムの1つのまたは複数のブロックにおいて特定される機能/動作を実行するインストラクションを含む製品から構成される。
コンピュータ読取可能プログラムインストラクションは、また、コンピュータ、その他のプログラマブルデータ処理装置または一連の操作ステップをコンピュータ上で実行されるようにするその他のデバイスに載せられ得るため、コンピュータ、その他のプログラマブル装置又はその他のデバイスが遂行するインストラクションが、フローチャート及び/またはブロックダイアグラムの1つのまたは複数のブロックにおいて特定される機能/動作を実行する。
図面のフローチャート及びブロックダイアグラムは、本開示のさまざまな実施形態に従うシステム、方法及びコンピュータプログラム製品のアーキテクチャ、機能性及びシステムの実施可能動作を例示している。これに関して、フローチャートまたはブロックダイアグラムの各ブロックは、モジュール、セグメントまたはインストラクションの部分を示しており、そのブロックは特定の論理機能を実行する1つまたは複数の実行可能なインストラクションから構成される。代替可能な実施形態においては、ブロックで記載された機能が図面で記載された順序を外れていることが生じ得る。例えば、連続している2つのブロックは、実際には、実質的に同時に実行されてもよく、また時には、関連する機能性によって、逆の順序で実行されることもある。ブロックダイアグラム及び/またはフローチャート例示の各ブロックとブロックダイアグラム及び/またはフローチャート例示のブロックの組み合わせは、特定の機能または動作を実行する特定目的のハードウエアに基づいたシステムによって実行され、あるいは特定目的のハードウエア及びコンピュータインストラクションの組み合わせを実行する。
上述した事項は本開示の実施形態に関するものであるが、本開示のその他の更なる実施形態は、その基本的な範囲から逸脱することなく考えられ得るので、当該範囲は次の特許請求範囲によって決定される。

Claims (20)

  1. 1つまたは複数のカメラによって取り込まれた画像データに基づきユーザの場所に関する受信を行うこと、前記ユーザの場所に基づき空間の1つまたは複数の座標を識別すること、前記1つまたは複数の座標に基づき、前記1つまたは複数の座標に関して求める音響環境を達成するために、スピーカの方向を変えるために、前記スピーカに結合された少なくとも1つのアクチュエータを調整する1つまたは複数のコンピュータプロセッサを使用して制御信号を生成すること、前記スピーカの方向が変わる一方、前記1つまたは複数のカメラは空間に固定したままにすることから構成される方法。
  2. 前記ユーザの場所は二次元または三次元空間の1つにある前記ユーザの顔で識別し、更に、前記ユーザの前記識別された顔を使用して、前記ユーザに関連付けられたユーザの好みを識別すること及び前記ユーザの好みに基づき前記ユーザが所在する車両のパラメータを変更することから構成される請求項1の前記方法。
  3. 前記ユーザの場所は前記ユーザと前記1つまたは複数のカメラからの距離に基づく奥行測定から構成される請求項1の前記方法。
  4. 前記制御信号を生成することは、更に、前記1つまたは複数の座標を所定の機能を使用する制御信号に変換することから構成される請求項1の前記方法。
  5. 前記制御信号は前記スピーカが前記1つまたは複数の座標に向くように前記スピーカを調整するように構成される請求項4の前記方法。
  6. 前記1つまたは複数の座標は三次元空間の経路を定義し、前記制御信号は前記領域の前記音声出力が前記経路を追跡するように前記アクチュエータを調整するように構成される請求項1の前記方法。
  7. 前記1つまたは複数のカメラによって取り込まれた画像データに基づき複数のユーザに対応する複数の場所に関する受信を行うこと及び前記複数の場所に基づき複数のアクチュエータの複数の制御信号を生成することを更に含み、前記各アクチュエータが複数のスピーカのそれぞれ1つを調整して構成される請求項1の前記方法。
  8. 前記複数のスピーカは車両内にあり、前記複数の場所は前記車両内の前記複数のユーザのそれぞれの場所を特定する請求項7の前記方法。
  9. 可動スピーカと、前記可動スピーカに機械的に結合されたアクチュエータと、1つまたは複数のカメラによって取り込まれた画像データに基づきユーザの場所を受信し、前記ユーザの場所に基づき空間の1つまたは複数の座標を識別し、前記1つまたは複数の座標に基づき、前記1つまたは複数の座標に関して求める音響環境を達成するために、可動スピーカの方向を変えるために、結合された前記アクチュエータを調整するように構成された制御信号を生成し、前記可動スピーカの方向が変わる一方、前記1つまたは複数のカメラは空間に固定したままにするように構成される計算装置を含むシステム。
  10. 前記ユーザの場所は二次元または三次元空間の1つにある前記ユーザの顔で識別する請求項9の前記システム。
  11. 前記可動スピーカは前記ユーザを収容する車両内に設けられている請求項9の前記システム。
  12. 前記可動スピーカに機械的に結合された少なくとも2つのアクチュエータを更に含み、前記計算装置は前記少なくとも2つのアクチュエータのそれぞれの制御信号を決定するように構成されており、前記可動スピーカの前記音声出力領域が前記1つまたは複数の座標を含んでいる請求項9の前記システム。
  13. 前記それぞれの制御信号は前記移動可能スピーカが前記1つまたは複数の座標に向くように前記可動スピーカを調整するように構成される請求項12の前記システム。
  14. 前記1つまたは複数の座標は空間にいる前記ユーザの身体部の予測場所に対応する請求項9の前記システム。
  15. 複数のアクチュエータ及び複数のスピーカを更に含み、前記計算装置は前記1つまたは複数のカメラによって取り込まれた画像データに基づき複数のユーザに対応する複数の場所に関する受信を行い、前記複数の場所に基づき前記複数のアクチュエータの制御信号を生成するように構成されており、前記アクチュエータの各々は前記複数のスピーカのそれぞれ1つを調整するように構成される請求項9の前記システム。
  16. スピーカを調整するコンピュータプログラム製品であって、前記コンピュータプログラム製品は、コンピュータ読取可能プログラムコードを有するコンピュータ読取可能記憶媒体から構成され、1つまたは複数のコンピュータプロセッサによって実行可能な前記コンピュータ読取可能プログラムコードは、1つまたは複数のカメラによって取り込まれた画像データに基づきユーザの場所に関する受信を行い、前記ユーザの場所に基づき空間の1つまたは複数の座標を識別し、前記1つまたは複数の座標に基づき、前記1つまたは複数の座標に関して求める音響環境を達成するために、スピーカの方向を変えるために、前記スピーカに結合された少なくとも1つのアクチュエータを調整するように構成された制御信号を生成し、前記スピーカの方向が変わる一方、前記1つまたは複数のカメラは空間に固定したままにする前記コンピュータプログラム製品。
  17. 前記ユーザの場所は二次元または三次元空間の1つにある前記ユーザの顔で識別する請求項16の前記コンピュータプログラム製品。
  18. 前記ユーザの場所は前記ユーザと前記1つまたは複数のカメラからの距離に基づく奥行測定から構成される請求項16の前記コンピュータプログラム製品。
  19. 前記制御信号の生成は、前記1つまたは複数の座標を所定の機能を使用し制御信号に変換することから構成され、前記奥行測定は少なくとも1つの入力を前記所定の機能にすることを更に含む、請求項16の前記コンピュータプログラム製品。
  20. 前記制御信号は前記スピーカを前記1つまたは複数の座標に向けるように前記スピーカを調整するように構成される請求項16の前記コンピュータプログラム製品。
JP2015226572A 2014-12-08 2015-11-19 顔認識を使用した調整スピーカ Active JP6829541B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US14/563,599 2014-12-08
US14/563,599 US9544679B2 (en) 2014-12-08 2014-12-08 Adjusting speakers using facial recognition

Publications (2)

Publication Number Publication Date
JP2016107978A true JP2016107978A (ja) 2016-06-20
JP6829541B2 JP6829541B2 (ja) 2021-02-10

Family

ID=54754520

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015226572A Active JP6829541B2 (ja) 2014-12-08 2015-11-19 顔認識を使用した調整スピーカ

Country Status (4)

Country Link
US (2) US9544679B2 (ja)
EP (1) EP3032847B1 (ja)
JP (1) JP6829541B2 (ja)
CN (1) CN105681968B (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101793019B1 (ko) * 2016-07-05 2017-11-06 문조영 음향 전송 장치
JP2019205040A (ja) * 2018-05-22 2019-11-28 三菱電機株式会社 角度制御装置、及び、角度制御プログラム
JP2021160421A (ja) * 2020-03-31 2021-10-11 本田技研工業株式会社 車両
JP2021160419A (ja) * 2020-03-31 2021-10-11 本田技研工業株式会社 車両
CN113852892A (zh) * 2021-09-07 2021-12-28 歌尔科技有限公司 音频系统及其控制方法、装置

Families Citing this family (71)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015103439A1 (en) 2014-01-03 2015-07-09 Harman International Industries, Incorporated Gesture interactive wearable spatial audio system
US20170164099A1 (en) * 2015-12-08 2017-06-08 Sony Corporation Gimbal-mounted ultrasonic speaker for audio spatial effect
IL243513B2 (en) * 2016-01-07 2023-11-01 Noveto Systems Ltd A system and method for voice communication
US11388541B2 (en) 2016-01-07 2022-07-12 Noveto Systems Ltd. Audio communication system and method
WO2018127901A1 (en) 2017-01-05 2018-07-12 Noveto Systems Ltd. An audio communication system and method
US9924291B2 (en) 2016-02-16 2018-03-20 Sony Corporation Distributed wireless speaker system
US9992580B2 (en) * 2016-03-04 2018-06-05 Avaya Inc. Signal to noise ratio using decentralized dynamic laser microphones
CN106162447A (zh) * 2016-06-24 2016-11-23 维沃移动通信有限公司 一种音频播放的方法和终端
DE102017100628A1 (de) * 2017-01-13 2018-07-19 Visteon Global Technologies, Inc. System und Verfahren zum Bereitstellen einer personenbezogenen Audiowiedergabe
US11096004B2 (en) 2017-01-23 2021-08-17 Nokia Technologies Oy Spatial audio rendering point extension
US11243293B2 (en) 2017-02-07 2022-02-08 Samsung Electronics Company, Ltd. Radar-based system for sensing touch and in-the-air interactions
US10531219B2 (en) 2017-03-20 2020-01-07 Nokia Technologies Oy Smooth rendering of overlapping audio-object interactions
US10397724B2 (en) 2017-03-27 2019-08-27 Samsung Electronics Co., Ltd. Modifying an apparent elevation of a sound source utilizing second-order filter sections
US11074036B2 (en) 2017-05-05 2021-07-27 Nokia Technologies Oy Metadata-free audio-object interactions
US10165386B2 (en) 2017-05-16 2018-12-25 Nokia Technologies Oy VR audio superzoom
DE112017007713T5 (de) * 2017-07-31 2020-03-19 Ford Global Technologies, Llc Systeme und Verfahren zur Fahrzeugbelegungsverwaltung
US11395087B2 (en) 2017-09-29 2022-07-19 Nokia Technologies Oy Level-based audio-object interactions
US11465631B2 (en) * 2017-12-08 2022-10-11 Tesla, Inc. Personalization system and method for a vehicle based on spatial locations of occupants' body portions
US10306394B1 (en) 2017-12-29 2019-05-28 Samsung Electronics Co., Ltd. Method of managing a plurality of devices
US10225656B1 (en) * 2018-01-17 2019-03-05 Harman International Industries, Incorporated Mobile speaker system for virtual reality environments
CN108271098A (zh) * 2018-02-06 2018-07-10 深圳市歌美迪电子技术发展有限公司 音响机构以及音响系统
CN110278469A (zh) * 2018-03-16 2019-09-24 上海博泰悦臻电子设备制造有限公司 多媒体播放方法、播放控制系统、存储介质及车载终端
US10542368B2 (en) 2018-03-27 2020-01-21 Nokia Technologies Oy Audio content modification for playback audio
US10616684B2 (en) 2018-05-15 2020-04-07 Sony Corporation Environmental sensing for a unique portable speaker listening experience
DE102018209962A1 (de) * 2018-06-20 2019-12-24 Faurecia Innenraum Systeme Gmbh Privataudiosystem für ein 3D-artiges Hörerlebnis bei Fahrzeuginsassen und ein Verfahren zu dessen Erzeugung
CN110636413A (zh) * 2018-06-22 2019-12-31 长城汽车股份有限公司 调节车载音响音效的系统和方法以及车辆
CN110798775A (zh) * 2018-08-02 2020-02-14 长城汽车股份有限公司 车辆的扬声器角度调节方法、系统及车辆
US10869128B2 (en) 2018-08-07 2020-12-15 Pangissimo Llc Modular speaker system
CN109119060B (zh) * 2018-08-09 2021-04-13 广州小鹏汽车科技有限公司 一种应用于汽车的有源降噪方法及系统
WO2020030303A1 (en) 2018-08-09 2020-02-13 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. An audio processor and a method for providing loudspeaker signals
US10567871B1 (en) * 2018-09-06 2020-02-18 Sony Corporation Automatically movable speaker to track listener or optimize sound performance
US10682931B2 (en) 2018-09-07 2020-06-16 Toyota Motor Engineering & Manufactuing North America, Inc. On-demand furniture
US11067200B2 (en) 2018-10-24 2021-07-20 Toyota Motor Engineering & Manufacturing North America, Inc. Self-healing microvalve
US11548261B2 (en) 2018-10-24 2023-01-10 Toyota Motor Engineering & Manufacturing North America, Inc. Structure with selectively variable stiffness
US11081975B2 (en) 2018-10-25 2021-08-03 Toyota Motor Engineering & Manufacturing North America, Inc. Somersaulting motion of soft bodied structure
US11088635B2 (en) 2018-10-25 2021-08-10 Toyota Motor Engineering & Manufacturing North America, Inc. Actuator with sealable edge region
US11041576B2 (en) 2018-10-25 2021-06-22 Toyota Motor Engineering & Manufacturing North America, Inc. Actuator with static activated position
US10946535B2 (en) 2018-10-25 2021-03-16 Toyota Motor Engineering & Manufacturing North America, Inc. Earthworm-like motion of soft bodied structure
CN109151659B (zh) * 2018-10-29 2020-06-05 歌尔科技有限公司 一种音频设备定向发声方法、装置和音频设备
KR102675289B1 (ko) 2018-10-29 2024-06-17 현대자동차주식회사 차량 및 그 제어 방법
US11599329B2 (en) 2018-10-30 2023-03-07 Sony Corporation Capacitive environmental sensing for a unique portable speaker listening experience
US11498270B2 (en) 2018-11-21 2022-11-15 Toyota Motor Engineering & Manufacturing North America, Inc. Programmable matter
WO2020107251A1 (en) * 2018-11-28 2020-06-04 Beijing Didi Infinity Technology And Development Co., Ltd. System and method for detecting in-vehicle headcount
CN111252006A (zh) * 2018-11-30 2020-06-09 长城汽车股份有限公司 中置扬声器的指向性调整方法及装置
US11195506B2 (en) 2018-12-03 2021-12-07 Toyota Motor Engineering & Manufacturing North America, Inc. Sound-modulating windows
US10859101B2 (en) 2018-12-10 2020-12-08 Toyota Motor Engineering & Manufacturing North America, Inc. Soft-bodied actuator with pinched configuration
CN111327990B (zh) * 2018-12-13 2022-04-26 宝马股份公司 控制多路音频播放的方法、装置、系统、车辆及存储介质
US10631083B1 (en) * 2018-12-18 2020-04-21 Toyota Motor Engineering & Manufacturing North America, Inc. Adjusting vehicle speakers
US10640033B1 (en) 2018-12-18 2020-05-05 Toyota Motor Engineering & Manufacturing North America, Inc. Adjusting vehicle headlights
US11066016B2 (en) 2018-12-18 2021-07-20 Toyota Motor Engineering & Manufacturing North America, Inc. Adjusting vehicle mirrors
US10682903B1 (en) 2018-12-18 2020-06-16 Toyota Motor Engineering & Manufacturing North America, Inc. Active seals for vehicles
US11479308B2 (en) 2019-01-09 2022-10-25 Toyota Motor Engineering & Manufacturing North America, Inc. Active vehicle interface for crosswind management
CN109640221B (zh) * 2019-01-18 2021-01-12 云谷(固安)科技有限公司 一种智能音箱及其控制方法
US11192469B2 (en) 2019-01-30 2021-12-07 Toyota Motor Engineering & Manufacturing North America, Inc. Vehicle seat with morphing bolsters
US20220174446A1 (en) * 2019-03-22 2022-06-02 Sony Group Corporation Acoustic signal processing device, acoustic signal processing system, acoustic signal processing method, and program
CN110072172B (zh) * 2019-04-25 2020-10-16 广州小鹏汽车科技有限公司 一种音频信号的输出方法、系统、电子设备及可读介质
WO2021014112A1 (en) * 2019-07-24 2021-01-28 Google Llc Dual panel audio actuators and mobile devices including the same
US11968268B2 (en) 2019-07-30 2024-04-23 Dolby Laboratories Licensing Corporation Coordination of audio devices
WO2021021460A1 (en) 2019-07-30 2021-02-04 Dolby Laboratories Licensing Corporation Adaptable spatial audio playback
JP6767664B1 (ja) * 2019-10-28 2020-10-14 富士通クライアントコンピューティング株式会社 情報処理システム、情報処理装置およびプログラム
WO2021127286A1 (en) * 2019-12-18 2021-06-24 Dolby Laboratories Licensing Corporation Audio device auto-location
FR3105549B1 (fr) * 2019-12-24 2022-01-07 Parrot Faurecia Automotive Sas Procédé et système audio d’appui-tête de siège
US11443737B2 (en) 2020-01-14 2022-09-13 Sony Corporation Audio video translation into multiple languages for respective listeners
CN111277931A (zh) * 2020-01-20 2020-06-12 东风汽车集团有限公司 可实现汽车隐私通话功能的装置
WO2021157614A1 (ja) * 2020-02-05 2021-08-12 豊通ケミプラス株式会社 騒音低減装置および騒音低減方法
US11343602B2 (en) 2020-02-21 2022-05-24 Harman International Industries, Incorporated Passive auto-orienting loudspeaker assembly
CN111782045A (zh) * 2020-06-30 2020-10-16 歌尔科技有限公司 一种设备角度调节方法、装置、智能音箱及存储介质
US20220073081A1 (en) * 2020-09-09 2022-03-10 Faurecia Clarion Electronics Co., Ltd. In-vehicle apparatus control system, in-vehicle apparatus, and in-vehicle apparatus control method
CN112078498B (zh) * 2020-09-11 2022-03-18 广州小鹏汽车科技有限公司 一种车辆智能座舱的声音输出控制方法和智能座舱
CN112863473A (zh) * 2021-01-08 2021-05-28 中国人民解放军63919部队 一种基于耳廓特征位置自动辨识跟踪的主动降噪装置
CN113504890A (zh) * 2021-07-14 2021-10-15 炬佑智能科技(苏州)有限公司 基于ToF相机的扬声器组件的控制方法、装置、设备和介质

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0823599A (ja) * 1994-07-05 1996-01-23 Roland Corp 音響再生装置
JP2005176221A (ja) * 2003-12-15 2005-06-30 Mitsubishi Electric Engineering Co Ltd 音響システム
JP2008017227A (ja) * 2006-07-06 2008-01-24 Denso Corp 顔認識装置及びそれを用いた自動車用ユーザーもてなしシステム
JP2008022495A (ja) * 2006-07-14 2008-01-31 Matsushita Electric Ind Co Ltd スピーカシステム
JP2009500226A (ja) * 2005-07-05 2009-01-08 ローベルト ボツシユ ゲゼルシヤフト ミツト ベシユレンクテル ハフツング 車両システム
US20100027832A1 (en) * 2008-08-04 2010-02-04 Seiko Epson Corporation Audio output control device, audio output control method, and program
JP2014171148A (ja) * 2013-03-05 2014-09-18 Panasonic Corp 音響再生装置

Family Cites Families (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB8531952D0 (en) 1985-12-31 1986-02-05 Sar Plc Stereo balance adjuster
JP2983837B2 (ja) 1994-05-10 1999-11-29 三菱電機株式会社 計算機システム
WO2002041664A2 (en) 2000-11-16 2002-05-23 Koninklijke Philips Electronics N.V. Automatically adjusting audio system
US7369685B2 (en) * 2002-04-05 2008-05-06 Identix Corporation Vision-based operating method and system
JP4130900B2 (ja) 2003-03-28 2008-08-06 株式会社ノーリツ 給湯装置およびその操作装置
CN1774871A (zh) * 2003-04-15 2006-05-17 专利创投公司 定向扬声器
KR20050047634A (ko) * 2003-11-18 2005-05-23 현대자동차주식회사 스피커 각도조절을 통한 사운드 품질향상 방법
EP1715717B1 (en) 2004-02-10 2012-04-18 Honda Motor Co., Ltd. Moving object equipped with ultra-directional speaker
US20060140420A1 (en) * 2004-12-23 2006-06-29 Akihiro Machida Eye-based control of directed sound generation
US8675880B2 (en) * 2006-03-31 2014-03-18 Koninklijke Philips N.V. Device for and a method of processing data
CN201063840Y (zh) * 2007-06-06 2008-05-21 深圳Tcl新技术有限公司 一种扬声器装置
JP5245368B2 (ja) * 2007-11-14 2013-07-24 ヤマハ株式会社 仮想音源定位装置
JP5137200B2 (ja) 2008-08-26 2013-02-06 日本電信電話株式会社 ハイパーテキスト転送プロトコルネットワークおよびデータ転送方法
JP4735993B2 (ja) * 2008-08-26 2011-07-27 ソニー株式会社 音声処理装置、音像定位位置調整方法、映像処理装置及び映像処理方法
CN101673346B (zh) * 2008-09-09 2013-06-05 日电(中国)有限公司 对图像进行处理的方法、设备和系统
US20120281128A1 (en) 2011-05-05 2012-11-08 Sony Corporation Tailoring audio video output for viewer position and needs
JP5163796B1 (ja) * 2011-09-22 2013-03-13 パナソニック株式会社 音響再生装置
EP2797795A4 (en) * 2011-12-29 2015-08-26 Intel Corp SYSTEMS, METHODS AND APPARATUS FOR DIRECTING SOUND IN A VEHICLE
US8855369B2 (en) * 2012-06-22 2014-10-07 Microsoft Corporation Self learning face recognition using depth based tracking for database generation and update
US20150078595A1 (en) * 2013-09-13 2015-03-19 Sony Corporation Audio accessibility
US20160098040A1 (en) 2014-10-02 2016-04-07 Harman International Industries, Inc. Mount for media content presentation device

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0823599A (ja) * 1994-07-05 1996-01-23 Roland Corp 音響再生装置
JP2005176221A (ja) * 2003-12-15 2005-06-30 Mitsubishi Electric Engineering Co Ltd 音響システム
JP2009500226A (ja) * 2005-07-05 2009-01-08 ローベルト ボツシユ ゲゼルシヤフト ミツト ベシユレンクテル ハフツング 車両システム
JP2008017227A (ja) * 2006-07-06 2008-01-24 Denso Corp 顔認識装置及びそれを用いた自動車用ユーザーもてなしシステム
JP2008022495A (ja) * 2006-07-14 2008-01-31 Matsushita Electric Ind Co Ltd スピーカシステム
US20100272271A1 (en) * 2006-07-14 2010-10-28 Panasonic Corporation Speaker system
US20100027832A1 (en) * 2008-08-04 2010-02-04 Seiko Epson Corporation Audio output control device, audio output control method, and program
JP2010039094A (ja) * 2008-08-04 2010-02-18 Seiko Epson Corp 音声出力制御装置、音声出力装置、音声出力制御方法、及び、プログラム
JP2014171148A (ja) * 2013-03-05 2014-09-18 Panasonic Corp 音響再生装置

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101793019B1 (ko) * 2016-07-05 2017-11-06 문조영 음향 전송 장치
JP2019205040A (ja) * 2018-05-22 2019-11-28 三菱電機株式会社 角度制御装置、及び、角度制御プログラム
JP6998831B2 (ja) 2018-05-22 2022-01-18 三菱電機株式会社 角度制御装置、及び、角度制御プログラム
JP2021160421A (ja) * 2020-03-31 2021-10-11 本田技研工業株式会社 車両
JP2021160419A (ja) * 2020-03-31 2021-10-11 本田技研工業株式会社 車両
JP7013513B2 (ja) 2020-03-31 2022-01-31 本田技研工業株式会社 車両
US11388542B2 (en) 2020-03-31 2022-07-12 Honda Motor Co., Ltd. Vehicle
US11397557B2 (en) 2020-03-31 2022-07-26 Honda Motor Co., Ltd. Vehicle
CN113852892A (zh) * 2021-09-07 2021-12-28 歌尔科技有限公司 音频系统及其控制方法、装置
CN113852892B (zh) * 2021-09-07 2023-02-28 歌尔科技有限公司 音频系统及其控制方法、装置

Also Published As

Publication number Publication date
EP3032847A2 (en) 2016-06-15
US20170150252A1 (en) 2017-05-25
US20160165337A1 (en) 2016-06-09
CN105681968A (zh) 2016-06-15
JP6829541B2 (ja) 2021-02-10
US9544679B2 (en) 2017-01-10
EP3032847B1 (en) 2020-01-01
CN105681968B (zh) 2021-09-28
EP3032847A3 (en) 2016-06-29
US9866951B2 (en) 2018-01-09

Similar Documents

Publication Publication Date Title
JP6829541B2 (ja) 顔認識を使用した調整スピーカ
JP7275227B2 (ja) 複合現実デバイスにおける仮想および実オブジェクトの記録
US11617050B2 (en) Systems and methods for sound source virtualization
CN111466124B (zh) 用于渲染用户的视听记录的方法,处理器系统和计算机可读介质
CN110771182B (zh) 用于音频渲染的音频处理器、系统、方法和计算机程序
US9622013B2 (en) Directional sound modification
WO2017215295A1 (zh) 一种摄像机参数调整方法、导播摄像机及系统
US20140328505A1 (en) Sound field adaptation based upon user tracking
US10595149B1 (en) Audio augmentation using environmental data
US20120183161A1 (en) Determining individualized head-related transfer functions
JP2022538511A (ja) レガシーオーディオビジュアルメディアからの空間化された仮想音響シーンの決定
CN105282651B (zh) 用于在舞台上布置舞台元件的技术
US20210112361A1 (en) Methods and Systems for Simulating Acoustics of an Extended Reality World
WO2019095210A1 (zh) 智能眼镜及其控制云台的方法、云台、控制方法和无人机
US20230188921A1 (en) Audio system with dynamic target listening spot and ambient object interference cancelation
WO2019069743A1 (ja) オーディオコントローラ、超音波スピーカ、及び、オーディオシステム
TW201928945A (zh) 音訊場景處理技術
US20230154106A1 (en) Information processing apparatus, information processing method, and display apparatus
CN112236940A (zh) 用于滤波器参数的索引方案
WO2019002676A1 (en) RECORDING AND RENDERING SOUND SPACES
Simon Galvez et al. A Listener Position Adaptive Stereo System for Object-Based Reproduction
US20240205637A1 (en) Visual Platforms for Configuring Audio Processing Operations
CN116668936A (zh) 扬声器控制
WO2024044113A2 (en) Rendering audio captured with multiple devices

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20181031

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20190827

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20190830

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20191125

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20200525

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200804

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20210112

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20210122

R150 Certificate of patent or registration of utility model

Ref document number: 6829541

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250