JP2015056905A - 音声の到達性 - Google Patents

音声の到達性 Download PDF

Info

Publication number
JP2015056905A
JP2015056905A JP2014185803A JP2014185803A JP2015056905A JP 2015056905 A JP2015056905 A JP 2015056905A JP 2014185803 A JP2014185803 A JP 2014185803A JP 2014185803 A JP2014185803 A JP 2014185803A JP 2015056905 A JP2015056905 A JP 2015056905A
Authority
JP
Japan
Prior art keywords
listener
audio
image
ear
program
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Abandoned
Application number
JP2014185803A
Other languages
English (en)
Inventor
レイ シンタニ ピーター
Rae Shintani Peter
レイ シンタニ ピーター
ジェイ ズースタック フレデリック
J Zustak Frederick
ジェイ ズースタック フレデリック
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Publication of JP2015056905A publication Critical patent/JP2015056905A/ja
Abandoned legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • H04S7/302Electronic adaptation of stereophonic sound system to listener position or orientation
    • H04S7/303Tracking of listener position or orientation

Landscapes

  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Otolaryngology (AREA)
  • Stereophonic System (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Obtaining Desirable Characteristics In Audible-Bandwidth Transducers (AREA)

Abstract

【課題】聴覚障害者の音声の聞こえを改善す音声送達方法を提供する。
【解決手段】カメラ24を用いてリスニング範囲を撮像し、各リスナー36,40の位置、頭及び耳の位置を特定し、顔認識により各登録されプロファイルされたリスナーを認識し、ディスプレイ20に一体化された超音波トランスデューサアレイ32より、リスナー36、リスナー40にプロファイルに合わせて右耳の聴力、左耳の聴力に適合した音量、周波数等化を行うことでリスナーの聴力を補償し、指向性音声ビームを向ける。
【選択図】図1

Description

〔著作権及び商標表示〕
本特許文書の開示の一部は、著作権保護の対象内容を含む。著作権の権利所有者は、合衆国特許商標庁の特許ファイル又は記録内に表されるとおりに第三者が特許文書又は特許開示を複製することには異議を唱えないが、それ以外は全ての著作権を留保する。商標は、これらのそれぞれの所有者の所有物である。
合衆国高度通信サービス法には、様々な身体障害に対応するための要件があり、その1つに聴覚障害がある。この法律は、テレビ装置の提供元が、聴覚障害を持つ人への音声提示の改善を試みる対策を講じることを求めている。
以下の詳細な説明を添付図面と共に参照することにより、構成及び動作方法を示すいくつかの例示的な実施形態、並びに目的及び利点を最も良く理解することができる。
本発明のいくつかの実施形態によるテレビ音声システムの例である。 本発明のいくつかの実施形態によるリスナープロファイルの実装例である。 本発明のいくつかの実施形態による、指向性音声システムにおけるリスナーの頭の回転の影響の例を示す図である。 本発明のいくつかの実施形態による、指向性音声システムにおけるリスナーの頭の回転の影響の例を示す図である。 本発明のいくつかの実施形態による、指向性音声システムにおけるリスナーの頭の回転の影響の例を示す図である。 本発明のいくつかの実施形態による動作方法を示すフローチャート例である。 本発明のいくつかの実施形態による音声調整方法のフローチャート例である。 本発明のいくつかの実施形態による指向性音声システムのブロック図表現例である。 本発明のいくつかの実施形態による、ある位置に超音波音声アレイを向けるための構成例である。
本発明は多くの異なる形の実施形態が可能であるが、図面には特定の実施形態を示し、本明細書ではこれらについて詳細に説明しており、このような実施形態の開示は原理の一例として見なすべきであり、図示及び説明する特定の実施形態に本発明を限定することを意図するものではないと理解されたい。以下の説明では、図面の複数の図における同様の、類似の又は一致する部分については同じ参照番号を用いて説明する。
本明細書で使用する「1つの(英文不定冠詞)」という用語は、1又は1よりも多くの、と定義される。本明細書で使用する「複数の」という用語は、2又は2よりも多くの、と定義される。本明細書で使用する「別の」という用語は、少なくとも第2の又はそれ以上の、と定義される。本明細書で使用する「含む(including)」及び/又は「有する(having)」という用語は、「備える(comprising)」(すなわち包括的な用語)と定義される。本明細書で使用する「結合される(coupled)」という用語は、「接続される」と定義されるが、必ずしも直接的な、また必ずしも機械的な接続ではない。本明細書で使用する「プログラム」又は「コンピュータプログラム」という用語又は類似の用語は、コンピュータシステム上での実行を意図された一連の命令として定義される。「プログラム」又は「コンピュータプログラム」は、実行可能アプリケーション、アプレット、サーブレット、ソースコード、オブジェクトコード、スクリプト、プログラムモジュール、共有ライブラリ/動的ロードライブラリ及び/又はコンピュータシステム上で実行するように設計されたその他の一連の命令におけるサブルーチン、関数、手順、アプリケーション、オブジェクト方法、オブジェクト実装を含むことができる。本明細書で使用する「テレビ受信機」という用語又は同様の用語は、テレビ、セットトップボックス(STB)、又はテレビ番組を受信するように構成されたその他の装置を含むあらゆるテレビ受信機を含むことが意図されている。「ディスプレイ」又は同様のものは、テレビ装置、又は音声を含むコンテンツを受信できるコンピュータシステムの一部を構成することができる。本明細書の教示に従う装置は、STB、独立型サウンドバー、外付け型アドオン音声装置、又は音声機能を有しているがチューナーを有していないモニタ、及びその他の実装の形に例示化することができる。
本明細書を通じて、「一実施形態」、「いくつかの実施形態」、「実施形態」、「実装」、「実施例」又は同様の用語に対する言及は、その実施形態に関連して説明する特定の特徴、構造又は特性が、本発明の少なくとも1つの実施形態に含まれることを意味する。従って、本明細書を通じて至るところに出現するこのような語句は、必ずしも全てが同じ実施形態を意味するわけではない。さらに、1又はそれ以上の実施形態において、これら特定の特徴、構造又は特性をあらゆる好適な方法で無制限に組み合わせることもできる。
本明細書で使用する「又は」という用語は包括的なものとして解釈すべきであり、すなわちいずれか1つ又はあらゆる組み合わせを意味する。従って、「A、B又はC」は、「A、B、C、AとB、AとC、BとC、AとBとC、のいずれか」を意味する。この定義に対する例外は、要素、機能、ステップ又は行為の組み合わせが何らかの点で本質的に互いに相容れない場合にのみ生じる。
「音声特性」という用語は、以下に限定されるわけではないが、音量、等化、圧縮、ルームシミュレーション、チャネルミックスなどを含む、電子音声信号内で調整できる属性を意味すると解釈すべきである。
上述したように、合衆国高度通信サービス法には、様々な身体障害に対応するための要件があり、その1つに聴覚障害がある。この法律は、テレビ装置の提供元が、聴覚障害を持つ人への音声提示の改善を試みる対策を講じることを求めている。
なお、聴覚障害は人によって大きく異なり、左と右で異なることも多い。難聴は、一方の耳に限定されることもあり、或いは程度の差はあれ、一方の耳の方が他方の耳よりも深刻なこともある。また、影響する周波数も人によって異なり、さらには同じ人物でも耳によって異なる。このような聴覚障害は、聴力の異なる複数の人々が同じテレビ視聴範囲内に存在する時に問題を示すことがある。この結果、テレビの音声が主に最も聞えの悪い人の聴力に対応するように調節され、その他のリスナーには不快なほど大音量になることがある。
音声信号は、小型超音波トランスデューサのアレイを使用して非常に指向性の高い超音波ビームを送信する超音波技術を用いて指向性を高めることができる。この高い指向性レベルは、主に、送信される超音波信号の波長をトランスデューサが近似するようにされることによってもたらされる。リスナーの耳に向けて2つの超音波信号を送ることにより、音声をこれらの2つの信号間の周波数差に符号化することができる。空気と耳の非線形性により、2つの超音波信号がミキシングされ、加算信号と差分信号が生じるようになる。差分信号は、元々符号化されている音声を表し、リスナーに聞こえる。このような2つのビームセットをリスナーの左耳と右耳に向けることにより、ステレオ音声のプログラミングを実現することができる。
このメカニズムを有利に利用して、聴覚障害者の音声の聞こえを改善することができる。一般に、聴覚障害者は、例えばテレビ(TV)を見る時に、テレビ番組を楽しむために大音量を必要とする。これにより、聴覚障害がなく小さな音量を好む他のリスナーが犠牲になるという不都合が生じ得る。
従って、リスナーへの音声の送達を個人の聴力特性に合わせ、この個別化した音声を超音波送達とともに個人に向けることができる。さらに、カメラにより画像認識を用いて個人を識別し、この識別された個人に調整音を向けることができる。音について狙いを定めることは複数の方法で行うことができる。位相配列したトランスデューサを用いることもできるが、この方法には指向性の粒度(角度)などの制限があり、同時に標的にすることができるリスナーの数にも制限がある。
好ましい方法は、上述したような個別化した音の超音波送達を使用することである。音を約40kHzなどの超音波範囲に周波数シフトさせる。次に、この超音波を別の超音波でビートすることにより、加算信号、差分信号及び基本信号を生じさせる。リスナーには差分信号しか聞こえない。この結果、トランスデューサの寸法のかなりの部分が超音波の波長になるので、非常に指向性の高い音が送達されるようになる。これにより、個々の受け手に対して音を向けることができるようになる。
音について狙いを定めるには、1つの技術として、固定することも又は予め設定しておくこともできる複数の調整可能なゾーンを有することである。通常、リスナーは、室内の比較的固定された場所にある椅子又はソファにより定められる個々の固定された位置に座る。従って、位置が定まると、リスナーのみを識別し、予め設定した位置内のリスナーの位置を特定する必要がある。リスナーの識別は、ユーザが自分自身を手動で識別した場合には単純化することができ、或いはRFID、Bluetooth(登録商標)、リモコン装置又は多くのリモコン装置のうちの1つの所有、識別可能な携帯電話機の所有などの技術を用いてさらに高度化することもできる。好ましい実装では、カメラ又はその他の画像取り込み装置を用いて、顔認識及び記憶済みのリスナープロファイルを使用してリスナーの位置特定及び識別を行い、各リスナーを空間的に特徴付ける。
ここで図1を参照して、超音波音声を用いて複数のリスナー間で音声を分離する、いくつかの実施形態による非限定的なテレビシステム例の実装について検討する。この図では、ディスプレイ20又はテレビ受信機などのその他の装置(STB、外付け型音声処理装置など)が、リスニング範囲28を撮像するための一体型カメラ24を有する。ディスプレイ20に関連する又は一体化された音声システムが超音波トランスデューサアレイ32を使用し、この超音波トランスデューサアレイ32を利用して、上述した超音波技術を用いてリスナー36及びリスナー40などの1又はそれ以上のリスナーに標的が定められた指向性音声ビームを向ける。いくつかの実装では、これらのリスナー36及びリスナー40を、頻繁にテレビを見る人物とすることができ、従ってこれらのリスナーは頻繁にリスニング範囲28内に存在する。
これらのリスナーの各々の音声体験をカスタマイズするために、各リスナーのプロファイルを設定し、未認識のリスナーにはデフォルトプロファイル又はゲストプロファイルを与えることができる。カメラ24を用いてリスニング範囲を撮像することにより、解析時に1)各リスナーの位置、2)各リスナーの頭及び耳の位置を特定し、3)各登録されプロファイルされたリスナーを認識し、又はリスナーをゲストとして指定することができる画像を提供して、4)リスナーの動きを追跡し、5)リスナーにおけるリスニング体験にとって重要な動きを確認し、6)リスナーのプロファイルに示されるリスナーの好み又は聴力に音声プログラムを合わせることができる。このように、リスナー36が通常の聴力を有し、リスナー40の聴力が劣っている場合には、これらの人物の要望及び好みに従い、他方の人物に対する影響を最小限に抑えた状態で各人を個別に取り扱うことができる。別の実施形態では、プロファイルに好ましい言語を含めることができ、従って複数の言語を提供することができる。様々な音声言語のサブチャネルを用いて、主音声チャネルで提供されている言語、又はセットアップ中に示されるデフォルト言語以外の言語を好むリスナーに対応することができる。別の実施形態では、単語置換エンジンが、ペアレンタルコントロールの制限又は制約対象として識別された、及びこの制限又は制約に関連付けられた特定のリスナーのために、好ましくない単語又は語句を選択的に置き換えることができる。
限定ではなく一例として、テレビシステム及び図2に示すような「ジョージ」という名前のリスナーのプロファイル画面50の実装について検討する。この(例えば、テレビのメニューシステムから呼び出される)プロファイル画面例では、リスナーが参照用の画像52を提供し、可能であれば利用可能な音声言語サブチャネルからの選択に使用できる好ましい言語を56において選択することができる。さらに、このリスナープロファイルは、明示していないその他の好み、特性及び/又は制約を含むより大きなユーザプロファイルの一部とすることができる。テレビのカメラ24は、プロファイル50からジョージの音声特性を検索するために、リスニング範囲の画像を取り込む際に、この画像を顔認識のための参照として使用することができる。この例では、ジョージの右耳の聴力が左耳の聴力に比べて弱く、右耳音量が最大であり左耳音量が約半分である音量設定60にこのことが反映されている。また、68に示すように高い周波数が聞こえにくい右耳に比べ、64では、左耳が低、中、高周波数をバランスよく聞き取れることを示している。この例では、聴力が正常である人物の周波数等化は平坦に近く、音量は低レベル(例えば、約25%)であると仮定することができる。
音声システムは、このプロファイルをテンプレートとして使用して、右チャネルの音量が非常に大きく左チャネルの音量が通常よりも大きな、ジョージに特化した音声信号をビーム放出することができる。また、右チャネルの音声は、低周波よりも中間及び高周波の方が音量が大きくなるように調整される。このプロファイルは、音声システムの助けにより、又はリスナーの好みに基づいて実験的に設定することができる。一実施形態では、音声セットアップが、リスナーの聴力テストを行って音声セットアッププロトコルに対するリスナーの反応に従って音声特性を修正することにより、個人プロファイルの設定においてユーザをガイドする。このような実装例では、試験トーンを生成し、これにユーザが応答して、特定のユーザが特定の周波数範囲をどのレベルで聴取できるかを判定することができる。これを行う際には、ユーザが自身の聴力を高めるように手動で等化を調整することも、或いはプロファイルで使用するための適当な等化を音声システムが導出することもできる。
別の実装例では、単語又は語句を(例えば、各チャネルで1回)聞こえるように再生しながらディスプレイ上にも表示し、表示された発話単語又は語句を理解する能力に関してユーザに問い合わせを行うことができる。例えば、ほとんどの聴覚問題は、高周波成分を聞き取る能力の低下から始まる。従って、かなりの高周波内容を含む「spoon(スプーン)」、「ship(船)」、「thicket(茂み)」などの単語を再生し、ユーザが、最も良好な理解度及び/又は右側と左側の聴力の均等性をもたらす特定のQ、等化、フィルタリング及びバランスを示すことができる。システムは、フィルタ特性が体系的に異なる訓練過程を各ユーザに受けさせ、各ユーザは、最も高い理解度で発話を聞き取る能力の最適化を支援することができる。プロファイルにデータが設定されると、ボタン74を使用してプロファイルを保存し、又は自動セットアップ過程の一部としてプロファイルを終了して保存することができ、或いはプロファイルを以前の設定に戻すための、又は以前に何も設定されていない場合にはプロファイル無しの状態に戻すためのボタン78をリスナーが使用して保存せずに終了することもできる。
この例では、音声プログラムがリスナーにステレオ音響でビーム放出されると仮定しているが、音声ビームの指向性及び精度要件を下げた同様に良好なモノラル形式で音声をビーム放出することもできるので、これを限定と見なすべきではない。さらに、音声は左耳及び右耳に向けてビーム放出することができるが、超音波音声ビームが重ならないようにするという要件はない。
なお、従来のステレオ音声システムでサラウンド音響をステレオ送出する場合、このステレオミックスは、マルチチャネル音声プログラムの数多くのチャネルから得られたミックスであることが多い。例えば、5.1チャネル音声システムは、センターチャネル、左フロントチャネル、右フロントチャネル、左リアチャネル、右リアチャネル及びサブウーファチャネルを有する。このようなマルチチャネル音声ミックスでは、一般に、見ているテレビ番組又は映画のセリフ(発話)の大部分がセンターチャネルによって伝えられる。同様に、低周波は、サブウーファチャネルなどで扱われる。これをステレオにミキシングした場合、センターチャネルのセリフは、一般に左チャネルと右チャネルに分割される。通常、テレビ及びその他の音声再生では、1つ又は2つのチャネルしか使用されないので、マルチチャネル音声から少ないチャネル数への音声信号ミックスダウンを、聴覚障害者にとってより望ましいリスニング体験を実現するように調整することができる。
例えば、リスナーが、他の音の存在下で発話を認識する能力に障害を有する場合、このリスナーには、リスナープロファイルに基づいて高レベルのセンターチャネルミックスを提供することが有利となり得る。従って、いくつかの実施形態による音声送達方法は、プログラム制御プロセッサを利用して、記憶されているリスナープロファイルを検索し、これを読み出してリスナーに関連する音声特性設定を確認し、音声ミキサにおいて、このプログラム制御プロセッサが、リスナーのリスニング体験を改善するように、記憶されているリスナープロファイルに基づいてマルチチャネル音声プログラムのチャネルミキシングをより少ない数のチャネルに調整する。
ここで、図3A、図3B及び図3Cから構成される図3を参照すると、本教示を検討した時に、音声を指向性ビームでリスナーに送る際に別の問題が生じる可能性があると理解されよう。図3Aでは、リスナー90の両耳が容易に左側音声ビームと右側音声ビーム(L及びRとして図示)の直接的な標的となるようにリスナーが位置している場合、このリスナーには、意図する通りにステレオ音声が聞こえる。しかしながら、リスナー90が、図3Bに示すように頭を回転させると、左耳の音声プログラムの方が右耳の音声プログラムよりも顕著になる。さらに図3Cを例に取って検討すると、この図では、右耳が(右耳ビームを表す点線で示すように)頭によって完全に遮られている一方で、左耳は容易に左耳ビームの標的となっている。このような状況では、ビームの指向性及び左音声と右音声のステレオ分離が、リスナー90に不利に働くことがある。この場合、リスナーの頭の動きによって音声が消失又は減少した時にテレビ番組又は映画のセリフが失われないことが一般に最善である。従って、本明細書の教示による方法では、カメラ24がリスナーの連続的な画像を撮影することにより、標的リスナーが動いた時に(特に頭を動かした時に)これらの動きが追跡される。システムが、リスナーのヒアリング体験が動きによって妨げられたことを検出した場合、元のマルチチャネルプログラム材料のミックスダウンを適応させ、又はステレオ音声のミックスを調整することができる。
限定ではなく一例として、頭の位置が図3Aに示す位置から図3Cの位置に動いたことが検出された場合、プログラム制御プロセッサの制御下で右チャネル音声を左チャネル音声にシフトさせるようにミックスを自動的に操作することができる。別の実施形態では、同じ頭の動きの場合、リスナーがセリフを失う可能性が最も低くなるように、プログラム制御プロセッサによる制御下でセンターチャネルミックスを左チャネルにシフトさせるようにミックスを自動的に操作することができる。いずれにせよ、プロセッサが音声ミックスを調整する時にはリスナーの聴力プロファイルが参照され、従って上記の例においてリスナー90がジョージであり右チャネルの情報を左チャネルにシフトさせる場合には、左耳と右耳の間の全体的な聞こえ方の差異に従って音量を下げ、同様に通常であれば右耳用の、左耳に送られる音声の周波数等化を、例えば高周波数内容を下げるように調整する。さらに別の実施形態では、様々なチャネルのミックスを操作してリスニング体験を高めることができる。例えば、ある人物の聴力が、左耳での発話理解度が劣っており右耳では良好な場合、プロファイル情報に基づいて、主に右耳にセリフをミキシングすることができる。ミックスは、数多くのチャネルからのミックスダウンを変更することにより、又はミックスを左と右の間で単純にシフトさせてステレオ分離を減少させる(近似又はモノラル化する)ことにより、或いは他のいずれかの望ましい方法により操作することができる。当業者には、本教示を検討した時に他の多くの変形例が浮かぶであろう。
また、ある人物が聴覚障害を有する場合、この聴覚障害を持つリスナーが良く聞こえる方の耳を音源に向けるように頭を回転させることは、多くの場合自動的に近い行動である。従って、このミキシング又はその他の音声特性の変更は、この人間の一般的反応を利用した改善に適合する。
ここで図4を参照すると、104から開始する1つの実装例のフローチャート100を示している。108において、音声システムは、システムがリスナープロファイルに関連する指向性音声のビーム放出を使用するように構成されているか否かを判定する。そのように構成されていない場合、112において、システムは、従来のスピーカを備えた従来に近い音声システムに戻ることができる。そのように構成されている場合、116において、リスニング範囲の1又はそれ以上の画像を撮影し、120において、画像解析プログラムを用いてこの画像を解析し、リスナー及びその位置を識別しようと試みる。この画像解析では、人々を識別した後に、プロファイルにリスナーの音声特性を記憶している人々を識別する目的で顔認識アルゴリズムを開始する。124において、認識されたリスナーについては、そのプロファイルがプロファイルデータベースから検索され、未認識のリスナーについては、デフォルトプロファイル又はゲストプロファイルが検索される。次に、128において、リスナーのプロファイル及びリスナーの位置に基づいて音声特性を調整する。ミックス及びその他の音声特性は、上述したようにリスナーの耳の位置に基づいて調整することができる。
音声プロファイルがロードされると、132において、リスニング範囲内の物理的位置に存在する認識されたリスナーに対して音声を指向的にビーム放出する。同様に、136において、未認識のリスナーは、そのリスニング範囲内の物理的位置において、デフォルトプロファイル又はゲストプロファイルを用いた指向性音声ビームを同時に受け取る。プロセスは、リスナーの物理的位置を追跡し続けるために、また上述したようにリスナーの頭の位置を利用する場合には、この頭の位置もモニタするために、140においてプロセスの反復を開始して108に戻ることにより連続的に更新される。このプロセス例100には明記していないが、リスニング範囲に新たなリスナーが入って来ていない場合にはブロック124をスキップすることができる。
プロセス100の機能128は、図5の128として示すプロセス例を含む様々な方法で実施することができる。このプロセス実装例では、150において(ステレオ、5.1サラウンド、7.1サラウンドなどの)マルチチャネル音声を受け取る。154において、各リスナーの左耳及び右耳の位置を特定する。158において、左耳と右耳がいずれも図3のように容易に標的となる(バランスがとれている)場合、162において、特定のリスナーのプロファイルに従う通常のチャネルミックスを提示し、リスナーの音声チャネルビームに割り当てる。しかしながら、一方の又は他方の耳へのビームが劣化するとシステムが判定するような位置にリスナーの頭が存在する場合、システムは、166において、どちらの耳が指向性音源に近いかを判定する。次に、170において音声をリミックスする。この例では、このリミックスにより、(センターチャネルなどの)セリフを含むチャネルの重み付けが、指向性音源に近い方の耳に大きく加えられる。他の実施形態では、依然として両耳が少なくとも部分的に音声ビームを受け取ることができる場合、システムが、指向性音源から遠い方の耳へのビーム放出に依拠して音声ビームを正しく受け取ることができないと見なすまで、指向性音源から遠い方の耳に対する音量を大きくして、連続的なステレオ体験を提供することができる。この場合、ミックスをモノラルに変換し、又はセリフチャネルを指向性音源に近い方の耳にシフトし、又はその他の適当なミキシング及び再等化を実施することができる。いずれにせよ、プロセスは、リスナー毎に162及び170の両方から174に戻ってプロセス128を完了する。当業者には、本教示を検討した時に他の多くの変形例が浮かぶであろう。
いくつかの実施形態によるシステム例を、図6のシステム200として示す。超音波トランスデューサ202などの指向性音声トランスデューサのアレイが全体的にリスニング範囲206に向けられ、トランスデューサドライバ及び方向制御装置210により駆動される。ブロック210は、リスナーに向かう指向性音声ビームを上述した形で生成するように超音波トランスデューサアレイ202を駆動する役割を果たす。非一時的記憶媒体に記憶された222として示すプログラム命令からのプログラム制御下で上述したような位置の識別及び顔認識のための画像処理を行うようにプログラムされたプログラム制御プロセッサ218の制御下でカメラ214を使用することにより、リスナーを位置特定して識別する。
取り込まれた画像を上述したように処理して、リスニング範囲206内の人々を識別し、位置を特定する。次に、222の顔認識アルゴリズムを実行して、検出された顔をプロファイルデータベース226内の顔と比較する。プロファイルデータベース226においてリスナーが識別されると、(1又は複数の)プログラム制御プロセッサ218は、このプロファイルデータを使用して音声プロセッサ230内でミキシング及び等化機能を実行し、リスナーのプロファイルに合わせてリスナーの聴力を補償すべく音源234からの音声が調整されるようにする。
このプロセスは、上述したように様々なリスナーの動きを識別して各リスナーへの適切な1又は複数の音声ビームを維持するように連続的に更新される。
音声ビームの方向付けは、あらゆる有効な形で行うことができる。例えば、図7に示すように、少なくとも水平回転を可能にするジンバル式装着構成に複数の超音波トランスデューサアレイを装着することができるが、超音波トランスデューサアレイ250がリスニング範囲206内の広範にわたる位置を標的にすることができるように、水平方向回転と垂直方向回転の両方の2次元運動を可能にすることが好ましい。このジンバル式装着は、ジンバル装着された超音波トランスデューサアレイ250を、サーボコントローラ254を用いて駆動することによって(単複の)リスナーが好適に標的となるように、サーボ制御アルゴリズムを実行するプログラム制御プロセッサ218の制御下で調整される。リスニング範囲206内で常に多くのリスナーを標的化できるように、このような複数の構成が設けられる。当業者であれば、本教示を検討した時に、指向性音声ビームでリスナーを標的にするために他の構成を提供することもできると理解するであろう。
従って、いくつかの実装によれば、音声送達方法が、画像取り込み装置を用いてリスニング範囲の画像を取り込むステップと、1又はそれ以上のプログラム制御プロセッサにおいて、この画像を処理してリスニング範囲内のリスナーの位置を特定するステップと、この画像を処理してリスニング範囲内のリスナーの顔を識別するステップと、この画像を処理してリスナーの耳の位置を特定するステップと、識別された顔に関連する記憶されているリスナープロファイルを検索するステップと、リスナープロファイルに基づいて1又はそれ以上の音声特性を調整するステップと、指向性音声ビームをリスナーの耳に向かうように制御するステップとを含む。画像取り込み装置を用いて、リスナーの後続する一連の画像を取り込み、1又はそれ以上のプログラム制御プロセッサにおいて、後続する一連の画像の解析により、リスニング範囲内のリスナーの耳の位置の動きをモニタし、リスニング範囲内のリスナーの動きに基づいて指向性音声ビームを調整する。
いくつかの実装では、指向性音声ビームが、複数のチャネルを含むマルチチャネル音声プログラムのミックスダウンを含む。いくつかの実装では、指向性音声ビームを調整するステップが、マルチチャネル音声プログラムのミキシングを変更するステップを含む。いくつかの実装では、マルチチャネル音声プログラムがセンターチャネルを含み、複数のチャネルのミキシングが、指向性音声ビームの音源に近い方の位置に動いたリスナーの耳に対するセンターチャネルプログラムの振幅を増加させることを含む。いくつかの実装では、指向性音声ビームが超音波音声ビームを含む。いくつかの実装では、画像取り込み装置が、テレビ受信機に組み込まれたカメラを含む。いくつかの実装では、画像取り込み装置が、電子ディスプレイ装置に組み込まれたカメラを含む。いくつかの実装では、制御するステップが、ジンバル装着された超音波トランスデューサアレイを位置付けるサーボモータを制御するステップを含む。
別の音声送達方法は、画像取り込み装置を用いてリスニング範囲の画像を取り込むステップを含む。次に、このプロセスは、1又はそれ以上のプログラム制御プロセッサにおいて、画像を処理してリスニング範囲内のリスナーの位置を特定し、画像を処理してリスニング範囲内のリスナーの顔を識別し、画像を処理してリスナーの左耳及び右耳の位置を特定し、識別された顔に関連する記憶されているリスナープロファイルを検索し、リスナープロファイルに基づいて1又はそれ以上の音声特性を調整し、左チャネル及び右チャネルの指向性音声ビームを、前記リスナーの左耳及び右耳にそれぞれ向かうように制御し、画像取り込み装置を用いて、リスナーの後続する一連の画像を取り込む。このプロセスは、1又はそれ以上のプログラム制御プロセッサにおいて、後続する一連の画像の解析により、リスニング範囲内のリスナーの耳の位置の動きをモニタするステップと、リスニング範囲内のリスナーの左耳及び右耳の動きに基づいて、左右の指向性音声ビームにより搬送される音声のミキシングを調整するステップとをさらに含む。
いくつかの実装では、左右の指向性音声ビームが、センターチャネルを含むマルチチャネル音声プログラムのステレオミックスダウンを含む。いくつかの実装では、音声のミキシングを調整するステップが、リスナーの右耳又は左耳のいずれか一方に対するセンターチャネルプログラムの振幅を、指向性音声ビームの音源に近い方の位置に動いたリスナーの右耳又は左耳の一方のためのセンターチャネルプログラムの振幅が増加するように増加させるステップを含む。いくつかの実装では、指向性音声ビームが超音波音声ビームを含む。いくつかの実装では、画像取り込み装置が、テレビ受信機に組み込まれたカメラを含む。いくつかの実装では、画像取り込み装置が、電子ディスプレイ装置に組み込まれたカメラを含む。いくつかの実装では、制御するステップが、ジンバル装着された超音波トランスデューサアレイを位置付けるサーボモータを制御するステップを含む。
音声送達システムの別の例は、リスニング範囲の画像を取り込むように構成された画像取り込み装置を有する。1又はそれ以上のプログラム制御プロセッサが、画像を処理してリスニング範囲内のリスナーの位置を特定し、画像を処理してリスニング範囲内のリスナーの顔を識別し、画像を処理してリスナーの耳の位置を特定し、識別された顔に関連する記憶されているリスナープロファイルを検索し、リスナープロファイルに基づいて1又はそれ以上の音声特性を調整し、指向性音声ビームをリスナーの耳に向かうように制御するようプログラムされる。画像取り込み装置は、リスナーの後続する一連の画像を取り込むようにさらに構成され、1又はそれ以上のプログラム制御プロセッサは、後続する一連の画像の解析により、リスニング範囲内のリスナーの耳の位置の動きをモニタし、リスニング範囲内のリスナーの動きに基づいて指向性音声ビームを調整するようにさらにプログラムされる。
いくつかの実装では、指向性音声ビームが、複数のチャネルを含むマルチチャネル音声プログラムのミックスダウンを含む。いくつかの実装では、指向性音声ビームを調整することが、マルチチャネル音声プログラムのミキシングを変更することを含む。いくつかの実装では、マルチチャネル音声プログラムがセンターチャネルを含み、複数のチャネルのミキシングが、指向性音声ビームの音源に近い方の位置に動いたリスナーの耳に対するセンターチャネルプログラムの振幅を増加させることを含む。いくつかの実装では、指向性音声ビームが超音波音声ビームを含む。いくつかの実装では、画像取り込み装置が、テレビ受信機に組み込まれたカメラを含む。いくつかの実装では、画像取り込み装置が、電子ディスプレイ装置に組み込まれたカメラを含む。いくつかの実装では、少なくとも1つのジンバル装着された超音波トランスデューサアレイがさらに設けられ、指向性音声ビームを制御すること及び調整することは、このジンバル装着された超音波トランスデューサアレイを位置付けるサーボモータを制御することを含む。
別の音声送達システムは、リスニング範囲の画像を取り込むように構成された画像取り込み装置を有する。1又はそれ以上のプログラム制御プロセッサが、画像を処理してリスニング範囲内のリスナーの位置を特定し、画像を処理してリスニング範囲内のリスナーの顔を識別し、画像を処理してリスナーの左耳及び右耳の位置を特定し、識別された顔に関連する記憶されているリスナープロファイルを検索し、リスナープロファイルに基づいて1又はそれ以上の音声特性を調整し、左チャネル及び右チャネルの指向性音声ビームをリスナーの左耳及び右耳にそれぞれ向かうように制御するようプログラムされる。画像取り込み装置は、リスナーの後続する一連の画像を取り込むようにさらに構成され、1又はそれ以上のプログラム制御プロセッサは、後続する一連の画像の解析により、リスニング範囲内のリスナーの耳の位置の動きをモニタし、リスニング範囲内のリスナーの左耳及び右耳の動きに基づいて、左右の指向性音声ビームにより搬送される音声のミキシングを調整するようにさらにプログラムされる。
いくつかの実装では、左右の指向性音声ビームが、センターチャネルを含むマルチチャネル音声プログラムのステレオミックスダウンを含む。いくつかの実装では、音声のミキシングを調整するステップが、リスナーの右耳又は左耳のいずれか一方に対するセンターチャネルプログラムの振幅を、指向性音声ビームの音源に近い方の位置に動いたリスナーの右耳又は左耳の一方のためのセンターチャネルプログラムの振幅が増加するように増加させるステップを含む。いくつかの実装では、指向性音声ビームが超音波音声ビームを含む。いくつかの実装では、画像取り込み装置が、テレビ受信機に組み込まれたカメラを含む。いくつかの実装では、画像取り込み装置が、電子ディスプレイ装置に組み込まれたカメラを含む。いくつかの実装では、少なくとも一対のジンバル装着された超音波トランスデューサアレイがさらに設けられ、指向性音声ビームを制御すること及び調整することは、ジンバル装着された超音波トランスデューサアレイを位置付けるサーボモータを制御することを含む。
いくつかの実装による音声送達方法は、プログラム制御プロセッサにおいて、プログラム制御プロセッサにおいて、記憶されているリスナープロファイルを検索して読み出し、リスナーに関連する音声特性設定を確認するステップと、音声ミキサにおいて、プログラム制御プロセッサが、記憶されているリスナープロファイルに基づいて、複数チャネル音声プログラムのチャネルのミキシングを等しい又は少ない数のチャネルに調整するステップとを含む。
いくつかの実装では、方法が、等しい又は少ない数のチャネルをリスナーに対して再生するステップをさらに含む。いくつかの実装では、プログラム制御プロセッサが、リスナーの位置に基づいてチャネルのミキシングをさらに調整する。
音声送達方法では、リスニング範囲の画像を取り込んで処理し、室内のリスナーの位置を特定する。リスナーに関連する記憶されているリスナープロファイルを検索し、このリスナープロファイルに基づいて音声特性を設定する。指向性音声ビームをリスナーの耳に向け、リスナーの動きを追跡するように調整する。
当業者であれば、上記の教示を検討した時に、上記の例示的な実施形態のいくつかは、1又はそれ以上のプログラム制御プロセッサの使用に基づくものであると認識するであろう。しかしながら、専用ハードウェア及び/又は専用プロセッサなどのハードウェアコンポーネントの同等物を用いて他の実施形態を実装することもできるので、本発明は、このような例示的な実施形態に限定されるものではない。同様に、汎用コンピュータ、マイクロプロセッサベースのコンピュータ、マイクロコントローラ、光コンピュータ、アナログコンピュータ、専用プロセッサ、特定用途向け回路及び/又は専用配線論理を用いて別の同等の実施形態を構築することもできる。
本明細書で説明したいくつかの例示的な実施形態は、いずれかの好適な非一時的電子媒体又はコンピュータ可読記憶媒体に記憶できる、フローチャートの形で大まかに上述したプログラム命令を実行するプロセッサ218などのプログラム制御プロセッサを用いて実装され、又は実装することができ、この場合、本明細書で使用する「非一時的」という用語は、搬送波を除外し、電力が除去されると情報を失うランダムアクセスメモリ又は書き換え可能メモリなどの装置ではないことのみを意図するものである。しかしながら、当業者であれば、本教示を検討した時に、本発明の実施形態から逸脱することなく、上述したプロセスをあらゆる数の変更形態で、及び多くの好適なプログラミング言語で実装することができると理解するであろう。例えば、多くの場合、本発明のいくつかの実施形態から逸脱することなく、実行するいくつかの動作の順序を変更し、さらなる動作を追加し、又は動作を削除することができる。本発明のいくつかの実施形態から逸脱することなく、エラートラッピング、タイムアウトなどを追加及び/又は強化し、ユーザインターフェイス及び情報提示に変更を行うこともできる。このような変形形態も企図され、同等物と見なされる。
いくつかの例示的な実施形態を説明したが、実際に当業者には、上述した説明に照らして多くの代替、修正、置換及び変形が明らかになるであろう。

Claims (33)

  1. 音声送達方法であって、
    画像取り込み装置を用いてリスニング範囲の画像を取り込むステップと、
    1又はそれ以上のプログラム制御プロセッサにおいて、
    前記画像を処理して前記リスニング範囲内のリスナーの位置を特定するステップと、
    前記画像を処理して前記リスニング範囲内の前記リスナーの顔を識別するステップと、
    前記画像を処理して前記リスナーの耳の位置を特定するステップと、
    前記識別された顔に関連する記憶されているリスナープロファイルを検索するステップと、
    前記リスナープロファイルに基づいて1又はそれ以上の音声特性を調整するステップと、
    指向性音声ビームを前記リスナーの耳に向かうように制御するステップと、
    前記画像取り込み装置を用いて、前記リスナーの後続する一連の画像を取り込むステップと、
    前記1又はそれ以上のプログラム制御プロセッサにおいて、
    前記後続する一連の画像の解析により、前記リスニング範囲内の前記リスナーの耳の位置の動きをモニタするステップと、
    前記リスニング範囲内の前記リスナーの動きに基づいて前記指向性音声ビームを調整するステップと、
    を含むことを特徴とする方法。
  2. 前記指向性音声ビームは、複数のチャネルを含むマルチチャネル音声プログラムのミックスダウンを含む、
    ことを特徴とする請求項1に記載の方法。
  3. 前記指向性音声ビームを調整するステップは、前記マルチチャネル音声プログラムのミキシングを変更するステップを含む、
    ことを特徴とする請求項2に記載の方法。
  4. 前記マルチチャネル音声プログラムはセンターチャネルを含み、前記複数のチャネルのミキシングは、前記指向性音声ビームの音源に近い方の位置に動いた前記リスナーの耳に対するセンターチャネルプログラムの振幅を増加させることを含む、
    ことを特徴とする請求項3に記載の方法。
  5. 前記指向性音声ビームは超音波音声ビームを含む、
    ことを特徴とする請求項1に記載の方法。
  6. 前記画像取り込み装置は、テレビ受信機に組み込まれたカメラを含む、
    ことを特徴とする請求項1に記載の方法。
  7. 前記画像取り込み装置は、電子ディスプレイ装置に組み込まれたカメラを含む、
    ことを特徴とする請求項1に記載の方法。
  8. 前記制御するステップは、ジンバル装着された超音波トランスデューサアレイを位置付けるサーボモータを制御するステップを含む、
    ことを特徴とする請求項1に記載の方法。
  9. 音声送達方法であって、
    画像取り込み装置を用いてリスニング範囲の画像を取り込むステップと、
    1又はそれ以上のプログラム制御プロセッサにおいて、
    前記画像を処理して前記リスニング範囲内のリスナーの位置を特定するステップと、
    前記画像を処理して前記リスニング範囲内の前記リスナーの顔を識別するステップと、
    前記画像を処理して前記リスナーの左耳及び右耳の位置を特定するステップと、
    前記識別された顔に関連する記憶されているリスナープロファイルを検索するステップと、
    前記リスナープロファイルに基づいて1又はそれ以上の音声特性を調整するステップと、
    左チャネル及び右チャネルの指向性音声ビームを前記リスナーの左耳及び右耳にそれぞれ向かうように制御するステップと、
    前記画像取り込み装置を用いて、前記リスナーの後続する一連の画像を取り込むステップと、
    前記1又はそれ以上のプログラム制御プロセッサにおいて、
    前記後続する一連の画像の解析により、前記リスニング範囲内の前記リスナーの耳の位置の動きをモニタするステップと、
    前記リスニング範囲内の前記リスナーの左耳及び右耳の動きに基づいて、前記左右の指向性音声ビームにより搬送される音声のミキシングを調整するステップと、
    を含むことを特徴とする方法。
  10. 前記左右の指向性音声ビームは、センターチャネルを含むマルチチャネル音声プログラムのステレオミックスダウンを含む、
    ことを特徴とする請求項9に記載の方法。
  11. 前記音声のミキシングを調整するステップは、前記リスナーの右耳又は左耳のいずれか一方に対する前記センターチャネルプログラムの振幅を、前記指向性音声ビームの音源に近い方の位置に動いた前記リスナーの右耳又は左耳の一方のための前記センターチャネルプログラムの振幅が増加するように増加させるステップを含む、
    ことを特徴とする請求項9に記載の方法。
  12. 前記指向性音声ビームは超音波音声ビームを含む、
    ことを特徴とする請求項9に記載の方法。
  13. 前記画像取り込み装置は、テレビ受信機に組み込まれたカメラを含む、
    ことを特徴とする請求項9に記載の方法。
  14. 前記画像取り込み装置は、電子ディスプレイ装置に組み込まれたカメラを含む、
    ことを特徴とする請求項9に記載の方法。
  15. 前記制御するステップは、ジンバル装着された超音波トランスデューサアレイを位置付けるサーボモータを制御するステップを含む、
    ことを特徴とする請求項9に記載の方法。
  16. 音声送達システムであって、
    リスニング範囲の画像を取り込むように構成された画像取り込み装置と、
    1又はそれ以上のプログラム制御プロセッサと、
    を備え、前記1又はそれ以上のプログラム制御プロセッサは、
    前記画像を処理して前記リスニング範囲内のリスナーの位置を特定し、
    前記画像を処理して前記リスニング範囲内の前記リスナーの顔を識別し、
    前記画像を処理して前記リスナーの耳の位置を特定し、
    前記識別された顔に関連する記憶されているリスナープロファイルを検索し、
    前記リスナープロファイルに基づいて1又はそれ以上の音声特性を調整し、
    指向性音声ビームを前記リスナーの耳に向かうように制御する、
    ようにプログラムされ、
    前記画像取り込み装置は、前記リスナーの後続する一連の画像を取り込むようにさらに構成され、
    前記1又はそれ以上のプログラム制御プロセッサは、
    前記後続する一連の画像の解析により、前記リスニング範囲内の前記リスナーの耳の位置の動きをモニタし、
    前記リスニング範囲内の前記リスナーの動きに基づいて前記指向性音声ビームを調整する、
    ようにさらにプログラムされる、
    ことを特徴とするシステム。
  17. 前記指向性音声ビームは、複数のチャネルを含むマルチチャネル音声プログラムのミックスダウンを含む、
    ことを特徴とする請求項16に記載のシステム。
  18. 前記指向性音声ビームを調整することは、前記マルチチャネル音声プログラムのミキシングを変更することを含む、
    ことを特徴とする請求項17に記載のシステム。
  19. 前記マルチチャネル音声プログラムはセンターチャネルを含み、前記複数のチャネルのミキシングは、前記指向性音声ビームの音源に近い方の位置に動いた前記リスナーの耳に対するセンターチャネルプログラムの振幅を増加させることを含む、
    ことを特徴とする請求項18に記載のシステム。
  20. 前記指向性音声ビームは超音波音声ビームを含む、
    ことを特徴とする請求項16に記載のシステム。
  21. 前記画像取り込み装置は、テレビ受信機に組み込まれたカメラを含む、
    ことを特徴とする請求項16に記載のシステム。
  22. 前記画像取り込み装置は、電子ディスプレイ装置に組み込まれたカメラを含む、
    ことを特徴とする請求項16に記載のシステム。
  23. 少なくとも1つのジンバル装着された超音波トランスデューサアレイをさらに備え、前記指向性音声ビームを制御すること及び調整することは、前記ジンバル装着された超音波トランスデューサアレイを位置付けるサーボモータを制御することを含む、
    ことを特徴とする請求項16に記載のシステム。
  24. 音声送達システムであって、
    リスニング範囲の画像を取り込むように構成された画像取り込み装置と、
    1又はそれ以上のプログラム制御プロセッサと、
    を備え、前記1又はそれ以上のプログラム制御プロセッサは、
    前記画像を処理して前記リスニング範囲内のリスナーの位置を特定し、
    前記画像を処理して前記リスニング範囲内の前記リスナーの顔を識別し、
    前記画像を処理して前記リスナーの左耳及び右耳の位置を特定し、
    前記識別された顔に関連する記憶されているリスナープロファイルを検索し、
    前記リスナープロファイルに基づいて1又はそれ以上の音声特性を調整し、
    左チャネル及び右チャネルの指向性音声ビームを前記リスナーの左耳及び右耳にそれぞれ向かうように制御する、
    ようにプログラムされ、
    前記画像取り込み装置は、前記リスナーの後続する一連の画像を取り込むようにさらに構成され、
    前記1又はそれ以上のプログラム制御プロセッサは、
    前記後続する一連の画像の解析により、前記リスニング範囲内の前記リスナーの耳の位置の動きをモニタし、
    前記リスニング範囲内の前記リスナーの左耳及び右耳の動きに基づいて、前記左右の指向性音声ビームにより搬送される音声のミキシングを調整する、
    ようにさらにプログラムされる、
    ことを特徴とするシステム。
  25. 前記左右の指向性音声ビームは、センターチャネルを含むマルチチャネル音声プログラムのステレオミックスダウンを含む、
    ことを特徴とする請求項24に記載のシステム。
  26. 前記音声のミキシングを調整することは、前記リスナーの右耳又は左耳のいずれか一方に対する前記センターチャネルプログラムの振幅を、前記指向性音声ビームの音源に近い方の位置に動いた前記リスナーの右耳又は左耳の一方のための前記センターチャネルプログラムの振幅が増加するように増加させることを含む、
    ことを特徴とする請求項25に記載のシステム。
  27. 前記指向性音声ビームは超音波音声ビームを含む、
    ことを特徴とする請求項24に記載のシステム。
  28. 前記画像取り込み装置は、テレビ受信機に組み込まれたカメラを含む、
    ことを特徴とする請求項24に記載のシステム。
  29. 前記画像取り込み装置は、電子ディスプレイ装置に組み込まれたカメラを含む、
    ことを特徴とする請求項24に記載のシステム。
  30. 少なくとも一対のジンバル装着された超音波トランスデューサアレイをさらに備え、前記指向性音声ビームを制御すること及び調整することは、前記ジンバル装着された超音波トランスデューサアレイを位置付けるサーボモータを制御することを含む、
    ことを特徴とする請求項24に記載のシステム。
  31. 音声送達方法であって、
    プログラム制御プロセッサにおいて、記憶されているリスナープロファイルを検索して読み出し、リスナーに関連する音声特性設定を確認するステップと、
    音声ミキサにおいて、前記プログラム制御プロセッサが、前記記憶されているリスナープロファイルに基づいて、複数チャネル音声プログラムのチャネルのミキシングを等しい又は少ない数のチャネルに調整するステップと、
    を含むことを特徴とする方法。
  32. 前記等しい又は少ない数のチャネルを前記リスナーに対して再生するステップを含む、
    ことを特徴とする請求項31に記載の方法。
  33. 前記プログラム制御プロセッサは、前記リスナーの位置に基づいて前記チャネルの前記ミキシングをさらに調整する、
    ことを特徴とする請求項32に記載の方法。
JP2014185803A 2013-09-13 2014-09-12 音声の到達性 Abandoned JP2015056905A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US14/026,154 US20150078595A1 (en) 2013-09-13 2013-09-13 Audio accessibility
US14/026,154 2013-09-13

Publications (1)

Publication Number Publication Date
JP2015056905A true JP2015056905A (ja) 2015-03-23

Family

ID=52668004

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014185803A Abandoned JP2015056905A (ja) 2013-09-13 2014-09-12 音声の到達性

Country Status (4)

Country Link
US (1) US20150078595A1 (ja)
JP (1) JP2015056905A (ja)
KR (1) KR20150031179A (ja)
CN (1) CN104469491A (ja)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017028679A (ja) * 2015-07-21 2017-02-02 ディズニー エンタープライゼス インコーポレイテッド パーソナライズされたオーディオを提供するためのシステムと方法
JP2017034479A (ja) * 2015-07-31 2017-02-09 キヤノン株式会社 制御装置、再生システム、補正方法、及び、コンピュータプログラム
JP2017118375A (ja) * 2015-12-25 2017-06-29 京セラ株式会社 電子機器及び音出力制御方法
WO2018008396A1 (ja) * 2016-07-05 2018-01-11 ソニー株式会社 音場形成装置および方法、並びにプログラム
JP6330098B1 (ja) * 2017-10-03 2018-05-23 ピクシーダストテクノロジーズ株式会社 オーディオコントローラ、プログラム、超音波スピーカ、音源装置
JP6329679B1 (ja) * 2017-10-03 2018-05-23 ピクシーダストテクノロジーズ株式会社 オーディオコントローラ、超音波スピーカ、オーディオシステム、及びプログラム
WO2019069743A1 (ja) * 2017-10-03 2019-04-11 ピクシーダストテクノロジーズ株式会社 オーディオコントローラ、超音波スピーカ、及び、オーディオシステム

Families Citing this family (38)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9560449B2 (en) 2014-01-17 2017-01-31 Sony Corporation Distributed wireless speaker system
US9866986B2 (en) 2014-01-24 2018-01-09 Sony Corporation Audio speaker system with virtual music performance
US9232335B2 (en) 2014-03-06 2016-01-05 Sony Corporation Networked speaker system with follow me
US9971319B2 (en) 2014-04-22 2018-05-15 At&T Intellectual Property I, Lp Providing audio and alternate audio simultaneously during a shared multimedia presentation
US9544679B2 (en) 2014-12-08 2017-01-10 Harman International Industries, Inc. Adjusting speakers using facial recognition
CN105827931B (zh) * 2015-06-19 2019-04-12 维沃移动通信有限公司 一种基于拍照的音频输出方法和装置
GB2540224A (en) * 2015-07-08 2017-01-11 Nokia Technologies Oy Multi-apparatus distributed media capture for playback control
CN105007553A (zh) * 2015-07-23 2015-10-28 惠州Tcl移动通信有限公司 一种移动终端的声音定向传输方法及移动终端
US10042602B2 (en) * 2015-09-30 2018-08-07 Sonos, Inc. Activity reset
KR20170039520A (ko) * 2015-10-01 2017-04-11 삼성전자주식회사 오디오 출력 장치 및 오디오 출력 장치의 제어 방법
IL243513B2 (en) 2016-01-07 2023-11-01 Noveto Systems Ltd A system and method for voice communication
US11388541B2 (en) 2016-01-07 2022-07-12 Noveto Systems Ltd. Audio communication system and method
US9898245B1 (en) 2016-01-15 2018-02-20 Sonos, Inc. System limits based on known triggers
CN105723326A (zh) * 2016-01-23 2016-06-29 张阳 剧院中音量控制方法及系统
US9693168B1 (en) 2016-02-08 2017-06-27 Sony Corporation Ultrasonic speaker assembly for audio spatial effect
US9826332B2 (en) 2016-02-09 2017-11-21 Sony Corporation Centralized wireless speaker system
US9924291B2 (en) 2016-02-16 2018-03-20 Sony Corporation Distributed wireless speaker system
US9826330B2 (en) 2016-03-14 2017-11-21 Sony Corporation Gimbal-mounted linear ultrasonic speaker assembly
US9693169B1 (en) 2016-03-16 2017-06-27 Sony Corporation Ultrasonic speaker assembly with ultrasonic room mapping
WO2017206193A1 (zh) * 2016-06-03 2017-12-07 华为技术有限公司 一种基于超声波的语音信号传输系统及方法
US9794724B1 (en) 2016-07-20 2017-10-17 Sony Corporation Ultrasonic speaker assembly using variable carrier frequency to establish third dimension sound locating
US9854362B1 (en) 2016-10-20 2017-12-26 Sony Corporation Networked speaker system with LED-based wireless communication and object detection
US10075791B2 (en) 2016-10-20 2018-09-11 Sony Corporation Networked speaker system with LED-based wireless communication and room mapping
US9924286B1 (en) 2016-10-20 2018-03-20 Sony Corporation Networked speaker system with LED-based wireless communication and personal identifier
US10952008B2 (en) * 2017-01-05 2021-03-16 Noveto Systems Ltd. Audio communication system and method
DE102017100628A1 (de) * 2017-01-13 2018-07-19 Visteon Global Technologies, Inc. System und Verfahren zum Bereitstellen einer personenbezogenen Audiowiedergabe
US11243293B2 (en) 2017-02-07 2022-02-08 Samsung Electronics Company, Ltd. Radar-based system for sensing touch and in-the-air interactions
US10397724B2 (en) 2017-03-27 2019-08-27 Samsung Electronics Co., Ltd. Modifying an apparent elevation of a sound source utilizing second-order filter sections
US10154346B2 (en) 2017-04-21 2018-12-11 DISH Technologies L.L.C. Dynamically adjust audio attributes based on individual speaking characteristics
US11601715B2 (en) 2017-07-06 2023-03-07 DISH Technologies L.L.C. System and method for dynamically adjusting content playback based on viewer emotions
US11048329B1 (en) * 2017-07-27 2021-06-29 Emerge Now Inc. Mid-air ultrasonic haptic interface for immersive computing environments
US10171877B1 (en) 2017-10-30 2019-01-01 Dish Network L.L.C. System and method for dynamically selecting supplemental content based on viewer emotions
CN108805086B (zh) * 2018-06-14 2021-09-14 联想(北京)有限公司 一种媒体控制方法及音频处理装置
US10623859B1 (en) 2018-10-23 2020-04-14 Sony Corporation Networked speaker system with combined power over Ethernet and audio delivery
US11443737B2 (en) 2020-01-14 2022-09-13 Sony Corporation Audio video translation into multiple languages for respective listeners
US11669295B2 (en) * 2020-06-18 2023-06-06 Sony Group Corporation Multiple output control based on user input
CN114915874B (zh) * 2021-02-10 2023-07-25 北京全景声信息科技有限公司 音频处理方法、装置、设备及介质
DE202022102864U1 (de) 2022-05-24 2023-09-05 Vierton-Audio AG Lautsprechereinheit mit Hörhilfefunktion

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6229899B1 (en) * 1996-07-17 2001-05-08 American Technology Corporation Method and device for developing a virtual speaker distant from the sound source
GB0415625D0 (en) * 2004-07-13 2004-08-18 1 Ltd Miniature surround-sound loudspeaker
ES2381765T3 (es) * 2006-03-31 2012-05-31 Koninklijke Philips Electronics N.V. Dispositivo y método para procesar datos
JP2011223549A (ja) * 2010-03-23 2011-11-04 Panasonic Corp 音声出力装置

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9736615B2 (en) 2015-07-21 2017-08-15 Disney Enterprises, Inc. Systems and methods for delivery of personalized audio
JP2017028679A (ja) * 2015-07-21 2017-02-02 ディズニー エンタープライゼス インコーポレイテッド パーソナライズされたオーディオを提供するためのシステムと方法
US10292002B2 (en) 2015-07-21 2019-05-14 Disney Enterprises, Inc. Systems and methods for delivery of personalized audio
JP2017034479A (ja) * 2015-07-31 2017-02-09 キヤノン株式会社 制御装置、再生システム、補正方法、及び、コンピュータプログラム
JP2017118375A (ja) * 2015-12-25 2017-06-29 京セラ株式会社 電子機器及び音出力制御方法
JPWO2018008396A1 (ja) * 2016-07-05 2019-04-18 ソニー株式会社 音場形成装置および方法、並びにプログラム
WO2018008396A1 (ja) * 2016-07-05 2018-01-11 ソニー株式会社 音場形成装置および方法、並びにプログラム
US10880638B2 (en) 2016-07-05 2020-12-29 Sony Corporation Sound field forming apparatus and method
JP6329679B1 (ja) * 2017-10-03 2018-05-23 ピクシーダストテクノロジーズ株式会社 オーディオコントローラ、超音波スピーカ、オーディオシステム、及びプログラム
JP2019068314A (ja) * 2017-10-03 2019-04-25 ピクシーダストテクノロジーズ株式会社 オーディオコントローラ、プログラム、超音波スピーカ、音源装置
JP2019068313A (ja) * 2017-10-03 2019-04-25 ピクシーダストテクノロジーズ株式会社 オーディオコントローラ、超音波スピーカ、オーディオシステム、及びプログラム
WO2019069743A1 (ja) * 2017-10-03 2019-04-11 ピクシーダストテクノロジーズ株式会社 オーディオコントローラ、超音波スピーカ、及び、オーディオシステム
JP6330098B1 (ja) * 2017-10-03 2018-05-23 ピクシーダストテクノロジーズ株式会社 オーディオコントローラ、プログラム、超音波スピーカ、音源装置

Also Published As

Publication number Publication date
CN104469491A (zh) 2015-03-25
KR20150031179A (ko) 2015-03-23
US20150078595A1 (en) 2015-03-19

Similar Documents

Publication Publication Date Title
JP2015056905A (ja) 音声の到達性
KR102111464B1 (ko) 향상된 오디오를 갖는 디바이스
EP3410740B1 (en) Spatially ducking audio produced through a beamforming loudspeaker array
US10264385B2 (en) System and method for dynamic control of audio playback based on the position of a listener
KR102035477B1 (ko) 카메라 선택에 기초한 오디오 처리
WO2013014886A1 (en) Control device, control method and program
US9930469B2 (en) System and method for enhancing virtual audio height perception
US9847767B2 (en) Electronic device capable of adjusting an equalizer according to physiological condition of hearing and adjustment method thereof
WO2021021857A1 (en) Acoustic echo cancellation control for distributed audio devices
KR20130139074A (ko) 오디오 신호 처리 방법 및 이를 적용한 오디오 신호 처리 장치
US12003673B2 (en) Acoustic echo cancellation control for distributed audio devices
CN115022716A (zh) 显示设备、声场调整方法、存储介质和程序产品

Legal Events

Date Code Title Description
A762 Written abandonment of application

Free format text: JAPANESE INTERMEDIATE CODE: A762

Effective date: 20150715

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20150727