JP7581359B2 - マルチメディアコンテンツを処理するための装置、コンピュータプログラム及び方法 - Google Patents
マルチメディアコンテンツを処理するための装置、コンピュータプログラム及び方法 Download PDFInfo
- Publication number
- JP7581359B2 JP7581359B2 JP2022548695A JP2022548695A JP7581359B2 JP 7581359 B2 JP7581359 B2 JP 7581359B2 JP 2022548695 A JP2022548695 A JP 2022548695A JP 2022548695 A JP2022548695 A JP 2022548695A JP 7581359 B2 JP7581359 B2 JP 7581359B2
- Authority
- JP
- Japan
- Prior art keywords
- sound source
- audio focus
- subject
- visual object
- focus attenuation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000004590 computer program Methods 0.000 title claims description 35
- 238000000034 method Methods 0.000 title description 22
- 238000012545 processing Methods 0.000 title description 9
- 230000000007 visual effect Effects 0.000 claims description 159
- 230000004044 response Effects 0.000 claims description 9
- 238000003860 storage Methods 0.000 claims description 8
- 238000001914 filtration Methods 0.000 claims description 4
- 230000002238 attenuated effect Effects 0.000 description 19
- 230000006870 function Effects 0.000 description 10
- 230000008859 change Effects 0.000 description 5
- 238000010801 machine learning Methods 0.000 description 5
- 230000001413 cellular effect Effects 0.000 description 4
- 230000000694 effects Effects 0.000 description 4
- 238000004891 communication Methods 0.000 description 3
- 238000001514 detection method Methods 0.000 description 3
- 230000007246 mechanism Effects 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 238000012544 monitoring process Methods 0.000 description 3
- 238000009877 rendering Methods 0.000 description 3
- 230000005236 sound signal Effects 0.000 description 3
- 230000036541 health Effects 0.000 description 2
- 230000002085 persistent effect Effects 0.000 description 2
- 125000002015 acyclic group Chemical group 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 230000002776 aggregation Effects 0.000 description 1
- 238000004220 aggregation Methods 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000003190 augmentative effect Effects 0.000 description 1
- 238000004040 coloring Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 230000007717 exclusion Effects 0.000 description 1
- 238000009432 framing Methods 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 238000012417 linear regression Methods 0.000 description 1
- 238000007477 logistic regression Methods 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000001404 mediated effect Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000004091 panning Methods 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 230000001902 propagating effect Effects 0.000 description 1
- 238000001454 recorded image Methods 0.000 description 1
- 230000008685 targeting Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N23/00—Cameras or camera modules comprising electronic image sensors; Control thereof
- H04N23/60—Control of cameras or camera modules
- H04N23/61—Control of cameras or camera modules based on recognised objects
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N23/00—Cameras or camera modules comprising electronic image sensors; Control thereof
- H04N23/60—Control of cameras or camera modules
- H04N23/61—Control of cameras or camera modules based on recognised objects
- H04N23/611—Control of cameras or camera modules based on recognised objects where the recognised objects include parts of the human body
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N23/00—Cameras or camera modules comprising electronic image sensors; Control thereof
- H04N23/60—Control of cameras or camera modules
- H04N23/63—Control of cameras or camera modules by using electronic viewfinders
- H04N23/631—Graphical user interfaces [GUI] specially adapted for controlling image capture or setting capture parameters
- H04N23/632—Graphical user interfaces [GUI] specially adapted for controlling image capture or setting capture parameters for displaying or modifying preview images prior to image capturing, e.g. variety of image resolutions or capturing parameters
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N23/00—Cameras or camera modules comprising electronic image sensors; Control thereof
- H04N23/60—Control of cameras or camera modules
- H04N23/64—Computer-aided capture of images, e.g. transfer from script file into camera, check of taken image quality, advice or proposal for image composition or decision on when to take image
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N23/00—Cameras or camera modules comprising electronic image sensors; Control thereof
- H04N23/60—Control of cameras or camera modules
- H04N23/69—Control of means for changing angle of the field of view, e.g. optical zoom objectives or electronic zooming
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N23/00—Cameras or camera modules comprising electronic image sensors; Control thereof
- H04N23/60—Control of cameras or camera modules
- H04N23/695—Control of camera direction for changing a field of view, e.g. pan, tilt or based on tracking of objects
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N5/00—Details of television systems
- H04N5/222—Studio circuitry; Studio devices; Studio equipment
- H04N5/262—Studio circuits, e.g. for mixing, switching-over, change of character of image, other special effects ; Cameras specially adapted for the electronic generation of special effects
- H04N5/2628—Alteration of picture size, shape, position or orientation, e.g. zooming, rotation, rolling, perspective, translation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R3/00—Circuits for transducers, loudspeakers or microphones
- H04R3/005—Circuits for transducers, loudspeakers or microphones for combining the signals of two or more microphones
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S7/00—Indicating arrangements; Control arrangements, e.g. balance control
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Human Computer Interaction (AREA)
- Circuit For Audible Band Transducer (AREA)
- Studio Devices (AREA)
- Studio Circuits (AREA)
- Stereophonic System (AREA)
Description
音源のオーディオフォーカス減衰を識別し、
オーディオフォーカス減衰を受ける音源と、対応する視覚的物体との間の対応を決定し、
オーディオフォーカス減衰を受ける音源に対応する視覚的物体を少なくとも部分的に除外および/または修正するようにイメージの取込みを修正する
ための手段を備える装置が提供される。
オーディオフォーカス減衰を受ける音源の位置を決定し、
オーディオフォーカス減衰を受ける音源の位置に関連付けられる視覚的物体を決定し、
決定した視覚的物体を除外するように、取り込まれたイメージを修正する
ための手段を備える。
候補音源がしきい値を超えるエネルギーまたはレベルを有することを判定し、
目標音源と候補音源との間の十分な相関の欠如を判定し、
候補音源がしきい値を超えるエネルギーまたはレベルを有し、目標音源との間の十分な相関が欠如している場合、候補音源の位置を取得する
ための手段を備える。
取り込まれたイメージ内の、オーディオフォーカス減衰を受ける音源に関連付けられる視覚的物体の数を最小限に抑えること、
取り込まれたイメージから除外される、オーディオフォーカス減衰を受ける音源に関連付けられる視覚的物体の数を最大にすること、
オーディオフォーカス減衰を受け、取り込まれたイメージ内の視覚的物体に関連付けられる音源の全エネルギーを最小限に抑えること、
オーディオフォーカス減衰を受け、取り込まれたイメージから除外される視覚的物体に関連付けられる音源の全エネルギーを最大にすること、
オーディオフォーカス減衰を受ける音源に関連付けられる視覚的物体の物体認識、
オーディオフォーカス減衰を受ける音源に関連付けられる視覚的物体の、装置に対する近接、および
オーディオフォーカス減衰を受ける音源に関連付けられる視覚的物体によって占められる、取り込まれたイメージの面積を最小限に抑えること
のうちの1つまたは複数に依存する。
音源のオーディオフォーカス減衰を識別することと、
オーディオフォーカス減衰を受ける音源と、対応する視覚的物体との間の対応を決定することと、
オーディオフォーカス減衰を受ける音源に対応する視覚的物体を少なくとも部分的に除外および/または修正するようにイメージの取込みを修正することと
を実施するコンピュータプログラムが提供される。
音源のオーディオフォーカス減衰を識別することと、
オーディオフォーカス減衰を受ける音源と、対応する視覚的物体との間の対応を決定することと、
オーディオフォーカス減衰を受ける音源に対応する視覚的物体を少なくとも部分的に除外および/または修正するようにイメージの取込みを修正することと
を含む方法が提供される。
音源のオーディオフォーカス減衰は、その音源に対する相対的減衰の適用である。音源のレベルが低下する。
ブロック102で、音源122のオーディオフォーカス減衰を識別することと、
ブロック104で、オーディオフォーカス減衰を受ける音源122と、対応する視覚的物体222との間の対応を決定することと、
ブロック106で、オーディオフォーカス減衰を受ける音源122に対応する視覚的物体222を少なくとも部分的に除外および/または修正するようにイメージの取込みを修正することと
を含む。
オーディオフォーカス方向、たとえばビームフォーミングステアリングベクトルd(θ,ω)を取得することと、
音源方向を取得することと、
たとえばオーディオフォーカス方向ではない方向に減衰される1つまたは複数の音源を決定することと
を含み得る。
オーディオフォーカス減衰を受ける音源12の位置を決定することと、
オーディオフォーカス減衰を受ける音源12の位置に関連付けられる視覚的物体22を決定することと、
決定した視覚的物体22を除外または修正するように、取り込まれたイメージを修正することと
を含み得る。
候補音源12がしきい値を超えるエネルギーまたはレベルを有すると判定することと、
目標音源123と候補音源12との間の十分な相関の欠如を判定することと、
候補音源12がしきい値を超えるエネルギーまたはレベルを有し、目標音源123との間の十分な相関が欠如している場合、候補音源12の位置を取得することと
を含み得る。
音源12のオーディオフォーカス減衰を識別し、
オーディオフォーカス減衰を受ける音源12と、対応する視覚的物体22との間の対応を決定し、
オーディオフォーカス減衰を受ける音源12に対応する視覚的物体22を少なくとも部分的に除外および/または修正するようにイメージの取込みを修正する
ように構成される。
少なくとも1つのプロセッサ82と、
コンピュータプログラムコードを含む少なくとも1つのメモリ84と、
少なくとも1つのプロセッサ82と共に、装置50に、
音源のオーディオフォーカス減衰を識別することと、
オーディオフォーカス減衰を受ける音源と、対応する視覚的物体との間の対応を決定することと、
オーディオフォーカス減衰を受ける音源に対応する視覚的物体を少なくとも部分的に除外および/または修正するようにイメージの取込みを修正することと
を少なくとも実施させるように構成された少なくとも1つのメモリ84およびコンピュータプログラムコードと
を備える。
音源のオーディオフォーカス減衰を識別することと、
オーディオフォーカス減衰を受ける音源と、対応する視覚的物体との間の対応を決定することと、
オーディオフォーカス減衰を受ける音源に対応する視覚的物体を少なくとも部分的に除外および/または修正するようにイメージの取込みを修正すること。
ブロック102で、複数の音源12のオーディオフォーカス減衰を識別することと、
ブロック104で、オーディオフォーカス減衰を受ける複数の音源12と、取り込まれるべきイメージ内に存在する、それぞれの複数の視覚的物体22との間の対応を決定することと、
ブロック106で、オーディオフォーカス減衰を受ける複数の音源12に対応するそれぞれの複数の視覚的物体22のうちの少なくとも一部を少なくとも部分的に除外および/または修正するようにイメージの取込みを修正することと
を含み得る。
取り込まれたイメージ内の、オーディオフォーカス減衰を受ける音源12に関連付けられる視覚的物体22の数を最小限に抑えること、
取り込まれたイメージから除外される、オーディオフォーカス減衰を受ける音源12に関連付けられる視覚的物体22の数を最大にすること、
オーディオフォーカス減衰を受け、取り込まれたイメージ内の視覚的物体22に関連付けられる音源12の全エネルギーを最小限に抑えること、
オーディオフォーカス減衰を受け、取り込まれたイメージから除外される視覚的物体22に関連付けられる音源12の全エネルギーを最大にすること、
オーディオフォーカス減衰を受ける音源12に関連付けられる視覚的物体22の物体認識、
オーディオフォーカス減衰を受ける音源12に関連付けられる視覚的物体22の、装置50に対する近接、
オーディオフォーカス減衰を受ける音源に関連付けられる視覚的物体22の移動または変化、
オーディオフォーカス減衰を受ける音源12に関連付けられる視覚的物体22によって占められる、取り込まれたイメージの面積を最小限に抑えること
のうちの1つまたは複数に依存する。
(a)ハードウェアのみの回路実装(アナログおよび/またはデジタルのみの回路実装など)、および
(b)以下のような(適用可能なとき)、ハードウェア回路とソフトウェアの組合せ
(i)アナログおよび/またはデジタルハードウェア回路とソフトウェア/ファームウェアの組合せ、および
(ii)携帯電話やサーバなどの装置に様々な機能を実施させるように共に働く、ソフトウェアを有するハードウェアプロセッサ(デジタル信号プロセッサを含む)、ソフトウェア、およびメモリの任意の部分、および
(c)動作のためにソフトウェア(たとえばファームウェア)を必要とするが、動作のためにソフトウェアが不要であるときにソフトウェアが存在しないことがある、ハードウェア回路、および/またはマイクロプロセッサやマイクロプロセッサの一部などのプロセッサ。
自動車システム、遠隔通信システム、消費者電子製品を含む電子システム、分散コンピューティングシステム、音声コンテンツ、視覚的コンテンツ、およびオーディオビジュアルコンテンツ、ならびに複合現実感、媒介現実感、仮想現実感、および/または拡張現実感を含むメディアコンテンツを生成またはレンダリングするためのメディアシステム、パーソナルヘルスシステムまたはパーソナルフィットネスシステムを含むパーソナルシステム、ナビゲーションシステム、ヒューマンマシンインターフェースとも呼ばれるユーザインターフェース、セルラ、非セルラ、および光ネットワークを含むネットワーク、アドホックネットワーク、インターネット、モノのインターネット、仮想化ネットワーク、ならびに関連するソフトウェアおよびサービス
の使用可能構成要素として応用される。
Claims (15)
- 装置であって、
少なくとも1つのプロセッサと、
コンピュータプログラムコードを含む少なくとも1つの非一時的メモリと、
前記少なくとも1つの非一時的メモリおよび前記コンピュータプログラムコードは、前記少なくとも1つのプロセッサと共に、前記装置に、
音源が第1のしきい値を超えるエネルギーまたはレベルを有することを判定することと、
ユーザ選択された音源である目標音源と前記音源との間に、第2のしきい値未満のエネルギーまたはレベルについての相関があることを判定することと、
前記音源のエネルギーまたはレベルが第1のしきい値を超えていること、および前記目標音源と前記音源との相関が第2のしきい値未満であることに応じて、前記音源のオーディオフォーカス減衰を識別することと、
オーディオフォーカス減衰を受ける前記音源と、対応する視覚的物体との間の対応を決定することと、
オーディオフォーカス減衰を受ける前記音源に対応する前記視覚的物体を少なくとも部分的に除外および/または修正するようにイメージの取込みを修正することと
を実行させるように構成された、装置。 - 前記少なくとも1つの非一時的メモリおよび前記コンピュータプログラムコードは、前記少なくとも1つのプロセッサと共に、前記装置に、
オーディオフォーカス減衰を受ける前記音源の位置を決定することと、
オーディオフォーカス減衰を受ける前記音源の前記位置と前記視覚的物体との関連付けに少なくとも部分的に基づいて、前記視覚的物体を決定することと、
決定した視覚的物体を除外するように、取り込まれたイメージを修正することと
を実行させるように構成された、請求項1に記載の装置。 - 前記音源が、複数の場所のうちのいずれか1つに配置される、請求項2に記載の装置。
- 前記音源が、空間オーディオを使用して配置される、請求項2に記載の装置。
- 前記目標音源がユーザ選択され、前記装置が、前記目標音源に関連付けられる目標視覚的物体の、ビューファインダディスプレイでの選択子を備える、請求項1に記載の装置。
- 前記少なくとも1つの非一時的メモリおよび前記コンピュータプログラムコードは、前記少なくとも1つのプロセッサと共に、前記装置に、物体認識を行わせる、請求項2に記載の装置。
- 前記少なくとも1つの非一時的メモリおよび前記コンピュータプログラムコードは、前記少なくとも1つのプロセッサと共に、前記装置に、
取り込まれたイメージを再フレーミングして、前記音源に対応する前記視覚的物体を除外することを行わせるように構成された、請求項1に記載の装置。 - 前記少なくとも1つの非一時的メモリおよび前記コンピュータプログラムコードは、前記少なくとも1つのプロセッサと共に、前記装置に、
前記イメージの取込みを修正することが、イメージセンサアレイで検出されたイメージに適用されるクロップを変更することを行わせるように構成され、適用されるクロップが、取り込まれる前記イメージを決定する、請求項1に記載の装置。 - 前記イメージの取込みを修正することが、前記イメージセンサアレイで検出された前記イメージに適用される前記クロップの位置を変更することを行わせるように構成される、請求項8に記載の装置。
- 前記少なくとも1つの非一時的メモリおよび前記コンピュータプログラムコードは、前記少なくとも1つのプロセッサと共に、前記装置に、
前記イメージセンサアレイで検出された前記イメージに適用される前記クロップのサイズを維持することを行わせるように構成される、請求項9に記載の装置。 - 前記少なくとも1つの非一時的メモリおよび前記コンピュータプログラムコードは、前記少なくとも1つのプロセッサと共に、前記装置に、
オーディオフォーカス減衰を受ける音源に関連付けられるすべての視覚的物体を除外することを行わせるように構成される、請求項1のいずれかに記載の装置。 - 前記少なくとも1つの非一時的メモリおよび前記コンピュータプログラムコードは、前記少なくとも1つのプロセッサと共に、前記装置に、
オーディオフォーカス減衰を受ける音源に関連付けられる、選択された視覚的物体を除外することを行わせるように構成され、前記視覚的物体の前記選択が、
取り込まれたイメージ内にある、オーディオフォーカス減衰を受ける音源に関連付けられる視覚的物体の数を最小限に抑えること、
取り込まれたイメージから除外される、オーディオフォーカス減衰を受ける音源に関連付けられる視覚的物体の数を最大にすること、
オーディオフォーカス減衰を受け、取り込まれたイメージ内の視覚的物体に関連付けられる音源の全エネルギーを最小限に抑えること、
オーディオフォーカス減衰を受け、取り込まれたイメージから除外される視覚的物体に関連付けられる音源の全エネルギーを最大にすること、
オーディオフォーカス減衰を受ける音源に関連付けられる視覚的物体の物体認識、
オーディオフォーカス減衰を受ける前記音源に関連付けられる視覚的物体の、前記装置に対する近接、または、
オーディオフォーカス減衰を受ける前記音源に関連付けられる前記視覚的物体で占められる、取り込まれたイメージの面積を最小限に抑えること
のうちの1つまたは複数に依存する、請求項1に記載の装置。 - 非一時的コンピュータ可読記憶媒体に記録されたコンピュータプログラムであって、
コンピュータで実行されるとき、
音源が第1のしきい値を超えるエネルギーまたはレベルを有すると判定することと、
ユーザ選択された音源である目標音源と前記音源との間に、第2のしきい値未満のエネルギーまたはレベルについての相関があることを判定することと、
前記音源のエネルギーまたはレベルが第1のしきい値を超えていること、および前記目標音源と前記音源との相関が第2のしきい値未満であることに応じて、前記音源のオーディオフォーカス減衰を識別することと、
オーディオフォーカス減衰を受ける前記音源と、対応する視覚的物体との間の対応を決定することと、
オーディオフォーカス減衰を受ける前記音源に対応する前記視覚的物体を少なくとも部分的に除外および/または修正するようにイメージの取込みを修正することと
を実施するように構成された、コンピュータプログラム。 - コンピュータで実行されるとき、
オーディオフォーカス減衰を受ける前記音源の位置を決定することと、
オーディオフォーカス減衰を受ける前記音源の位置と前記視覚的物体との関連付けに少なくとも部分的に基づいて、前記視覚的物体を決定することと、
決定した視覚的物体を除外するように、取り込まれたイメージを修正することと
を実施するように構成された、請求項13に記載のコンピュータプログラム。 - 音源が第1のしきい値を超えるエネルギーまたはレベルを有することを判定することと、
ユーザ選択された音源である目標音源と前記音源との間に、第2のしきい値未満のエネルギーまたはレベルについての相関があることを判定することと、
前記音源のエネルギーまたはレベルが第1のしきい値を超えていること、および前記目標音源と前記音源との相関が第2のしきい値未満であることに応じて、前記音源のオーディオフォーカス減衰を識別することと、
オーディオフォーカス減衰を受ける前記音源と、対応する視覚的物体との間の対応を決定することと、
オーディオフォーカス減衰を受ける前記音源に対応する前記視覚的物体を少なくとも部分的に除外および/または修正するようにイメージの取込みを修正することと
を含む方法。
Applications Claiming Priority (3)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| EP20157385.4A EP3866457A1 (en) | 2020-02-14 | 2020-02-14 | Multi-media content |
| EP20157385.4 | 2020-02-14 | ||
| PCT/EP2021/052382 WO2021160465A1 (en) | 2020-02-14 | 2021-02-02 | Multi-media content |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2023513318A JP2023513318A (ja) | 2023-03-30 |
| JP7581359B2 true JP7581359B2 (ja) | 2024-11-12 |
Family
ID=69593628
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2022548695A Active JP7581359B2 (ja) | 2020-02-14 | 2021-02-02 | マルチメディアコンテンツを処理するための装置、コンピュータプログラム及び方法 |
Country Status (5)
| Country | Link |
|---|---|
| US (1) | US11805312B2 (ja) |
| EP (1) | EP3866457A1 (ja) |
| JP (1) | JP7581359B2 (ja) |
| CN (1) | CN115136581B (ja) |
| WO (1) | WO2021160465A1 (ja) |
Families Citing this family (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| GB2611357A (en) * | 2021-10-04 | 2023-04-05 | Nokia Technologies Oy | Spatial audio filtering within spatial audio capture |
| US20220191583A1 (en) * | 2021-12-23 | 2022-06-16 | Stanley Baran | Methods and apparatus for enhancing a video and audio experience |
Citations (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US20150146078A1 (en) | 2013-11-27 | 2015-05-28 | Cisco Technology, Inc. | Shift camera focus based on speaker position |
| JP2017028633A (ja) | 2015-07-27 | 2017-02-02 | 株式会社リコー | 映像配信端末、プログラム、及び、映像配信方法 |
| JP2018536365A (ja) | 2015-09-29 | 2018-12-06 | トムソン ライセンシングThomson Licensing | プレノプティック・カメラによりキャプチャされた画像をリフォーカシングする方法及びオーディオに基づくリフォーカシング画像システム |
Family Cites Families (12)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| NO323434B1 (no) * | 2005-09-30 | 2007-04-30 | Squarehead System As | System og metode for a produsere et selektivt lydutgangssignal |
| US8130257B2 (en) * | 2008-06-27 | 2012-03-06 | Microsoft Corporation | Speaker and person backlighting for improved AEC and AGC |
| WO2012169284A1 (ja) * | 2011-06-08 | 2012-12-13 | オリンパスイメージング株式会社 | カメラシステム及びレンズ鏡筒 |
| CN104136299B (zh) * | 2011-12-29 | 2017-02-15 | 英特尔公司 | 用于在车内对声音进行导向的系统、方法以及装置 |
| CN105899965B (zh) * | 2014-08-29 | 2018-10-02 | 深圳市大疆创新科技有限公司 | 用于采集音频数据的无人飞行器 |
| CN107113499B (zh) * | 2014-12-30 | 2018-09-18 | 美商楼氏电子有限公司 | 定向音频捕获 |
| EP3343957B1 (en) * | 2016-12-30 | 2022-07-06 | Nokia Technologies Oy | Multimedia content |
| EP3343347A1 (en) * | 2016-12-30 | 2018-07-04 | Nokia Technologies Oy | Audio processing |
| FR3081662A1 (fr) * | 2018-06-28 | 2019-11-29 | Orange | Procede pour une restitution sonore spatialisee d'un champ sonore audible selectivement dans une sous-zone d'une zone |
| CN113747330A (zh) * | 2018-10-15 | 2021-12-03 | 奥康科技有限公司 | 助听器系统和方法 |
| US20210350823A1 (en) * | 2020-05-11 | 2021-11-11 | Orcam Technologies Ltd. | Systems and methods for processing audio and video using a voice print |
| US20220172736A1 (en) * | 2020-11-30 | 2022-06-02 | Orcam Technologies Ltd. | Systems and methods for selectively modifying an audio signal based on context |
-
2020
- 2020-02-14 EP EP20157385.4A patent/EP3866457A1/en active Pending
-
2021
- 2021-02-02 JP JP2022548695A patent/JP7581359B2/ja active Active
- 2021-02-02 CN CN202180014562.XA patent/CN115136581B/zh active Active
- 2021-02-02 WO PCT/EP2021/052382 patent/WO2021160465A1/en not_active Ceased
- 2021-02-02 US US17/799,310 patent/US11805312B2/en active Active
Patent Citations (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US20150146078A1 (en) | 2013-11-27 | 2015-05-28 | Cisco Technology, Inc. | Shift camera focus based on speaker position |
| JP2017028633A (ja) | 2015-07-27 | 2017-02-02 | 株式会社リコー | 映像配信端末、プログラム、及び、映像配信方法 |
| JP2018536365A (ja) | 2015-09-29 | 2018-12-06 | トムソン ライセンシングThomson Licensing | プレノプティック・カメラによりキャプチャされた画像をリフォーカシングする方法及びオーディオに基づくリフォーカシング画像システム |
Also Published As
| Publication number | Publication date |
|---|---|
| US20230074589A1 (en) | 2023-03-09 |
| EP3866457A1 (en) | 2021-08-18 |
| JP2023513318A (ja) | 2023-03-30 |
| WO2021160465A1 (en) | 2021-08-19 |
| CN115136581A (zh) | 2022-09-30 |
| CN115136581B (zh) | 2025-03-14 |
| US11805312B2 (en) | 2023-10-31 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| CA2940156C (en) | Image steered microphone array | |
| US10887719B2 (en) | Apparatus and associated methods for presentation of spatial audio | |
| US11395088B2 (en) | Audio processing to modify a spatial extent of a sound object | |
| US12231866B2 (en) | Apparatus and associated methods for capture of spatial audio | |
| US20170188140A1 (en) | Controlling audio beam forming with video stream data | |
| JP2020520576A5 (ja) | ||
| US20170193704A1 (en) | Causing provision of virtual reality content | |
| JP7581359B2 (ja) | マルチメディアコンテンツを処理するための装置、コンピュータプログラム及び方法 | |
| US20190318510A1 (en) | Multimedia content | |
| US12079945B2 (en) | XR preferred movement along planes | |
| US12309557B2 (en) | Selective sound modification for video communication | |
| US12067321B2 (en) | Apparatus, a method and a computer program for rotating displayed visual information | |
| US11868520B2 (en) | Rendering content | |
| US12526566B2 (en) | Generating microphone arrays from user devices | |
| EP3968643A1 (en) | Alignment control information for aligning audio and video playback | |
| CN119313554A (zh) | 图像拼接方法、装置及听力电子设备 | |
| CN117032492A (zh) | 触控识别方法、触控标定方法及相关装置、设备 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220810 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230831 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20231130 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20240304 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20240603 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20240930 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20241030 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 7581359 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |