JP2024508899A

JP2024508899A - オーディオ信号に方向性を適用する電子装置及びその方法

Info

Publication number: JP2024508899A
Application number: JP2023553375A
Authority: JP
Inventors: ビョンジュン・キム; ジュンス・イ; ジェヒュン・キム; サンジュ・イ
Original assignee: Samsung Electronics Co Ltd
Current assignee: Samsung Electronics Co Ltd
Priority date: 2021-03-02
Filing date: 2022-03-02
Publication date: 2024-02-28
Also published as: KR20220123986A; CN116888979A; WO2022186599A1; US20230413002A1; BR112023017335A2; EP4280624A1; AU2022229172A1

Abstract

本文書に開示されている様々な実施例に係る電子装置は、近距離無線通信を支援する通信モジュール、動画イメージを撮影するカメラモジュール、前記撮影する動画イメージを表示するディスプレイ、及び前記通信モジュール、カメラモジュール及びディスプレイと作動的に（ｏｐｅｒａｔｉｖｅｌｙ）連結されるプロセッサを含み、前記プロセッサは、前記通信モジュールを用いて外部電子装置と連結を確立し、前記動画イメージ撮影と同時に前記外部電子装置からオーディオ信号を受信し、前記撮影される動画イメージに含まれる少なくとも一つの客体のうちターゲットとなるターゲット客体を確認し、前記ターゲット客体が前記ディスプレイ上に表示される位置に関する第１位置情報を確認し、前記第１位置情報に基づいて前記ターゲット客体の実際位置を推定して、実際位置に関する第２位置情報を生成し、前記生成された第２位置情報に基づいて前記オーディオ信号を処理するように設定されてよい。その他、様々な実施例も可能である。

Description

本文書に開示されている様々な実施例は、電子装置が取得したオーディオ信号に方向性を適用する方法に関する。

ステレオオーディオは、複数の音声出力構成を用いて２つ以上の独立したオーディオチャネルを用いる音響提供方法である。同一のオーディオデータにステレオオーディオの情報を含むことができ、それぞれの独立したオーディオチャネルを用いて、複数の音声出力構成にしてそれぞれ異なるオーディオを出力させることにより、聴取者に現場感を提供することができる。

バイノーラル（ｂｉｎａｕｒａｌ）オーディオは、複数の音声出力構成を用いてバイノーラル効果（双耳効果）を提供する音響提供方法である。バイノーラル効果とは、人の両耳で聞く音響の強度差、時間差、及び／又は位相差などのような差を用いて聴取者に遠近感、実際感、方向感、空間感、音場（ａｃｏｕｓｔｉｃｆｉｅｌｄ）感を提供する効果を意味する。

動画撮影と共に撮影された画像に対応する現場感あるオーディオ信号の録音が必要な場合があり得る。電子装置を用いて動画を撮影する場合に、録音される背景オーディオ信号に対して現場感、方向感などを付与することが必要であり得る。特に、動画撮影の際に無線マイクロホンなどの外部電子装置を用いてオーディオ信号を収集する場合に、単一の外部電子装置を利用する場合が殆どである。このような単一外部電子装置で客体の音を受音して動画を撮影する場合に、客体の音の方向性に関する情報がないため、撮影時に客体が撮影された画面を基準にして左側や右側又はどの方向にあるかに関係なく、録音された客体のオーディオ信号は、固定した方向から音が聞こえてくるかのような効果を出し得る。この時、オーディオ信号はモノ（ｍｏｎｏ）で録音でき、モノで録音されたオーディオ信号は単調であるか、現場感、空間感を提供し難いことがある。モノ信号として録音された音声を用いて、現場感、空間感などを提供できる方法が望まれることがある。

本文書に開示されている様々な実施例に係る電子装置は、近距離無線通信を支援する通信モジュール、動画イメージを撮影するカメラモジュール、前記撮影する動画イメージを表示するディスプレイ、及び前記通信モジュール、カメラモジュール及びディスプレイと作動的に（ｏｐｅｒａｔｉｖｅｌｙ）連結されるプロセッサを含み、前記プロセッサは、前記通信モジュールを用いて外部電子装置と連結を確立し、前記動画イメージ撮影と同時に前記外部電子装置からオーディオ信号を受信し、前記撮影される動画イメージに含まれる少なくとも一つの客体のうちターゲットとなるターゲット客体を確認し、前記ターゲット客体が前記ディスプレイ上に表示される位置に関する第１位置情報を確認し、前記第１位置情報に基づいて前記ターゲット客体の実際位置を推定して、実際位置に関する第２位置情報を生成し、前記生成された第２位置情報に基づいて前記オーディオ信号を処理するように設定されてよい。

本文書に開示されている様々な実施例に係る電子装置がオーディオ信号を処理する方法であって、外部電子装置と連結を確立する動作、動画イメージ撮影と同時に前記外部電子装置からオーディオ信号を受信する動作、前記撮影される動画イメージに含まれる少なくとも一つの客体のうちターゲットとなるターゲット客体を確認する動作、前記ターゲット客体が前記電子装置のディスプレイ上に表示される位置に関する第１位置情報を確認する動作、前記第１位置情報に基づいて前記ターゲット客体の実際位置を推定して、実際位置に関する第２位置情報を生成する動作、及び前記生成された第２位置情報に基づいて前記オーディオ信号を処理する動作を含んでよい。

様々な実施例によれば、撮影された動画に対応する、現場感と空間感を有するオーディオ信号を生成することができる。ユーザに動画のイメージと符合する空間感ある音響を提供することによってユーザ経験を向上させることができる。

その他、本文書から直接又は間接に把握される様々な効果が提供されてよい。

図面の説明と関連して、同一又は類似の構成要素には同一又は類似の参照符号が使用されてよい。

様々な実施例に係る、ネットワーク環境内の電子装置のブロック図である。様々な実施例に係る電子装置が動画を撮影する例示図である。様々な実施例に係る電子装置のブロック図である。様々な実施例に係る電子装置がオーディオ信号に方向性を適用する動作フローチャートである。様々な実施例に係る電子装置がターゲット客体を確認する例示図である。様々な実施例に係る電子装置がターゲット客体を確認する例示図である。様々な実施例に係る電子装置がターゲット客体を確認する例示図である。様々な実施例に係る付加情報を説明するための例示図である。様々な実施例に係るステレオ音響を説明するための例示図である。様々な実施例に係る空間感が与えられたオーディオ信号を説明するための例示図である。様々な実施例に係る空間感が与えられたオーディオ信号を説明するための例示図である。

図１は、様々な実施例に係る、ネットワーク環境１００内の電子装置１０１のブロック図である。図１を参照すると、ネットワーク環境１００において、電子装置１０１は、第１ネットワーク１９８（例えば、近距離無線通信ネットワーク）を通じて電子装置１０２と通信したり、又は第２ネットワーク１９９（例えば、遠距離無線通信ネットワーク）を通じて電子装置１０４又はサーバー１０８のうち少なくとも一つと通信することができる。一実施例によれば、電子装置１０１はサーバー１０８を介して電子装置１０４と通信することができる。一実施例によれば、電子装置１０１は、プロセッサ１２０、メモリ１３０、入力モジュール１５０、音響出力モジュール１５５、ディスプレイモジュール１６０、オーディオモジュール１７０、センサーモジュール１７６、インターフェース１７７、連結端子１７８、ハプティックモジュール１７９、カメラモジュール１８０、電力管理モジュール１８８、バッテリー１８９、通信モジュール１９０、加入者識別モジュール１９６、又はアンテナモジュール１９７を含んでよい。ある実施例では、電子装置１０１には、これらの構成要素のうち少なくとも一つ（例えば、連結端子１７８）が省略されてもよく、一つ以上の他の構成要素が追加されてもよい。ある実施例では、これらの構成要素のうち一部（例えば、センサーモジュール１７６、カメラモジュール１８０、又はアンテナモジュール１９７）が一つの構成要素（例えば、ディスプレイモジュール１６０）に統合されてよい。

プロセッサ１２０は、例えば、ソフトウェア（例えば、プログラム１４０）を実行し、プロセッサ１２０に連結された電子装置１０１の少なくとも一つの他の構成要素（例えば、ハードウェア又はソフトウェア構成要素）を制御でき、様々なデータ処理又は演算を行うことができる。一実施例によれば、データ処理又は演算の少なくとも一部として、プロセッサ１２０は、他の構成要素（例えば、センサーモジュール１７６又は通信モジュール１９０）から受信した命令又はデータを揮発性メモリ１３２に保存し、揮発性メモリ１３２に保存された命令又はデータを処理し、結果データを不揮発性メモリ１３４に保存することができる。一実施例によれば、プロセッサ１２０は、メインプロセッサ１２１（例えば、中央処理装置又はアプリケーションプロセッサ）又はこれとは独立に又は共に運営可能な補助プロセッサ１２３（例えば、グラフィック処理装置、神経網処理装置（ＮＰＵ：ｎｅｕｒａｌｐｒｏｃｅｓｓｉｎｇｕｎｉｔ）、イメージシグナルプロセッサ、センサーハブプロセッサ、又はコミュニケーションプロセッサ）を含んでよい。例えば、電子装置１０１がメインプロセッサ１２１及び補助プロセッサ１２３を含む場合に、補助プロセッサ１２３はメインプロセッサ１２１に比べて低電力を使用するか、指定された機能に特化するように設定されてよい。補助プロセッサ１２３は、メインプロセッサ１２１と別個に、又はその一部として具現されてよい。

補助プロセッサ１２３は、例えば、メインプロセッサ１２１がインアクティブ（例えば、スリープ）状態にある間にメインプロセッサ１２１に代えて、又はメインプロセッサ１２１がアクティブ（例えば、アプリケーション実行）状態にある間にメインプロセッサ１２１と一緒に、電子装置１０１の構成要素のうち少なくとも一つの構成要素（例えば、ディスプレイモジュール１６０、センサーモジュール１７６、又は通信モジュール１９０）に関連した機能又は状態の少なくとも一部を制御できる。一実施例によれば、補助プロセッサ１２３（例えば、イメージシグナルプロセッサ又はコミュニケーションプロセッサ）は、機能的に関連がある他の構成要素（例えば、カメラモジュール１８０又は通信モジュール１９０）の一部として具現されてよい。一実施例によれば、補助プロセッサ１２３（例えば、神経網処理装置）は、人工知能モデルの処理に特化したハードウェア構造を含んでよい。人工知能モデルは機械学習によって生成されてよい。このような学習は、例えば、人工知能モデルが実行される電子装置１０１自体で行われてよく、別個のサーバー（例えば、サーバー１０８）を介して行われてもよい。学習アルゴリズムは、例えば、教師あり学習（ｓｕｐｅｒｖｉｓｅｄｌｅａｒｎｉｎｇ）、教師なし学習（ｕｎｓｕｐｅｒｖｉｓｅｄｌｅａｒｎｉｎｇ）、半教師あり学習（ｓｅｍｉ－ｓｕｐｅｒｖｉｓｅｄｌｅａｒｎｉｎｇ）又は強化学習（ｒｅｉｎｆｏｒｃｅｍｅｎｔｌｅａｒｎｉｎｇ）を含んでよいが、前述した例に限定されない。人工知能モデルは、複数の人工神経網レイヤを含んでよい。人工神経網は、深層神経網（ＤＮＮ：ｄｅｅｐｎｅｕｒａｌｎｅｔｗｏｒｋ）、ＣＮＮ（ｃｏｎｖｏｌｕｔｉｏｎａｌｎｅｕｒａｌｎｅｔｗｏｒｋ）、ＲＮＮ（ｒｅｃｕｒｒｅｎｔｎｅｕｒａｌｎｅｔｗｏｒｋ）、ＲＢＭ（ｒｅｓｔｒｉｃｔｅｄｂｏｌｔｚｍａｎｎｍａｃｈｉｎｅ）、ＤＢＮ（ｄｅｅｐｂｅｌｉｅｆｎｅｔｗｏｒｋ）、ＢＲＤＮＮ（ｂｉｄｉｒｅｃｔｉｏｎａｌｒｅｃｕｒｒｅｎｔｄｅｅｐｎｅｕｒａｌｎｅｔｗｏｒｋ）、深層Ｑ－ネットワーク（ｄｅｅｐＱ－ｎｅｔｗｏｒｋｓ）又はこれらのうち２つ以上の組合せのいずれかであってよいが、前述した例に限定されない。人工知能モデルは、ハードウェア構造に、追加として又は代替として、ソフトウェア構造を含んでよい。

メモリ１３０は、電子装置１０１の少なくとも一つの構成要素（例えば、プロセッサ１２０又はセンサーモジュール１７６）によって用いられる様々なデータを保存することができる。データは、例えば、ソフトウェア（例えば、プログラム１４０）、及びこれと関連した命令に対する入力データ又は出力データを含んでよい。メモリ１３０は、揮発性メモリ１３２又は不揮発性メモリ１３４を含んでよい。

プログラム１４０は、メモリ１３０にソフトウェアとして保存されてよく、例えば、運営体制１４２、ミドルウェア１４４又はアプリケーション１４６を含んでよい。

入力モジュール１５０は、電子装置１０１の構成要素（例えば、プロセッサ１２０）に用いられる命令又はデータを、電子装置１０１の外部（例えば、ユーザ）から受信することができる。入力モジュール１５０は、例えば、マイク、マウス、キーボード、キー（例えば、ボタン）、又はデジタルペン（例えば、スタイラスペン）を含んでよい。

音響出力モジュール１５５は、音響信号を電子装置１０１の外部に出力することができる。音響出力モジュール１５５は、例えば、スピーカー又はレシーバーを含んでよい。スピーカーは、マルチメディア再生又は録音再生のように一般用途に用いられてよい。レシーバーは、着信電話を受信するために用いられてよい。一実施例によれば、レシーバーは、スピーカーと別個に、又はその一部として具現されてよい。

ディスプレイモジュール１６０は、電子装置１０１の外部（例えば、ユーザ）に情報を視覚的に提供することができる。ディスプレイモジュール１６０は、例えば、ディスプレイ、ホログラム装置、又はプロジェクター及び当該装置を制御するための制御回路を含んでよい。一実施例によれば、ディスプレイモジュール１６０は、タッチを感知するように設定されたタッチセンサー、又は前記タッチによって発生する力の強度を測定するように設定された圧力センサーを含んでよい。

オーディオモジュール１７０は、音を電気信号に変換させたり、逆に電気信号を音に変換させることができる。一実施例によれば、オーディオモジュール１７０は、入力モジュール１５０から音を取得したり、音響出力モジュール１５５、又は電子装置１０１と直接に又は無線で連結された外部電子装置（例えば、電子装置１０２）（例えば、スピーカー又はヘッドホン）から音を出力することができる。

センサーモジュール１７６は、電子装置１０１の作動状態（例えば、電力又は温度）、又は外部の環境状態（例えば、ユーザ状態）を感知し、感知された状態に対応する電気信号又はデータ値を生成することができる。一実施例によれば、センサーモジュール１７６は、例えば、ジェスチャーセンサー、ジャイロセンサー、気圧センサー、マグネチックセンサー、加速度センサー、グリップセンサー、近接センサー、カラーセンサー、ＩＲ（ｉｎｆｒａｒｅｄ）センサー、生体センサー、温度センサー、湿度センサー、又は照度センサーを含んでよい。

インターフェース１７７は、電子装置１０１が外部電子装置（例えば、電子装置１０２）と直接に又は無線で連結されるために利用可能な一つ以上の指定されたプロトコルを支援することができる。一実施例によれば、インターフェース１７７は、例えば、ＨＤＭＩ(登録商標)（ｈｉｇｈｄｅｆｉｎｉｔｉｏｎｍｕｌｔｉｍｅｄｉａｉｎｔｅｒｆａｃｅ）、ＵＳＢ（ｕｎｉｖｅｒｓａｌｓｅｒｉａｌｂｕｓ）インターフェース、ＳＤカードインターフェース、又はオーディオインターフェースを含んでよい。

連結端子１７８は、それを介して電子装置１０１が外部電子装置（例えば、電子装置１０２）と物理的に連結され得るコネクターを含んでよい。一実施例によれば、連結端子１７８は、例えば、ＨＤＭＩ(登録商標)コネクター、ＵＳＢコネクター、ＳＤカードコネクター、又はオーディオコネクター（例えば、ヘッドホンコネクター）を含んでよい。

ハプティックモジュール１７９は、電気的信号を、ユーザが触覚又は運動感覚で認知できる機械的な刺激（例えば、振動又は動き）又は電気的な刺激に変換させることができる。一実施例によれば、ハプティックモジュール１７９は、例えば、モーター、圧電素子、又は電気刺激装置を含んでよい。

カメラモジュール１８０は、静止画及び動画を撮影することができる。一実施例によれば、カメラモジュール１８０は、一つ以上のレンズ、イメージセンサー、イメージシグナルプロセッサ、又はフラッシュを含んでよい。

電力管理モジュール１８８は、電子装置１０１に供給される電力を管理することができる。一実施例によれば、電力管理モジュール１８８は、例えば、ＰＭＩＣ（ｐｏｗｅｒｍａｎａｇｅｍｅｎｔｉｎｔｅｇｒａｔｅｄｃｉｒｃｕｉｔ）の少なくとも一部として具現されてよい。

バッテリー１８９は、電子装置１０１の少なくとも一つの構成要素に電力を供給することができる。一実施例によれば、バッテリー１８９は、例えば、再充電不可１次電池、再充電可能２次電池又は燃料電池を含んでよい。

通信モジュール１９０は、電子装置１０１と外部電子装置（例えば、電子装置１０２、電子装置１０４、又はサーバー１０８）間の直接（例えば、有線）通信チャネル又は無線通信チャネルの確立、及び確立された通信チャネルを通じた通信実行を支援できる。通信モジュール１９０は、プロセッサ１２０（例えば、アプリケーションプロセッサ）と独立して運営され、直接（例えば、有線）通信又は無線通信を支援する一つ以上のコミュニケーションプロセッサを含んでよい。一実施例によれば、通信モジュール１９０は、無線通信モジュール１９２（例えば、セルラー通信モジュール、近距離無線通信モジュール、又はＧＮＳＳ（ｇｌｏｂａｌｎａｖｉｇａｔｉｏｎｓａｔｅｌｌｉｔｅｓｙｓｔｅｍ）通信モジュール）又は有線通信モジュール１９４（例えば、ＬＡＮ（ｌｏｃａｌａｒｅａｎｅｔｗｏｒｋ）通信モジュール、又は電力線通信モジュール）を含んでよい。それらの通信モジュールのうち、該当する通信モジュールは、第１ネットワーク１９８（例えば、ブルートゥース(登録商標)、ＷｉＦｉ（ｗｉｒｅｌｅｓｓｆｉｄｅｌｉｔｙ）ｄｉｒｅｃｔ又はＩｒＤＡ（ｉｎｆｒａｒｅｄｄａｔａａｓｓｏｃｉａｔｉｏｎ）のような近距離通信ネットワーク）又は第２ネットワーク１９９（例えば、レガシーセルラーネットワーク、５Ｇネットワーク、次世代通信ネットワーク、インターネット、又はコンピューターネットワーク（例えば、ＬＡＮ又はＷＡＮ）のような遠距離通信ネットワーク）を通じて外部の電子装置１０４と通信することができる。これらの種々の通信モジュールは、一つの構成要素（例えば、単一チップ）として統合されたり、又はそれぞれ別個の複数の構成要素（例えば、複数チップ）として具現されてよい。無線通信モジュール１９２は、加入者識別モジュール１９６に保存された加入者情報（例えば、国際モバイル加入者識別子（ＩＭＳＩ））を用いて第１ネットワーク１９８又は第２ネットワーク１９９のような通信ネットワーク内で電子装置１０１を確認又は認証することができる。

無線通信モジュール１９２は、４Ｇネットワーク以後の５Ｇネットワーク及び次世代通信技術、例えば、ＮＲ接続技術（ｎｅｗｒａｄｉｏａｃｃｅｓｓｔｅｃｈｎｏｌｏｇｙ）を支援できる。ＮＲ接続技術は、高容量データの高速伝送（ｅＭＢＢ（ｅｎｈａｎｃｅｄｍｏｂｉｌｅｂｒｏａｄｂａｎｄ））、端末電力最小化と多数端末の接続（ｍＭＴＣ（ｍａｓｓｉｖｅｍａｃｈｉｎｅｔｙｐｅｃｏｍｍｕｎｉｃａｔｉｏｎｓ））、又は高信頼度及び低遅延（ＵＲＬＬＣ（ｕｌｔｒａ－ｒｅｌｉａｂｌｅａｎｄｌｏｗ－ｌａｔｅｎｃｙｃｏｍｍｕｎｉｃａｔｉｏｎｓ））を支援できる。無線通信モジュール１９２は、例えば、高いデータ伝送率の達成のために、高周波帯域（例えば、ｍｍＷａｖｅ帯域）を支援できる。無線通信モジュール１９２は、高周波帯域での性能確保のための様々な技術、例えば、ビームフォーミング（ｂｅａｍｆｏｒｍｉｎｇ）、巨大配列多重入出力（ｍａｓｓｉｖｅＭＩＭＯ（ｍｕｌｔｉｐｌｅ－ｉｎｐｕｔａｎｄｍｕｌｔｉｐｌｅ－ｏｕｔｐｕｔ））、全次元多重入出力（ＦＤ－ＭＩＭＯ：ｆｕｌｌｄｉｍｅｎｓｉｏｎａｌＭＩＭＯ）、アレイアンテナ（ａｒｒａｙａｎｔｅｎｎａ）、アナログビーム形成（ａｎａｌｏｇｂｅａｍ－ｆｏｒｍｉｎｇ）、又は大規模アンテナ（ｌａｒｇｅｓｃａｌｅａｎｔｅｎｎａ）のような技術を支援できる。無線通信モジュール１９２は、電子装置１０１、外部電子装置（例えば、電子装置１０４）又はネットワークシステム（例えば、第２ネットワーク１９９）に規定される様々な要求事項を支援することができる。一実施例によれば、無線通信モジュール１９２は、ｅＭＢＢ実現のためのＰｅａｋｄａｔａｒａｔｅ（例えば、２０Ｇｂｐｓ以上）、ｍＭＴＣ実現のための損失Ｃｏｖｅｒａｇｅ（例えば、１６４ｄＢ以下）、又はＵＲＬＬＣ実現のためのＵ－ｐｌａｎｅｌａｔｅｎｃｙ（例えば、下りリンク（ＤＬ）及び上りリンク（ＵＬ）はそれぞれ０．５ｍｓ以下、又はラウンドトリップ１ｍｓ以下）を支援できる。

アンテナモジュール１９７は、信号又は電力を外部（例えば、外部の電子装置）に送信したり又は外部から受信することができる。一実施例によれば、アンテナモジュール１９７は、サブストレート（例えば、ＰＣＢ）上に形成された導電体又は導電性パターンからなる放射体を含むアンテナを含んでよい。一実施例によれば、アンテナモジュール１９７は、複数のアンテナ（例えば、アレイアンテナ）を含んでよい。この場合、第１ネットワーク１９８又は第２ネットワーク１９９のような通信ネットワークで用いられる通信方式に適する少なくとも一つのアンテナが、例えば、通信モジュール１９０によって前記複数のアンテナから選択されてよい。信号又は電力は、前記選択された少なくとも一つのアンテナを通じて通信モジュール１９０と外部の電子装置間に送信又は受信されてよい。ある実施例によれば、放射体に加え、他の部品（例えば、ＲＦＩＣ（ｒａｄｉｏｆｒｅｑｕｅｎｃｙｉｎｔｅｇｒａｔｅｄｃｉｒｃｕｉｔ））がさらにアンテナモジュール１９７の一部として形成されてよい。

様々な実施例によれば、アンテナモジュール１９７は、ｍｍＷａｖｅアンテナモジュールを形成できる。一実施例によれば、ｍｍＷａｖｅアンテナモジュールは、印刷回路基板、前記印刷回路基板の第１面（例えば、下面）に又はそれに隣接して配置され、指定された高周波帯域（例えば、ｍｍＷａｖｅ帯域）を支援可能なＲＦＩＣ、及び前記印刷回路基板の第２面（例えば、上面又は側面）に又はそれに隣接して配置され、前記指定された高周波帯域の信号を送信又は受信できる複数のアンテナ（例えば、アレイアンテナ）を含んでよい。

前記構成要素のうち少なくとも一部は、周辺機器間の通信方式（例えば、バス、ＧＰＩＯ（ｇｅｎｅｒａｌｐｕｒｐｏｓｅｉｎｐｕｔａｎｄｏｕｔｐｕｔ）、ＳＰＩ（ｓｅｒｉａｌｐｅｒｉｐｈｅｒａｌｉｎｔｅｒｆａｃｅ）、又はＭＩＰＩ（ｍｏｂｉｌｅｉｎｄｕｓｔｒｙｐｒｏｃｅｓｓｏｒｉｎｔｅｒｆａｃｅ））によって互いに連結され、信号（例えば、命令又はデータ）を相互間に交換できる。

一実施例によれば、命令又はデータは、第２ネットワーク１９９に連結されたサーバー１０８を介して電子装置１０１と外部の電子装置１０４間に送信又は受信されてよい。外部の電子装置（１０２又は１０４）のそれぞれは、電子装置１０１と同一の又は異なる種類の装置であってよい。一実施例によれば、電子装置１０１で実行される動作の全部又は一部は、外部の電子装置（１０２、１０４又は１０８）のうち一つ以上の外部の電子装置で実行されてよい。例えば、電子装置１０１は、ある機能やサービスを自動で、又はユーザ又は他の装置からの要請に反応して行わなければならない場合に、機能又はサービスを独自で実行させる代わりに又はそれに加えて、一つ以上の外部の電子装置にその機能又はそのサービスの少なくとも一部を実行するように要請できる。前記要請を受信した一つ以上の外部の電子装置は、要請された機能又はサービスの少なくとも一部、又は前記要請と関連した追加機能又はサービスを実行し、その実行の結果を電子装置１０１に伝達できる。電子装置１０１は前記結果を、そのまま又はさらに処理して、前記要請に対する応答の少なくとも一部として提供できる。そのために、例えば、クラウドコンピューティング、分散コンピューティング、モバイルエッジコンピューティング（ＭＥＣ：ｍｏｂｉｌｅｅｄｇｅｃｏｍｐｕｔｉｎｇ）、又はクライアント－サーバーコンピューティング技術が用いられてよい。電子装置１０１は、例えば、分散コンピューティング又はモバイルエッジコンピューティングを用いて超低遅延サービスを提供できる。他の実施例において、外部の電子装置１０４は、ＩｏＴ（ｉｎｔｅｒｎｅｔｏｆｔｈｉｎｇｓ）機器を含んでよい。サーバー１０８は、機械学習及び／又は神経網を用いた知能型サーバーであってよい。一実施例によれば、外部の電子装置１０４又はサーバー１０８は、第２ネットワーク１９９内に含まれてよい。電子装置１０１は、５Ｇ通信技術及びＩｏＴ関連技術に基づいて知能型サービス（例えば、スマートホーム、スマートシティ、スマートカー、又はヘルスケア）に適用されてよい。

図２は、様々な実施例に係る電子装置２００が動画を撮影する例示図である。

図２を参照すると、電子装置２００（例えば、図１の電子装置１０１）は、様々な被写体（例えば、外部電子装置２２０及び／又は人物２３０）の画像を撮影できる。様々な実施例によれば、電子装置２００は、電子装置２００に含まれたカメラ（例えば、図３のカメラモジュール３２０）を用いて少なくとも一つの被写体（例えば、外部電子装置２２０及び／又は人物２３０）を撮影できる。被写体になり得るものは、人物２３０、装置（例えば、外部電子装置２２０）のように様々な人物又は物体であってよく、被写体になり得る客体に制限はないが、本文書では便宜上、少なくとも一つの人物及び／又は少なくとも一つの外部電子装置を被写体とする場合を中心に説明する。

様々な実施例によれば、電子装置２００は、被写体（例えば、人物２３０及び／又は外部電子装置２２０）を撮影し、撮影した被写体のイメージを生成できる。様々な実施例によれば、電子装置２００は、撮影したイメージをディスプレイ２１０上に表示できる。一実施例によれば、電子装置２００の撮影したイメージは、動画イメージであってよい。様々な実施例によれば、電子装置２００は、撮影中の動画イメージをディスプレイ２１０に表示できる。

様々な実施例によれば、電子装置２００は、外部電子装置２２０と連結を構成することができる。様々な実施例によれば、電子装置２００は、外部電子装置２２０と通信的に（ｃｏｍｍｕｎｉｃａｔｉｖｅｌｙ）連結を確立することができる。様々な実施例によれば、電子装置２００は、外部電子装置２２０と有線（例えば、直接通信）及び／又は無線通信ネットワーク（例えば、図１の第１ネットワーク１９８）を用いて連結を確立できる。一実施例によれば、電子装置２００は外部電子装置２２０と近距離無線通信（例えば、ブルートゥース(登録商標)）を用いて連結されてよい。様々な実施例によれば、電子装置２００は、通信連結確立及び／又は機能実行に必要なデータを外部電子装置２２０に送信したり、又は外部電子装置２２０から受信することができる。

様々な実施例によれば、電子装置２００はオーディオ信号を取得できる。様々な実施例によれば、電子装置２００は、動画を撮影する場合に、画像の背景音に該当するオーディオ信号を取得できる。電子装置２００は、電子装置２００に含まれたマイクロホン（例えば、図１の入力モジュール１５０）から外部音声が入力され、オーディオ信号を生成することができる。一実施例によれば、電子装置２００は、連結された外部電子装置２２０からオーディオ信号を受信することができる。例えば、外部電子装置２２０は、収集した音声を用いてオーディオ信号を生成でき、生成したオーディオ信号を電子装置２００に送信できる。電子装置２００は、外部電子装置２２０からオーディオ信号を受信できる。一実施例によれば、電子装置２００は、画像を撮影すると同時に、外部電子装置２２０から画像に対応する音声のオーディオ信号を受信することができる。図２を参照すると、電子装置２００が表示した動画イメージは、少なくとも一つの客体を含んでよい。動画イメージに含まれた少なくとも一つの客体は、例えば、人物２３０が撮影されたイメージ客体である第１客体２１１及び／又は外部電子装置２２０が撮影されたイメージ客体である第２客体２２１を含んでよい。様々な実施例によれば、電子装置２００は、撮影された動画イメージ又は撮影中の動画イメージを分析し、動画イメージに含まれた少なくとも一つのイメージ客体（例えば、第１客体２１１及び／又は第２客体２２１）を識別することができる。一実施例によれば、電子装置２００は、メモリ（例えば、図３のメモリ３４０）に既に保存されたアルゴリズムを用いてイメージを分析でき、イメージ分析により、動画イメージに含まれた客体（例えば、第１客体２１１及び／又は第２客体２２１）を識別できる。一実施例によれば、電子装置２００は、ディスプレイ２１０上に表示されたイメージを分析し、イメージに含まれた客体（例えば、第１客体２１１及び／又は第２客体２２１）を識別できる。様々な実施例によれば、電子装置２００は、識別した各客体（例えば、第１客体２１１及び／又は第２客体２２１）がディスプレイ２１０上に表示される位置に関する情報（例えば、座標）（例えば、第１位置情報）を確認することができる。様々な実施例によれば、電子装置２００は、識別した各客体（例えば、第１客体２１１及び／又は第２客体２２１）のディスプレイ２１０上に表示される座標（例えば、第１位置情報）を持続的に確認することができる。電子装置２００は、撮影中にディスプレイ２１０上で実時間で移動する客体（例えば、第１客体２１１及び／又は第２客体２２１）の座標（例えば、第１位置情報）を確認することができる。様々な実施例によれば、電子装置２００は、撮影した動画イメージを分析し、ターゲットとなる客体（例えば、ターゲット客体）を確認することができる。ターゲット客体は、例えば、電子装置２００が実際に位置を推定しようとする客体を意味できる。様々な実施例によれば、電子装置２００は、イメージ分析を用いてターゲット客体を確認することができる。一実施例によれば、電子装置２００は、動画イメージを分析して顔面認識を行うことができ、顔面認識実行結果に基づいて人物客体（例えば、第１客体２１１）を識別できる。一実施例によれば、電子装置２００は、識別された人物客体（例えば、第１客体２１１）をターゲット客体として識別できる。一実施例によれば、電子装置２００は、識別された外部電子装置２２０に対応する客体（例えば、第２客体２２１）をターゲット客体として識別できる。一実施例によれば、電子装置２００は、撮影されたイメージを分析して視覚的信号（例えば、点滅中のＬＥＤ信号）を識別し、外部電子装置２２０に対応する客体（例えば、第２客体２２１）をターゲット客体として確認できる。様々な実施例によれば、電子装置２００は、ターゲット客体を確認するための条件をメモリ（例えば、図３のメモリ３４０）にあらかじめ保存することができる。一実施例によれば、電子装置２００は、ディスプレイ２１０上のユーザ（図示せず）のタッチ入力を受信でき、受信したタッチ入力に基づいてターゲット客体を確認することができる。例えば、認識された少なくとも一つの客体のうち、タッチ入力の位置に対応する客体をターゲット客体として認識できる。一実施例によれば、電子装置２００は、センサー（例えば、図１のセンサーモジュール１７６）を用いてセンサー情報を生成し、センサー情報に基づいて外部電子装置２２０又は人物２３０を認識し、認識結果に基づいてターゲット客体を確認することができる。一実施例によれば、電子装置２００は、外部電子装置２２０との通信を用いて外部電子装置２２０の位置に関する情報を受信し、受信した位置情報を保存することができる。様々な実施例によれば、電子装置２００は、撮影された動画イメージ分析、受信したタッチ入力分析、センサー情報、及び受信した位置情報のうち少なくとも一つに基づいてターゲット客体を識別し確認することができる。

様々な実施例によれば、電子装置２００は、ターゲット客体がディスプレイ２１０上に表示される位置（例えば、第１位置情報）を確認することができる。一実施例によれば、電子装置２００は、ディスプレイ２１０上に存在する全ての客体（例えば、第１客体２１１及び第２客体２２１）のディスプレイ２１０上の位置（例えば、第１位置情報）を確認することができる。一実施例によれば、電子装置２００は、ディスプレイ２１０上に表示された少なくとも一つのイメージ客体（例えば、第１客体２１１及び／又は第２客体２２１）のうち、ターゲット客体（例えば、第１客体２１１又は第２客体２２１）のディスプレイ２１０上に表示される位置（例えば、第１位置情報）を確認することができる。第１位置情報は、ターゲット客体がディスプレイ２１０上に表示される位置に関する情報であってよい。一実施例によれば、第１位置情報は、ディスプレイ２１０上の一定の座標で表現される情報であってよい。一実施例によれば、第１位置情報は、電子装置２００の動画撮影中に実時間で変更される情報であってよい。一実施例によれば、電子装置２００は、動画撮影中に第１位置情報を持続的に及び／又は即時に確認することができる。

様々な実施例によれば、電子装置２００は、付加情報を確認することがてきる。付加情報は、電子装置２００がターゲット客体に対応する被写体（例えば、外部電子装置２２０又は人物２３０）の実際位置に関する情報（例えば、第２位置情報）を推定するために第１位置情報の他に用いられる情報であってよい。付加情報は、電子装置２００に含まれたカメラ（例えば、図３のカメラモジュール３２０）に設定された情報を含んでよい。様々な実施例によれば、付加情報は、撮影中である電子装置２００の画角（ｆｉｅｌｄｏｆｖｉｅｗ，ＦＯＶ）及び／又は倍率のように、カメラ（例えば、カメラモジュール３２０）の状態及び／又は設定に関する情報を含んでよい。一実施例によれば、カメラ（例えば、図３のカメラモジュール３２０）は、距離を測定できる深度カメラ（ｄｅｐｔｈｃａｍｅｒａ）を含んでよく、電子装置２００及びターゲット客体の距離を測定できる。一実施例によれば、付加情報は、電子装置２００とターゲット客体間の距離情報を含んでよい。一実施例によれば、付加情報は、ターゲット客体の大きさを含んでよい。一実施例によれば、電子装置２００は、ターゲット客体のイメージに対応するディスプレイの領域範囲を確認し、ターゲット客体の大きさ（例えば、長さ及び／又は面積）を確認することができる。

様々な実施例によれば、電子装置２００は、被写体（例えば、人物２３０及び／又は外部電子装置２２０）の位置を推定できる。一実施例によれば、電子装置２００は、撮影した動画イメージに含まれた全ての客体（例えば、第１客体２１１及び第２客体２２１）に対応する被写体（例えば、人物２３０及び外部電子装置２２０）の実際位置を推定できる。一実施例によれば、電子装置２００は、ターゲット客体に対応する被写体（例えば、人物２３０又は外部電子装置２２０）の実際位置のみを推定できる。一実施例によれば、電子装置２００は、ターゲット客体に対応する被写体の実際位置を推定し、推定した位置に関する第２位置情報を生成できる。様々な実施例によれば、電子装置２００は、第１位置情報に基づいて第２位置情報を生成できる。一実施例によれば、電子装置２００は、撮影されたイメージ客体（例えば、ターゲット客体）のディスプレイ２１０上の位置（例えば、第１位置情報）を確認し、ディスプレイ２１０上の位置に基づいて実際位置（例えば、第２位置情報）を推定できる。様々な実施例によれば、電子装置２００は、付加情報に基づいて第２位置情報を推定できる。一実施例によれば、電子装置２００は、ターゲット客体の第１位置情報及び付加情報を用いて、被写体（例えば、人物２３０又は外部電子装置２２０）の実際位置を推定できる。一実施例によれば、電子装置２００が推定する実際位置は、電子装置２００を基準にする被写体（例えば、人物２３０又は外部電子装置２２０）の相対的な位置を意味できる。一実施例によれば、電子装置２００は、具備したセンサーで生成したセンサー情報に基づいて、第２位置情報を生成できる。例えば、電子装置２００は、赤外線センサーのような距離測定センサーを用いてターゲット客体との距離を確認し、確認した距離に基づいて第２位置情報を生成できる。一実施例によれば、電子装置２００は、外部電子装置２２０から外部電子装置２２０の位置情報を受信でき、受信した位置情報に基づいて第２位置情報を生成できる。一実施例によれば、第２位置情報は、左右偏向した位置のみを表現する１次元的位置情報であってよく、又は、電子装置２００を基準に前後（例えば、距離）を含んでよく、又は、上下に偏向した位置を表現する３次元的位置情報であってよい。様々な実施例によれば、第２位置情報は、被写体の前後位置、左右位置、及び上下位置のうち少なくとも一つ又はその組合せ（例えば、１次元的位置、２次元的位置、又は３次元的位置）を含んでよい。

様々な実施例によれば、電子装置２００は、第２位置情報に基づいてオーディオ信号を処理することができる。オーディオ信号の処理は、取得したオーディオ信号に方向感を付与する動作であってよい。オーディオ信号の処理は、例えば、オーディオ信号の変更、及び／又は変換を含んでよい。一実施例によれば、電子装置２００は、取得したオーディオ信号をパンニング（ｐａｎｎｉｎｇ）してステレオオーディオ信号に変換させることができる。一実施例によれば、電子装置２００は、取得したオーディオ信号をレンダリング（ｒｅｎｄｅｒｉｎｇ）して、空間感、位置感及び／又は方向感を提供する３次元音響（例えば、バイノーラル音響）に変換させることができる。一実施例によれば、電子装置２００は、取得したオーディオ信号の音量を調節して距離感を提供するようにオーディオ信号を処理できる。様々な実施例によれば、電子装置２００は、一つのオーディオ信号を処理して、聴取者基準で左耳で聞く信号（左側オーディオ）及び右耳で聞く信号（右側オーディオ）をそれぞれ生成できる。一実施例によれば、電子装置２００は、左側オーディオ及び右側オーディオにそれぞれ音響の強度差、時間差及び位相差のうち少なくとも一つを生成してオーディオ信号を処理することができる。

図２を参照すると、外部電子装置２２０は、電子装置２００と通信的に連結を確立できる。一実施例によれば、外部電子装置２２０は電子装置２００にオーディオ信号を送信できる。一実施例によれば、外部電子装置２２０は音声を受信し、受信した音声を用いてオーディオ信号を生成できる。一実施例によれば、外部電子装置２２０はセンサーを備え、センサー情報を生成し、生成したセンサー情報を電子装置２００に送信できる。一実施例によれば、外部電子装置２２０は、位置を知らせる信号（例えば、ＵＷＢ（ｕｌｔｒａｗｉｄｅｂａｎｄ）信号）を電子装置２００に送信できる。一実施例によれば、外部電子装置２２０は、外部電子装置２２０の位置を確認して位置情報を生成し、生成された位置情報を電子装置２００に送信できる。

図３は、様々な実施例に係る電子装置のブロック図である。

図３を参照すると、電子装置３００（例えば、図１の電子装置１０１及び／又は図２の電子装置２００）は、通信モジュール３１０、カメラモジュール３２０、ディスプレイ３３０、メモリ３４０及びプロセッサ３５０を含んでよい。電子装置３００は、図１の電子装置１０１の構成及び／又は機能のうち少なくとも一部を含んでよい。

様々な実施例によれば、通信モジュール３１０は、有線及び／又は無線ネットワーク通信（例えば、図１の第１ネットワーク１９８又は第２ネットワーク１９９）を用いて外部電子装置（例えば、図２の外部電子装置２２０）と通信することができる。通信モジュール３１０によって支援される遠距離通信に制限はなく、様々な通信方式（例えば、ブルートゥース(登録商標)、ＵＷＢ）を支援できる。様々な実施例によれば、通信モジュール３１０は、近距離無線通信（例えば、ブルートゥース(登録商標)（Ｂｌｕｅｔｏｏｔｈ）、ＢＬＥ（Ｂｌｕｅｔｏｏｔｈｌｏｗｅｎｅｒｇｙ）、ＷｉＦｉ（ｗｉｒｅｌｅｓｓｆｉｄｅｌｉｔｙ）ｄｉｒｅｃｔ、及び／又はＵＷＢ（ｕｌｔｒａｗｉｄｅｂａｎｄ））を支援でき、近距離無線通信を用いて外部電子装置２２０に情報を送信できる。様々な実施例によれば、通信モジュール３１０は、外部電子装置２２０と単方向性又は両方向性の通信を行うことができる。単方向性通信は、例えば、他の電子装置に情報を送信することに限定されてよく、情報の送信は、単に、一定信号を外部に出力することからなってもよい。

様々な実施例によれば、様々な実施例によれば、カメラモジュール３２０は、電子装置３００の外部環境のイメージ及び／又は画像を撮影できる。カメラモジュール３２０は、図１のカメラモジュール１８０の構成及び／又は機能の少なくとも一部を含んでよい。様々な実施例によれば、カメラモジュール３２０は、外部から入射した光を電気的信号に変換させてイメージ情報を生成できる。様々な実施例によれば、カメラモジュール３２０は電子装置３００の外部環境を撮影し、周辺環境を撮影した動画イメージを生成することができる。一実施例によれば、カメラモジュール３２０は、被写体（例えば、図２の人物２３０及び／又は外部電子装置２２０）を撮影し、撮影した被写体のデジタルイメージを生成できる。一実施例によれば、カメラモジュール３２０は、距離を測定できる深度カメラ（ｄｅｐｔｈｃａｍｅｒａ）を含んでよい。

様々な実施例によれば、ディスプレイ３３０は、電子装置３００の外部に情報を表示できる。ディスプレイ３３０は、図１のディスプレイモジュール１６０の構成及び／又は機能のうち少なくとも一部を含んでよい。様々な実施例によれば、ディスプレイ３３０は、ディスプレイパネルを含み、プロセッサ３５０から受信した情報を視覚的に表示できる。様々な実施例によれば、ディスプレイ３３０は、入力モジュール３３１を含んでよい。一実施例によれば、ディスプレイ３３０は、タッチセンサー及び／又は圧力センサーを含み、ユーザのタッチ入力を受信することができる。

様々な実施例によれば、メモリ３４０は、デジタルデータを一時的又は永久的に保存するためのものであり、図１のメモリ１３０の構成及び／又は機能のうち少なくとも一部を含んでよい。また、メモリ３４０は、図１のプログラム１４０のうち少なくとも一部を保存することができる。メモリ３４０は、プロセッサ３５０によって実行可能な様々なインストラクション（ｉｎｓｔｒｕｃｔｉｏｎ）を保存することができる。このようなインストラクションはプロセッサ３５０によって認識され実行され得る論理演算、データ入出力などの制御命令を含んでよい。メモリ３４０が保存できるデータの種類及び／又は量に限定はないが、本文書では、様々な実施例に係るオーディオ信号を処理する方法及びその方法を行うプロセッサ３５０の動作と関連したメモリの構成及び機能についてのみ説明する。

様々な実施例によれば、プロセッサ３５０は、電子装置３００の各構成要素の制御及び／又は通信に関する演算やデータを処理することができる。プロセッサ３５０は、図１のプロセッサ１２０の構成及び／又は機能のうち少なくとも一部を含んでよい。プロセッサは、通信モジュール３１０、カメラモジュール３２０、ディスプレイ３３０及びメモリ３４０のような電子装置３００の構成要素と作動的に（ｏｐｅｒａｔｉｖｅｌｙ）、電気的に（ｅｌｅｃｔｒｉｃａｌｌｙ）及び／又は機能的に（ｆｕｎｃｔｉｏｎａｌｌｙ）連結されてよい。様々な実施例に係るプロセッサ３５０の各動作は実時間でなされてよい。例えば、プロセッサ３５０がオーディオ信号を処理するために行う一連の演算及び／又は動作は順次に又は同時に、非常に小さい時間範囲内でなされてよい。プロセッサ３５０で実行可能な動作、演算及びデータ処理の種類及び／又は量に限定はないが、本文書では、様々な実施例に係るオーディオ信号を処理する方法及びその方法を行う動作と関連したプロセッサ３５０の構成及び機能についてのみ説明する。

様々な実施例によれば、プロセッサ３５０は、動画を撮影し、オーディオ信号を受信することができる。プロセッサ３５０は、様々な被写体（例えば、図２の外部電子装置２２０及び／又は人物２３０）の画像を撮影できる。様々な実施例によれば、プロセッサ３５０は、カメラモジュール３２０を用いて少なくとも一つの被写体（例えば、外部電子装置２２０及び／又は人物２３０）を撮影できる。被写体になり得るものは、人物２３０、装置（例えば、外部電子装置２２０）のように様々な客体であってよく、被写体になり得る客体に限定はないが、本文書では便宜上、少なくとも一つの人物及び／又は少なくとも一つの外部電子装置を被写体とする場合を中心に説明する。様々な実施例によれば、プロセッサ３５０は、被写体（例えば、人物２３０及び／又は外部電子装置２２０）を撮影し、撮影した被写体のイメージを生成できる。様々な実施例によれば、プロセッサ３５０は、撮影したイメージをディスプレイ３３０（例えば、図２のディスプレイ２１０）上に表示できる。一実施例によれば、プロセッサ３５０が撮影したイメージは、動画イメージであってよい。様々な実施例によれば、プロセッサ３５０は、撮影中の動画イメージをディスプレイ３３０に表示できる。

様々な実施例によれば、プロセッサ３５０は、外部電子装置（例えば、図２の外部電子装置２２０）と連結を構成することができる。様々な実施例によれば、プロセッサ３５０は、外部電子装置２２０と通信的に（ｃｏｍｍｕｎｉｃａｔｉｖｅｌｙ）連結を確立できる。様々な実施例によれば、プロセッサ３５０は、外部電子装置２２０と有線（例えば、直接通信）及び／又は無線通信ネットワーク（例えば、図１の第１ネットワーク１９８）を用いて連結を確立できる。一実施例によれば、プロセッサ３５０は、外部電子装置２２０と近距離無線通信（例えば、ブルートゥース(登録商標)）を用いて連結されてよい。様々な実施例によれば、プロセッサ３５０は、通信連結確立及び／又は機能実行に必要なデータを外部電子装置２２０に送信したり、又は外部電子装置２２０から受信することができる。

様々な実施例によれば、プロセッサ３５０はオーディオ信号を取得できる。様々な実施例によれば、プロセッサ３５０は動画を撮影する場合に、画像の背景音に該当するオーディオ信号を取得できる。プロセッサ３５０は、プロセッサ３５０に含まれたマイクロホン（例えば、図１の入力モジュール１５０）を用いて外部音声を受信し、オーディオ信号を生成できる。一実施例によれば、プロセッサ３５０は、連結された外部電子装置２２０からオーディオ信号を受信することができる。例えば、外部電子装置２２０は、収集した音声を用いてオーディオ信号を生成でき、生成したオーディオ信号をプロセッサ３５０に送信できる。プロセッサ３５０は外部電子装置２２０からオーディオ信号を受信することができる。一実施例によれば、プロセッサ３５０は画像を撮影すると同時に、外部電子装置２２０から画像に対応する音声のオーディオ信号を受信することができる。一実施例によれば、プロセッサ３５０が外部電子装置２２０から受信したオーディオ信号は、モノ（ｍｏｎｏ）音響であってよい。

様々な実施例によれば、プロセッサ３５０はターゲット客体を確認することができる。様々な実施例によれば、プロセッサ３５０は、撮影した動画イメージを分析し、ターゲットとなる客体（例えば、ターゲット客体）を確認することができる。ターゲット客体は、例えば、プロセッサ３５０が実際に位置を推定しようとする客体を意味できる。様々な実施例によれば、プロセッサ３５０は、撮影した動画イメージをディスプレイ３３０に表示できる。プロセッサ３５０が表示した動画イメージは、少なくとも一つの客体を含んでよい。動画イメージに含まれた少なくとも一つの客体は、例えば、人物（例えば、図２の人物２３０）が撮影されたイメージ客体である第１客体（例えば、図２の第１客体２１１）及び／又は外部電子装置２２０が撮影されたイメージ客体である第２客体（例えば、図２の第２客体２２１）を含んでよい。様々な実施例によれば、プロセッサ３５０は、撮影された動画イメージ又は撮影中の動画イメージを分析し、動画イメージに含まれた少なくとも一つのイメージ客体（例えば、図２の第１客体２１１及び／又は第２客体２２１）を識別できる。一実施例によれば、プロセッサ３５０は、メモリ３４０に既に保存されたアルゴリズムを用いてイメージを分析することができ、イメージ分析により、動画イメージに含まれた客体（例えば、第１客体２１１及び／又は第２客体２２１）を識別できる。一実施例によれば、プロセッサ３５０は、ディスプレイ２１０上に表示されたイメージを分析し、イメージに含まれた客体（例えば、第１客体２１１及び／又は第２客体２２１）を識別できる。

様々な実施例によれば、プロセッサ３５０は、イメージ分析を用いてターゲット客体を確認することができる。一実施例によれば、プロセッサ３５０は、動画イメージを分析して顔面認識を行うことができ、顔面認識実行結果に基づいて人物客体（例えば、第１客体２１１）を識別できる。一実施例によれば、プロセッサ３５０は、識別された人物客体（例えば、第１客体２１１）をターゲット客体として識別できる。一実施例によれば、プロセッサ３５０は、識別された外部電子装置２２０に対応する客体（例えば、第２客体２２１）をターゲット客体として識別できる。一実施例によれば、プロセッサ３５０は、撮影されたイメージを分析して視覚的信号（例えば、点滅中のＬＥＤ信号）を識別し、外部電子装置２２０に対応する客体（例えば、第２客体２２１）をターゲット客体として確認することができる。様々な実施例によれば、プロセッサ３５０は、ターゲット客体を確認するための条件をメモリ（例えば、図３のメモリ３４０）にあらかじめ保存することができる。一実施例によれば、プロセッサ３５０は、ディスプレイ２１０上にユーザ（図示せず）のタッチ入力を受信でき、受信したタッチ入力に基づいてターゲット客体を確認することができる。例えば、認識された少なくとも一つの客体のうちタッチ入力の位置に対応する客体をターゲット客体として認識できる。一実施例によれば、プロセッサ３５０は、センサー（例えば、図１のセンサーモジュール１７６）を用いてセンサー情報を生成し、センサー情報に基づいて外部電子装置２２０又は人物２３０を認識し、認識結果に基づいてターゲット客体を確認することができる。一実施例によれば、プロセッサ３５０は、外部電子装置２２０との通信を用いて外部電子装置２２０の位置に関する情報を受信し、受信した位置情報を保存することができる。様々な実施例によれば、プロセッサ３５０は、撮影された動画イメージ分析、受信したタッチ入力分析、センサー情報、及び受信した位置情報のうち少なくとも一つに基づいてターゲット客体を識別し確認することができる。

様々な実施例によれば、プロセッサ３５０は、第１位置情報及び付加情報を確認することができる。第１位置情報は、ターゲット客体がディスプレイ２１０上に表示される位置に関する情報であってよい。一実施例によれば、第１位置情報は、ディスプレイ２１０上の一定の座標で表現される情報であってよい。様々な実施例によれば、プロセッサ３５０は、識別した各客体（例えば、第１客体２１１及び／又は第２客体２２１）がディスプレイ２１０上に表示される位置に関する情報（例えば、座標）（例えば、第１位置情報）を確認することができる。様々な実施例によれば、プロセッサ３５０は、識別した各客体（例えば、第１客体２１１及び／又は第２客体２２１）のディスプレイ２１０上に表示される座標（例えば、第１位置情報）を持続的に確認することができる。プロセッサ３５０は、撮影中にディスプレイ２１０上で実時間に移動する客体（例えば、第１客体２１１及び／又は第２客体２２１）の座標（例えば、第１位置情報）を確認することができる。一実施例によれば、第１位置情報は、プロセッサ３５０の動画撮影中に実時間で変更される情報であってよい。一実施例によれば、プロセッサ３５０は、動画撮影中に第１位置情報を持続的に及び即時に確認することができる。様々な実施例によれば、プロセッサ３５０は、ターゲット客体がディスプレイ２１０上に表示される位置（例えば、第１位置情報）を確認することができる。一実施例によれば、プロセッサ３５０は、ディスプレイ２１０上に存在する全ての客体（例えば、第１客体２１１及び第２客体２２１）のディスプレイ２１０上の位置（例えば、第１位置情報）を確認することができる。一実施例によれば、プロセッサ３５０は、ディスプレイ２１０上に表示された少なくとも一つのイメージ客体（例えば、第１客体２１１及び／又は第２客体２２１）のうちターゲット客体（例えば、第１客体２１１又は第２客体２２１）のディスプレイ２１０上に表示される位置（例えば、第１位置情報）を確認することができる。

様々な実施例によれば、プロセッサ３５０は付加情報を確認することができる。付加情報は、プロセッサ３５０がターゲット客体に対応する被写体（例えば、外部電子装置２２０又は人物２３０）の実際位置に関する情報（例えば、第２位置情報）を推定するために第１位置情報の他に用いられる情報であってよい。付加情報は、電子装置３００に含まれたカメラモジュール３２０に設定された情報を含んでよい。様々な実施例によれば、付加情報は、撮影中であるプロセッサ３５０の画角（ｆｉｅｌｄｏｆｖｉｅｗ，ＦＯＶ）及び／又は倍率のように、カメラモジュール３２０の状態及び／又は設定に関する情報を含んでよい。一実施例によれば、プロセッサ３５０は、ターゲット客体の距離を測定できる。一実施例によれば、付加情報は、電子装置３００とターゲット客体間の距離情報を含んでよい。一実施例によれば、付加情報は、ターゲット客体の大きさを含んでよい。一実施例によれば、プロセッサ３５０は、ターゲット客体のイメージに対応するディスプレイの領域範囲を確認し、ターゲット客体の大きさ（例えば、長さ及び／又は面積）を確認することができる。

様々な実施例によれば、プロセッサ３５０は第２位置情報を生成できる。第２位置情報は、被写体（例えば、図２の人物２３０及び／又は外部電子装置２２０）の実際位置に関する情報であってよい。様々な実施例によれば、プロセッサ３５０は、被写体（例えば、図２の人物２３０及び／又は外部電子装置２２０）の位置を推定できる。一実施例によれば、プロセッサ３５０は、撮影した動画イメージに含まれた全ての客体（例えば、第１客体２１１及び第２客体２２１）に対応する被写体（例えば、人物２３０及び外部電子装置２２０）の実際位置を推定できる。一実施例によれば、プロセッサ３５０は、ターゲット客体に対応する被写体（例えば、人物２３０又は外部電子装置２２０）の実際位置のみを推定できる。一実施例によれば、プロセッサ３５０は、ターゲット客体に対応する被写体の実際位置を推定し、推定した位置に関する第２位置情報を生成できる。様々な実施例によれば、プロセッサ３５０は、第１位置情報に基づいて第２位置情報を生成できる。一実施例によれば、プロセッサ３５０は、撮影されたイメージ客体（例えば、ターゲット客体）のディスプレイ２１０上の位置（例えば、第１位置情報）を確認し、ディスプレイ２１０上の位置に基づいて実際位置（例えば、第２位置情報）を推定できる。様々な実施例によれば、プロセッサ３５０は、付加情報に基づいて第２位置情報を推定できる。一実施例によれば、プロセッサ３５０は、ターゲット客体の第１位置情報及び付加情報を用いて被写体（例えば、人物２３０又は外部電子装置２２０）の実際位置を推定できる。一実施例によれば、プロセッサ３５０が推定する実際位置は、プロセッサ３５０を基準にする被写体（例えば、人物２３０又は外部電子装置２２０）の相対的な位置を意味できる。一実施例によれば、プロセッサ３５０は、電子装置３００に含まれたセンサー（例えば、図１のセンサーモジュール１７６）を用いて生成したセンサー情報に基づいて、第２位置情報を生成できる。一実施例によれば、プロセッサ３５０は、外部電子装置２２０から外部電子装置２２０の位置情報を受信でき、受信した位置情報に基づいて第２位置情報を生成できる。一実施例によれば、第２位置情報は、左右偏向した位置のみを表現する１次元的位置情報であってよく、又は、プロセッサ３５０を基準に前後（例えば、距離）を含んでよく、又は、上下に偏向した位置を表現する３次元的位置情報であってよい。様々な実施例によれば、第２位置情報は、被写体の前後位置、左右位置及び上下位置のうち少なくとも一つ又はその組合せを含んでよい。

様々な実施例によれば、プロセッサ３５０は、第２位置情報に基づいてオーディオ信号を処理できる。オーディオ信号の処理は、取得したオーディオ信号に方向感を付与する動作であってよい。オーディオ信号の処理は、例えば、オーディオ信号の変更及び／又は変換を含んでよい。一実施例によれば、プロセッサ３５０は、取得したオーディオ信号をパンニング（ｐａｎｎｉｎｇ）してステレオオーディオ信号に変換させることができる。一実施例によれば、プロセッサ３５０は、取得したオーディオ信号をレンダリング（ｒｅｎｄｅｒｉｎｇ）し、空間感、位置感及び／又は方向感を提供する３次元音響（例えば、バイノーラル音響）に変換させることができる。一実施例によれば、プロセッサ３５０は、取得したオーディオ信号の音量を調節して距離感を提供するようにオーディオ信号を処理できる。様々な実施例によれば、プロセッサ３５０は一つのオーディオ信号を処理し、聴取者基準で左耳で聞く信号（左側オーディオ）及び右耳で聞く信号（右側オーディオ）をそれぞれ生成できる。一実施例によれば、プロセッサ３５０は、左側オーディオ及び右側オーディオにそれぞれ音響の強度差、時間差、及び位相差のうち少なくとも一つを生成してオーディオ信号を処理できる。

図４は、様々な実施例に係る電子装置がオーディオ信号に方向性を適用する動作フローチャートである。

図４を参照すると、電子装置（例えば、図３の電子装置３００）がオーディオ信号を処理する一連の各動作は、電子装置３００に含まれたプロセッサ（例えば、図３のプロセッサ３５０）が行う動作と表現されてよい。

動作４１０を参照すると、プロセッサ３５０は動画を撮影し、オーディオ信号を受信することができる。プロセッサ３５０は、様々な被写体（例えば、図２の外部電子装置２２０及び／又は人物２３０）の画像を撮影できる。様々な実施例によれば、プロセッサ３５０は、カメラモジュール（例えば、図３のカメラモジュール３２０）を用いて少なくとも一つの被写体（例えば、外部電子装置２２０及び／又は人物２３０）を撮影できる。被写体になり得るものは、人物２３０、装置（例えば、外部電子装置２２０）のように様々な客体であってよく、被写体になり得る客体に限定はないが、本文書では便宜上、少なくとも一つの人物及び／又は少なくとも一つの外部電子装置を被写体とする場合を中心に説明する。様々な実施例によれば、プロセッサ３５０は、被写体（例えば、人物２３０及び／又は外部電子装置２２０）を撮影し、撮影した被写体のイメージを生成できる。様々な実施例によれば、プロセッサ３５０は、撮影したイメージをディスプレイ（例えば、図３のディスプレイ３３０）上に表示できる。一実施例によれば、プロセッサ３５０が撮影したイメージは、動画イメージであってよい。様々な実施例によれば、プロセッサ３５０は、撮影中の動画イメージをディスプレイ３３０に表示できる。様々な実施例によれば、プロセッサ３５０は、外部電子装置（例えば、図２の外部電子装置２２０）と連結を構成することができる。様々な実施例によれば、プロセッサ３５０は、外部電子装置２２０と通信的に（ｃｏｍｍｕｎｉｃａｔｉｖｅｌｙ）連結を確立できる。様々な実施例によれば、プロセッサ３５０は、外部電子装置２２０と有線（例えば、直接通信）及び／又は無線通信ネットワーク（例えば、図１の第１ネットワーク１９８）を用いて連結を確立できる。一実施例によれば、プロセッサ３５０は、外部電子装置２２０と近距離無線通信（例えば、ブルートゥース(登録商標)）を用いて連結されてよい。様々な実施例によれば、プロセッサ３５０は、通信連結確立及び／又は機能実行に必要なデータを外部電子装置２２０に送信したり、又は、外部電子装置２２０から受信することができる。様々な実施例によれば、プロセッサ３５０はオーディオ信号を取得できる。様々な実施例によれば、プロセッサ３５０は動画を撮影する場合に、画像の背景音に該当するオーディオ信号を取得できる。プロセッサ３５０は、プロセッサ３５０に含まれたマイクロホン（例えば、図１の入力モジュール１５０）を用いて外部音声を受信し、オーディオ信号を生成できる。一実施例によれば、プロセッサ３５０は、連結された外部電子装置２２０からオーディオ信号を受信することができる。例えば、外部電子装置２２０は、収集した音声を用いてオーディオ信号を生成でき、生成したオーディオ信号をプロセッサ３５０に送信できる。プロセッサ３５０は、外部電子装置２２０からオーディオ信号を受信できる。一実施例によれば、プロセッサ３５０は画像を撮影すると同時に、外部電子装置２２０から画像に対応する音声のオーディオ信号を受信することができる。一実施例によれば、プロセッサ３５０が外部電子装置２２０から受信したオーディオ信号は、モノ（ｍｏｎｏ）音響であってよい。

動作４２０を参照すると、プロセッサ３５０は、ターゲット客体を確認することができる。様々な実施例によれば、プロセッサ３５０は、撮影した動画イメージを分析し、ターゲットとなる客体（例えば、ターゲット客体）を確認することができる。ターゲット客体は、例えば、プロセッサ３５０が実際に位置を推定しようとする客体を意味できる。様々な実施例によれば、プロセッサ３５０は、撮影した動画イメージをディスプレイ３３０に表示できる。プロセッサ３５０が表示した動画イメージは、少なくとも一つの客体を含んでよい。動画イメージに含まれた少なくとも一つの客体は、例えば、人物（例えば、図２の人物２３０）が撮影されたイメージ客体である第１客体（例えば、図２の第１客体２１１）及び／又は外部電子装置２２０が撮影されたイメージ客体である第２客体（例えば、図２の第２客体２２１）を含んでよい。様々な実施例によれば、プロセッサ３５０は、撮影された動画イメージ又は撮影中の動画イメージを分析し、動画イメージに含まれた少なくとも一つのイメージ客体（例えば、図２の第１客体２１１及び／又は第２客体２２１）を識別できる。一実施例によれば、プロセッサ３５０は、メモリ（例えば、図３のメモリ３４０）に既に保存されたアルゴリズムを用いてイメージを分析でき、イメージ分析により、動画イメージに含まれた客体（例えば、第１客体２１１及び／又は第２客体２２１）を識別できる。一実施例によれば、プロセッサ３５０は、ディスプレイ２１０上に表示されたイメージを分析し、イメージに含まれた客体（例えば、第１客体２１１及び／又は第２客体２２１）を識別できる。

動作４３０を参照すると、プロセッサ３５０は第１位置情報及び付加情報を確認することができる。第１位置情報は、ターゲット客体がディスプレイ２１０上に表示される位置に関する情報であってよい。一実施例によれば、第１位置情報は、ディスプレイ２１０上の一定の座標で表現される情報であってよい。様々な実施例によれば、プロセッサ３５０は、識別した各客体（例えば、第１客体２１１及び／又は第２客体２２１）がディスプレイ２１０上に表示される位置に関する情報（例えば、座標）（例えば、第１位置情報）を確認することができる。様々な実施例によれば、プロセッサ３５０は、識別した各客体（例えば、第１客体２１１及び／又は第２客体２２１）のディスプレイ２１０上に表示される座標（例えば、第１位置情報）を持続的に確認することができる。プロセッサ３５０は、撮影中にディスプレイ２１０上で実時間に移動する客体（例えば、第１客体２１１及び／又は第２客体２２１）の座標（例えば、第１位置情報）を確認することができる。一実施例によれば、第１位置情報は、プロセッサ３５０の動画撮影中に実時間で変更される情報であってよい。一実施例によれば、プロセッサ３５０は、動画撮影中に第１位置情報を持続的に及び即時に確認することができる。様々な実施例によれば、プロセッサ３５０は、ターゲット客体がディスプレイ２１０上に表示される位置（例えば、第１位置情報）を確認することができる。一実施例によれば、プロセッサ３５０は、ディスプレイ２１０上に存在する全ての客体（例えば、第１客体２１１及び第２客体２２１）のディスプレイ２１０上の位置（例えば、第１位置情報）を確認することができる。一実施例によれば、プロセッサ３５０は、ディスプレイ２１０上に表示された少なくとも一つのイメージ客体（例えば、第１客体２１１及び／又は第２客体２２１）のうちターゲット客体（例えば、第１客体２１１又は第２客体２２１）のディスプレイ２１０上に表示される位置（例えば、第１位置情報）を確認することができる。

様々な実施例によれば、プロセッサ３５０は付加情報を確認することができる。付加情報は、プロセッサ３５０がターゲット客体に対応する被写体（例えば、外部電子装置２２０又は人物２３０）の実際位置に関する情報（例えば、第２位置情報）を推定するために第１位置情報の他に用いられる情報であってよい。付加情報は、電子装置３００に含まれたカメラモジュール（例えば、図３のカメラモジュール３２０）に設定された情報を含んでよい。様々な実施例によれば、付加情報は、撮影中であるプロセッサ３５０の画角（ｆｉｅｌｄｏｆｖｉｅｗ，ＦＯＶ）及び／又は倍率のように、カメラモジュール３２０の状態及び／又は設定に関する情報を含んでよい。

動作４４０を参照すると、プロセッサ３５０は第２位置情報を生成できる。第２位置情報は、被写体（例えば、図２の人物２３０及び／又は外部電子装置２２０）の実際位置に関する情報であってよい。様々な実施例によれば、プロセッサ３５０は、被写体（例えば、図２の人物２３０及び／又は外部電子装置２２０）の位置を推定できる。一実施例によれば、プロセッサ３５０は、撮影した動画イメージに含まれた全ての客体（例えば、第１客体２１１及び第２客体２２１）に対応する被写体（例えば、人物２３０及び外部電子装置２２０）の実際位置を推定できる。一実施例によれば、プロセッサ３５０は、ターゲット客体に対応する被写体（例えば、人物２３０又は外部電子装置２２０）の実際位置のみを推定できる。一実施例によれば、プロセッサ３５０は、ターゲット客体に対応する被写体の実際位置を推定し、推定した位置に関する第２位置情報を生成できる。様々な実施例によれば、プロセッサ３５０は、第１位置情報に基づいて第２位置情報を生成できる。一実施例によれば、プロセッサ３５０は、撮影されたイメージ客体（例えば、ターゲット客体）のディスプレイ２１０上の位置（例えば、第１位置情報）を確認し、ディスプレイ２１０上の位置に基づいて実際位置（例えば、第２位置情報）を推定できる。様々な実施例によれば、プロセッサ３５０は、付加情報に基づいて第２位置情報を推定できる。一実施例によれば、プロセッサ３５０は、ターゲット客体の第１位置情報及び付加情報を用いて被写体（例えば、人物２３０又は外部電子装置２２０）の実際位置を推定できる。一実施例によれば、プロセッサ３５０が推定する実際位置は、プロセッサ３５０を基準にする被写体（例えば、人物２３０又は外部電子装置２２０）の相対的な位置を意味できる。一実施例によれば、プロセッサ３５０は、電子装置３００に含まれたセンサー（例えば、図１のセンサーモジュール１７６）を用いて生成したセンサー情報に基づいて、第２位置情報を生成できる。一実施例によれば、プロセッサ３５０は、外部電子装置２２０から外部電子装置２２０の位置情報を受信でき、受信した位置情報に基づいて第２位置情報を生成できる。一実施例によれば、第２位置情報は、左右偏向した位置のみを表現する１次元的位置情報であってよく、又は、プロセッサ３５０を基準に前後（例えば、距離）を含んでよく、又は、上下に偏向した位置を表現する３次元的位置情報であってよい。様々な実施例によれば、第２位置情報は、被写体の前後位置、左右位置及び上下位置のうち少なくとも一つ又はその組合せを含んでよい。

動作４５０を参照すると、プロセッサ３５０は第２位置情報に基づいてオーディオ信号を処理できる。オーディオ信号の処理は、取得したオーディオ信号に方向感を付与する動作であってよい。オーディオ信号の処理は、例えば、オーディオ信号の変更及び／又は信号の変換を含んでよい。一実施例によれば、プロセッサ３５０は、取得したオーディオ信号をパンニング（ｐａｎｎｉｎｇ）してステレオオーディオ信号に変換させることができる。一実施例によれば、プロセッサ３５０は、取得したオーディオ信号をレンダリング（ｒｅｎｄｅｒｉｎｇ）し、空間感、位置感及び／又は方向感を提供する３次元音響（例えば、バイノーラル音響）に変換させることができる。一実施例によれば、プロセッサ３５０は、取得したオーディオ信号の音量を調節して距離感を提供するようにオーディオ信号を処理できる。様々な実施例によれば、プロセッサ３５０は一つのオーディオ信号を処理し、聴取者基準で左耳で聞く信号（左側オーディオ）及び右耳で聞く信号（右側オーディオ）をそれぞれ生成できる。一実施例によれば、プロセッサ３５０は、左側オーディオ及び右側オーディオにそれぞれ音響の強度差、時間差及び位相差のうち少なくとも一つを生成してオーディオ信号を処理できる。

一実施例によれば、プロセッサ３５０は、処理されたオーディオ信号をメモリ（例えば、図３のメモリ３４０）に保存することができる。一実施例によれば、プロセッサ３５０は、撮影された動画イメージを動画データとして保存し、処理されたオーディオ信号とエンコードすることができる。一実施例によれば、プロセッサ３５０は、処理されたオーディオ信号を動画に対応する背景オーディオとしてエンコードして保存することができる。一実施例によれば、プロセッサ３５０は、生成した第２位置情報をオーディオ信号とは別個にエンコードすることができる。例えば、プロセッサ３５０は、第２位置情報とオーディオ信号を別個にエンコードした後、以後の再生時に、さらにデコードして第２位置情報に基づくオーディオ信号処理を行うことができる。

図５～図７は、様々な実施例に係る電子装置がターゲット客体を確認する例示図である。

図５～図７を参照すると、電子装置２００（例えば、図１の電子装置１０１及び／又は図３の電子装置３００）が少なくても一つの被写体（例えば、図２の人物２３０及び／又は外部電子装置２２０）を撮影してディスプレイ２１０（例えば、図３のディスプレイ３３０）に表示した動画イメージの例示であってよい。

図５を参照すると、電子装置２００は、ディスプレイ２１０上に表示された動画イメージを分析してターゲット客体を確認することができる。

様々な実施例によれば、電子装置２００が表示した動画イメージは、少なくとも一つの客体を含んでよい。動画イメージに含まれた少なくとも一つの客体は、例えば、人物被写体（例えば、図２の人物２３０）が撮影されたイメージ客体である第１客体２１１及び／又は外部電子装置（例えば、図２の外部電子装置２２０）が撮影されたイメージ客体である第２客体２２１を含んでよい。様々な実施例によれば、電子装置２００は、撮影された動画イメージ又は撮影中の動画イメージを分析し、動画イメージに含まれた少なくとも一つのイメージ客体（例えば、第１客体２１１及び／又は第２客体２２１）を識別できる。一実施例によれば、電子装置２００は、メモリ（例えば、図３のメモリ３４０）に既に保存されたアルゴリズムを用いてイメージを分析でき、イメージ分析により、動画イメージに含まれた客体（例えば、第１客体２１１及び／又は第２客体２２１）を識別できる。一実施例によれば、電子装置２００は、ディスプレイ２１０上に表示されたイメージを分析し、イメージに含まれた客体（例えば、第１客体２１１及び／又は第２客体２２１）を識別できる。様々な実施例によれば、電子装置２００は、撮影した動画イメージを分析し、ターゲットとなる客体（例えば、ターゲット客体）を確認することができる。ターゲット客体は、例えば、電子装置２００が実際に位置を推定しようとする客体を意味できる。様々な実施例によれば、電子装置２００はイメージ分析を用いてターゲット客体を確認することができる。一実施例によれば、電子装置２００は、動画イメージを分析して顔面認識を行うことができ、顔面認識実行結果に基づいて人物客体（例えば、第１客体２１１）を識別できる。

図５の［ａ］を参照すると、電子装置２００が識別した客体５００は第１客体２１１であってよい。一実施例によれば、電子装置２００は、動画イメージを分析して認識した顔面に基づいて人物客体（例えば、第１客体２１１）を識別できる。一実施例によれば、電子装置２００は、識別された人物客体（例えば、第１客体２１１）をターゲット客体として確認することができる。

図５の［ｂ］を参照すると、電子装置２００が識別した客体５００は、第２客体２２１であってよい。一実施例によれば、電子装置２００は、動画イメージを分析して認識した顔面に基づいて人物客体（例えば、第２客体２２１）を識別できる。一実施例によれば、電子装置２００は、撮影されたイメージを分析して視覚的信号（例えば、点滅中のＬＥＤ信号）を識別し、外部電子装置２２０に対応する客体（例えば、第２客体２２１）をターゲット客体として確認することができる。一実施例によれば、外部電子装置２２０は、視覚的信号（例えば、ＬＥＤ点滅信号）を出力でき、電子装置２００は、外部電子装置２２０の信号を識別して外部電子装置２２０のイメージに対応する客体を識別できる。実施例によれば、電子装置２００は、識別された外部電子装置２２０に対応する客体（例えば、第２客体２２１）をターゲット客体として識別できる。様々な実施例によれば、電子装置２００は、ターゲット客体を確認するための条件をメモリ（例えば、図３のメモリ３４０）にあらかじめ保存することができる。一実施例によれば、電子装置２００は、センサー（例えば、図１のセンサーモジュール１７６）を用いてセンサー情報を生成し、センサー情報に基づいて外部電子装置２２０に対応する客体（例えば、第２客体２２１）を認識し、認識結果に基づいてターゲット客体を確認することができる。一実施例によれば、電子装置２００は、外部電子装置２２０との通信を用いて外部電子装置２２０の位置に関する情報を受信し、受信した位置情報を保存することができる。図５の［ｂ］を参照すると、外部電子装置２２０は、特定の周波数を有する信号（例えば、ＵＷＢ信号）を持続的に出力する状態であってよい。この場合、電子装置２００は、外部電子装置２２０が出力する信号（例えば、ＵＷＢ信号）をセンサー（例えば、図１のセンサーモジュール１７６）を用いて受信し、センサー情報を生成して第２客体２２１を認識することができる。

図５の［ｃ］を参照すると、電子装置２００は、複数のイメージ客体（例えば、第１客体２１１及び第２客体２２１）が認識される場合に、認識された客体の中から、あらかじめ設定された条件によってターゲット客体を選択できる。図５の［ｃ］を参照すると、識別された客体（例えば、第１識別された客体５０１及び第２識別になった客体５０２）が複数個である場合であってよい。一実施例によれば、電子装置２００は、識別された複数の客体（５０１及び５０２）のうち少なくとも一つを選択してターゲット客体として確認することができる。一実施例によれば、電子装置２００は、識別された複数の客体をターゲット客体として確認することができる。

図６及び図７を参照すると、電子装置２００は、タッチ入力に基づいてターゲット客体を確認することができる。様々な実施例によれば、電子装置２００は、ディスプレイ２１０上にユーザ（図示せず）のタッチ入力を受信でき、受信したタッチ入力に基づいてターゲット客体を確認することができる。様々な実施例によれば、電子装置２００のディスプレイ２１０は、タッチパネル（例えば、図３の入力モジュール３３１）を含んでよく、タッチパネル（例えば、入力モジュール３３１）を介してユーザのタッチ入力を受信することができる。様々な実施例によれば、電子装置２００はタッチ入力を受信し、タッチ入力の発生した領域（例えば、タッチ領域２１２）を確認することができる。一実施例によれば、電子装置２００は、タッチ領域２１２のディスプレイ２１０上の座標を確認することができる。一実施例によれば、電子装置２００は、タッチ領域２１２の面積を様々に設定することができる。図６及び図７を参照すると、電子装置２００は、比較的狭い範囲のタッチ領域（例えば、図６のタッチ領域２１２）又は比較的広い範囲のタッチ領域（例えば、図７のタッチ領域２１２）を設定できる。電子装置２００は、タッチ入力が受信された位置からあらかじめ定められた一定半径以内の領域をタッチ領域２１２として設定できる。

図６を参照すると、電子装置２００は、例えば、認識された少なくとも一つの客体のうちタッチ入力の位置に対応する客体をターゲット客体として認識できる。図６の［ａ］及び［ｂ］を参照すると、電子装置２００は、タッチ入力を受信することができる。様々な実施例によれば、電子装置２００は、ディスプレイ２１０上にユーザのタッチ入力を受信することができる。様々な実施例によれば、電子装置２００は、タッチ入力が受信されたタッチ領域２１２を確認することができる。一実施例によれば、電子装置２００は、タッチ領域２１２を確認し、タッチ領域２１２のディスプレイ２１０上の位置に基づいてターゲット客体を確認することができる。図６の［ａ］を参照すると、電子装置２００は、ディスプレイ２１０上に撮影中のイメージを表示でき、撮影イメージはイメージ客体２１１を含んでよい。一実施例によれば、電子装置２００はタッチ入力を受信し、入力を受信したタッチ領域２１２の位置を確認することができる。一実施例によれば、電子装置２００は、タッチ領域２１２の位置に基づいて、タッチ領域２１２と実質的に同じ位置に存在するイメージ客体２１１をターゲット客体として確認することができる。

図６の［ｂ］を参照すると、電子装置２００は、複数のイメージ客体（例えば、第１客体２１１ａ、第２客体２１１ｂ及び第３客体２１１ｃ）を含む撮影画像をディスプレイ２１０上に表示できる。様々な実施例によれば、電子装置２００は、撮影画像に含まれた複数のイメージ客体のうち、ターゲットとなるターゲット客体（例えば、第１客体２１１ａ）をターゲット客体として確認することができる。一実施例によれば、電子装置２００は、複数の客体（例えば、第１客体２１１ａ、第２客体２１１ｂ及び第３客体２１１ｃ）のうち、タッチ領域２１２の位置に基づいてターゲット客体を確認することができる。一実施例によれば、電子装置２００は、イメージ分析を用いて、ディスプレイ２１０上に表示された画像イメージに含まれた複数の客体（例えば、第１客体２１１ａ、第２客体２１１ｂ及び第３客体２１１ｃ）を認識できる。一実施例によれば、電子装置２００が認識する複数の客体（例えば、第１客体２１１ａ、第２客体２１１ｂ及び第３客体２１１ｃ）は、人物イメージ客体であってよい。一実施例によれば、電子装置２００は、画像イメージを分析して人物イメージ客体（例えば、第１客体２１１ａ、第２客体２１１ｂ及び第３客体２１１ｃ）を認識できる。一実施例によれば、電子装置２００は、人物イメージに含まれた顔形態を識別でき、画像イメージ内に含まれた複数の客体（例えば、第１客体２１１ａ、第２客体２１１ｂ及び第３客体２１１ｃ）のうち、複数の識別した客体（例えば、第１識別された客体５０１、第２識別された客体５０２及び第３識別された客体５０３）を確認することができる。識別した客体（例えば、第１識別された客体５０１、第２識別された客体５０２及び第３識別された客体５０３）は、画像イメージ内の複数の客体のうち、電子装置２００が識別した客体であってよい。一実施例によれば、電子装置２００は、識別した客体（例えば、第１識別された客体５０１、第２識別された客体５０２及び第３識別された客体５０３）の位置、及びタッチ領域２１２の位置に基づいてターゲット客体を確認することができる。図６の［ｂ］を参照すると、電子装置２００は、タッチ領域２１２と最も近い第１識別された客体５０１をターゲット客体として確認することができる。

図７を参照すると、電子装置２００は、タッチ位置から一定半径範囲の領域をタッチ領域２１２として確認することができる。図７の［ａ］及び［ｂ］を参照すると、タッチ領域２１２は、タッチ入力の発生した位置を基準にして一定の面積を有するディスプレイ２１０上の領域であってよい。様々な実施例によれば、電子装置２００は、タッチ領域２１２に基づいてターゲット客体を確認することができる。一実施例によれば、電子装置２００は、タッチ領域２１２と対応する位置にある客体をターゲット客体として確認することができる。一実施例によれば、電子装置２００はタッチ領域２１２に含まれるか、重複又は最も近似している位置に存在する客体を、ターゲット客体として確認することができる。図７の［ｂ］を参照すると、電子装置２００がディスプレイ２１０上に表示するイメージは、複数の客体（例えば、第１客体２１１ａ、第２客体２１１ｂ及び第３客体２１１ｃ）を含んでよい。一実施例によれば、電子装置２００はイメージ分析によってディスプレイ２１０上に複数の客体（例えば、第１客体２１１ａ、第２客体２１１ｂ及び第３客体２１１ｃ）をそれぞれ識別できる。電子装置２００は、識別した客体（例えば、第１識別された客体５０１、第２識別された客体５０２及び第３識別された客体５０３）のうち、タッチ領域２１２と対応する客体（例えば、第１客体２１１ａ）をターゲット客体として確認することができる。図７の［ｂ］を参照すると、電子装置２００は、タッチ領域２１２に第１識別された客体５０１が含まれることが確認でき、第１識別された客体５０１に対応する第１客体２１１ａをターゲット客体として確認することができる。

図８は、様々な実施例に係る付加情報を説明するための例示図である。

様々な実施例によれば、電子装置２００は付加情報を確認することができる。様々な実施例によれば、プロセッサ（例えば、図３のプロセッサ３５０）は付加情報を確認することができる。付加情報は、プロセッサ３５０がターゲット客体に対応する被写体（例えば、外部電子装置２２０又は人物２３０）の実際位置に関する情報（例えば、第２位置情報）を推定するために第１位置情報の他に用いられる情報であってよい。付加情報は、電子装置３００に含まれたカメラモジュール（例えば、図３のカメラモジュール３２０）に設定された情報を含んでよい。様々な実施例によれば、付加情報は、撮影中であるカメラモジュール３２０の画角（例えば、第１角度（θ１））（ｆｉｅｌｄｏｆｖｉｅｗ，ＦＯＶ）及び／又は倍率（ｍ）のように、カメラモジュール３２０の状態及び／又は設定に関する情報を含んでよい。

図８を参照すると、電子装置２００は、被写体２３０を動画撮影している中であってよい。一実施例によれば、電子装置２００は、カメラモジュール（例えば、図３のカメラモジュール３２０）を用いて動画を撮影できる。

図８の［ａ］を参照すると、電子装置２００のカメラモジュール３２０は、一定の角度（例えば、第１角度（θ１））の画角を形成できる。一実施例によれば、カメラモジュール３２０は少なくとも一つのレンズ（図示せず）を含んでよく、少なくとも一つのレンズが有する口径及び／又は倍率によって撮影できる画角（例えば、第１角度（θ１））を形成することができる。電子装置２００は、メモリ（例えば、図３のメモリ３４０）に画角に関する情報をあらかじめ保存することができる。

図８の［ｂ］を参照すると、電子装置２００は、現在撮影中であるカメラモジュール３２０に設定された倍率（ｍ）に対する情報及び識別された客体５００（例えば、ターゲット客体）のディスプレイ上の位置に対する座標情報を確認することができる。一実施例によれば、電子装置２００は、ディスプレイ２１０のｘ軸上の長さｄｘ及びｙ軸上の長さｄｙにおいて識別された客体５００が表示される位置を確認することができる。一実施例によれば、電子装置２００は、撮影中の画像イメージに適用された倍率（ｍ）情報を確認することができる。倍率（ｍ）に関する情報は、電子装置２００が動画を撮影する時に拡大した比率に関する情報であってよい。様々な実施例によれば、付加情報は画角及び／又は倍率情報を含んでよく、電子装置２００は、画角及び／又は倍率情報を用いて客体（例えば、ターゲット客体）がディスプレイ２１０の中心から外れた角度（例えば、上下方向の高度角及び／又は左右方向の方位角）を計算でき、実際位置情報（例えば、第２位置情報）を生成することができる。

図９は、様々な実施例に係るステレオ音響を説明するための例示図である。

図１０及び図１１は、様々な実施例に係る空間感が与えられたオーディオ信号を説明するための例示図である。

図９の［ａ］及び［ｂ］を参照すると、音響を聴取する聴取者９０は、音響を聴取することができる。一実施例によれば、聴取者９０は、イヤホンのような音源出力装置を用いて音源を聴取している中であってよい。様々な実施例によれば、聴取者９０は音響を聴取しながら、特定の距離及び／又は方向に音源が存在していると認識でき、該当する距離及び／又は方向に対応する仮想の位置に音像（ｓｏｕｎｄｉｍａｇｅ又はａｃｏｕｓｔｉｃｉｍａｇｅ）９００が形成されてよい。一実施例によれば、音像９００が形成されることにより、聴取者９０にとっては、音源が存在する空間（例えば、音場（ａｃｏｕｓｔｉｃｆｉｅｌｄ））があるかのように感じる効果が得られる。例えば、聴取者９０は、音像９００が形成されることにより、音場がある感じ、すなわち、音長感を感じることができる。

図９の［ａ］を参照すると、聴取者９０は、モノ（ｍｏｎｏ）音響に該当するオーディオ信号を聴取している中であってよい。モノオーディオ信号は、左耳及び右耳に同一の音声を出力させる信号であってよい。同一の音声は、同一の位相の音声、同一の音量の音声及び／又は同一の時点の音声と理解されてよい。図９の［ａ］を参照すると、モノオーディオ信号は、１つの第１音像９１０のみを形成できる。第１音像９１０は、ユーザの正面に、ユーザから一定の距離だけ離隔して形成されてよい。

図９の［ｂ］、図１０及び図１１を参照すると、聴取者９０は、ステレオ（ｓｔｅｒｅｏ）音響に該当するオーディオ信号を聴取している中であってよい。ステレオオーディオ信号は、左耳及び右耳に互いに異なる音声を出力させる信号であってよい。互いに異なる音声は、互いに異なる位相の音声、互いに異なる音量の音声及び／又は互いに異なる時点の音声と理解されてよい。すなわち、左耳に到達する音声及び牛耳に到達する音声間に位相差、音量差及び／又は時間差が形成されたオーディオ信号であってよい。様々な実施例によれば、ステレオオーディオ信号は、少なくとも２つの音像（例えば、左側第２音像９２０Ｌ及び右側第２音像９２０Ｒ）を形成できる。

図９の［ｂ］を参照すると、ステレオオーディオ信号が２つの音像（例えば、左側第２音像９２０Ｌ及び右側第２音像９２０Ｒ）を形成した場合である。一実施例によれば、左側第２音像９２０Ｌ及び右側第２音像９２０Ｒは、聴取者９０の正面から同一の角度（例えば、θ２）だけ離隔していてよい。一実施例によれば、左側第２音像９２０Ｌ及び右側第２音像９２０Ｒは、聴取者９０から実質的に同一の距離だけ離隔した位置に形成されてよい。様々な実施例によれば、電子装置（例えば、図３の電子装置３００）はステレオオーディオ信号を生成できる。一実施例によれば、電子装置３００はオーディオ信号を処理して、ステレオオーディオ信号を生成できる。ステレオオーディオ信号を生成する場合に、電子装置３００は、第２位置情報に基づいてステレオオーディオ信号を生成できる。一実施例によれば、第２位置情報は、ターゲット客体が形成する左右方位角又は左右距離のみを含んでよい。左右方位角又は左右距離は、ターゲット客体が電子装置３００の中心から左右方向に離隔した角度又は距離を意味できる。一実施例によれば、電子装置３００は、ターゲット客体の左右方位角又は左右距離に基づいてオーディオ信号を処理できる。電子装置３００は、左右方位角又は左右距離に基づいて左右音響を互いに異なるように生成、すなわち、パンニング（ｐａｎｎｉｎｇ）することができる。

図１０を参照すると、ステレオオーディオ信号の音像（９００及び９０１）は、聴取者９０を中心にした全方向に形成されてよい。この場合、２よりも大きい個数の音像（９００及び９０１）が形成されてよい。この場合、ステレオオーディオ信号は、バイノーラル（ｂｉｎａｕｒａｌ）信号を形成するものと理解されてよい。様々な実施例によれば、バイノーラルオーディオ信号は方向感を形成できる。図１０を参照すると、特定の位置の音像（例えば、第４音像９０１）から聴取者９０の左耳９１及び牛耳９２までの距離はそれぞれ、ｄｌ及びｄｒに該当し得る。この場合、左耳９１及び牛耳９２にそれぞれ到達する音声の音量は、それぞれｄｌ及びｄｒに反比例して決定されてよい。また、左耳９１及び牛耳９２に音声が到達する時間はそれぞれ、ｄｌ及びｄｒに比例して決定されてよい。様々な実施例によれば、電子装置３００は、オーディオ信号において、特定の位置の音像（例えば、第４音像９０１）を形成するために、設定された左耳９１及び牛耳９２までの距離に基づいて、左耳９１及び牛耳９２のそれぞれに到達する音響に音量差及び／又は時間差を形成してオーディオ信号を処理できる。この場合、電子装置３００は、第２位置情報に基づいて方向感が与えられたオーディオ信号を生成できる。一実施例によれば、第２位置情報は、ターゲット客体が形成する左右方位角、左右距離及び／又は、電子装置３００からの距離を含んでよい。一実施例によれば、電子装置３００は、第２位置情報に基づいて、オーディオ信号に方向感を付与する、すなわち、レンダリング（ｒｅｎｄｅｒｉｎｇ）することができる。

図１１を参照すると、オーディオ信号は、上下方向感及び距離感を形成できる。図１１の［ａ］を参照すると、聴取者９０は、上下方向の方向感が形成されたオーディオ信号を聴取でき、上側及び下側に音像（例えば、上部音像９００Ｈ及び下部音像９００Ｌ）が形成されてよい。様々な実施例によれば、電子装置３００は、オーディオ信号の全体的な振動数特性を調節（例えば、イコライジング（ｅｑｕａｌｉｚｉｎｇ））して高振動数領域として処理する場合に、上側に音像（上部音像９００Ｈ）を形成でき、低振動数領域として処理する場合に、下部音像９００Ｌを形成できる。この場合、電子装置３００は、上下位置を含む第２位置情報に基づいてオーディオ信号を上下レンダリングすることができる。

図１１の［ｂ］を参照すると、音像（例えば、近距離音像９００Ｃ及び遠距離音像９００Ｆ）は距離感を形成することができる。図１１の［ｂ］を参照すると、聴取者９０の正面を基準にして同一の角度（θ３）だけ離隔した２つの音像（例えば、近距離音像９００Ｃ及び遠距離音像９００Ｆ）を例示的に表現されている。一実施例よれば、近距離音像９００Ｃは、聴取者９０から距離ｄｃだけ離隔しており、遠距離音像９００Ｆは、聴取者９０から距離ｄｆだけ離隔していてよい。一実施例によれば、電子装置３００は、各距離（例えば、ｄｃ及びｄｆ）に反比例する音量を適用して、左耳及び牛耳に到達する音声を含むようにオーディオ信号を処理できる。一実施例によれば、電子装置３００は、距離情報を含む第２位置情報を生成し、互いに異なる距離情報に基づいて、互いに異なる距離に該当する音像を含むようにオーディオ信号を処理できる。様々な実施例によれば、電子装置３００は、音像の形成された距離によって左右偏向の程度が異なるようにオーディオ信号を処理できる。例えば、近距離音像９００Ｃ及び遠距離音像９００Ｆはそれぞれ、聴取者９０を基準にして同一の角度（θ３）だけ離隔していても、距離によって聴取者９０は左右方向偏向の程度を互いに異なるように感じることができる。聴取者９０は、近くにある近距離音像９００Ｃの左右偏向程度を遠距離音像９００Ｆに比べて大きく感じることができる。一実施例によれば、電子装置３００は、近距離音像との距離（ｄｃ）及び遠距離音像との距離（ｄｆ）に反比例して偏向程度を決定し、オーディオ信号を処理（例えば、パンニング）することができる。

本文書に開示されている様々な実施例に係る電子装置（例えば、電子装置３００）は、近距離無線通信を支援する通信モジュール３１０、動画イメージを撮影するカメラモジュール３２０、前記撮影する動画イメージを表示するディスプレイ３３０、及び前記通信モジュール、カメラモジュール及びディスプレイと作動的に（ｏｐｅｒａｔｉｖｅｌｙ）連結されるプロセッサ３５０を含み、前記プロセッサは、前記通信モジュールを用いて外部電子装置（例えば、外部電子装置２２０）と連結を確立し、前記動画イメージ撮影と同時に前記外部電子装置からオーディオ信号を受信し、前記撮影される動画イメージに含まれる少なくとも一つの客体（例えば、第１客体２１１ａ、第２客体２１１ｂ及び／又は第３客体２１１ｃ）のうちターゲットとなるターゲット客体を確認し、前記ターゲット客体が前記ディスプレイ上に表示される位置に関する第１位置情報を確認し、前記第１位置情報に基づいて前記ターゲット客体の実際位置を推定し、実際位置に関する第２位置情報を生成し、前記生成された第２位置情報に基づいて前記オーディオ信号を処理するように設定されてよい。

また、前記プロセッサは、前記撮影中の動画イメージに含まれる少なくとも一つの客体を認識し、前記認識された少なくとも一つの客体のうちターゲット客体を確認するように設定されてよい。

また、前記ディスプレイは、タッチ入力を受信する入力モジュール３３１をさらに含み、前記プロセッサは、前記タッチ入力を受信し、前記受信したタッチ入力の前記ディスプレイ上の位置を確認し、前記確認されたタッチ入力の位置（例えば、タッチ領域２１２）に基づいて前記ターゲット客体を確認するように設定されてよい。

また、前記プロセッサは、前記少なくとも一つの客体のイメージを分析し、前記イメージ分析に基づいて前記ターゲット客体を確認するように設定されてよい。

また、前記プロセッサは、前記イメージ分析に基づいて前記外部電子装置のイメージ及び前記少なくとも一つの客体の顔イメージのうち少なくとも一つに対するイメージを認識し、前記認識されたイメージに基づいて前記ターゲット客体を確認するように設定されてよい。

また、前記プロセッサは、前記カメラモジュールの拡大倍率情報、前記カメラモジュールの画角情報を含む付加情報をさらに確認し、前記確認された付加情報及び前記第１位置情報に基づいて前記第２位置情報を生成するように設定されてよい。

また、前記外部電子装置から前記外部電子装置の位置情報をさらに受信し、前記プロセッサは、前記外部電子装置の位置情報に基づいて前記第２位置情報を生成するように設定されてよい。

また、センサー（例えば、センサーモジュール１７６）をさらに含み、前記プロセッサは、前記センサーを用いて前記外部電子装置から発生する信号を感知し、前記感知した信号に基づいて前記第２位置情報を生成するように設定されてよい。

また、前記第２位置情報は左右距離又は左右方位角を含み、前記プロセッサは、前記オーディオ信号を前記第２位置情報に基づいてパンニング（ｐａｎｎｉｎｇ）して前記オーディオ信号を処理するように設定されてよい。

また、前記第２位置情報は上下をさらに含み、前記プロセッサは、前記オーディオ信号を前記第２位置情報に基づいて３次元レンダリングして前記オーディオ信号を処理するように設定されてよい。

また、前記第２位置情報は、前記ターゲット客体の前記電子装置との距離をさらに含み、前記プロセッサは、前記オーディオ信号を、前記実際位置に基づいて前記オーディオ信号の音量を調節するように設定されてよい。

また、データを保存し、前記プロセッサと作動的に連結されたメモリ（例えば、メモリ３４０）をさらに含み、前記プロセッサは、前記処理されたオーディオ信号及び前記撮影された動画イメージをエンコードして前記メモリに保存するように設定されてよい。

本文書に開示されている様々な実施例に係る電子装置（例えば、電子装置３００）がオーディオ信号を処理する方法であって、外部電子装置（例えば、外部電子装置２２０）と連結を確立する動作、動画イメージ撮影と同時に前記外部電子装置からオーディオ信号を受信する動作、前記撮影される動画イメージに含まれる少なくとも一つの客体（例えば、第１客体２１１ａ、第２客体２１１ｂ及び／又は第３客体２１１ｃ）のうちターゲットとなるターゲット客体を確認する動作、前記ターゲット客体が前記電子装置のディスプレイ上に表示される位置に関する第１位置情報を確認する動作、前記第１位置情報に基づいて前記ターゲット客体の実際位置を推定して、実際位置に関する第２位置情報を生成する動作、及び前記生成された第２位置情報に基づいて前記オーディオ信号を処理する動作を含んでよい。

また、前記ターゲット客体を確認する動作は、前記撮影中の動画イメージに含まれる少なくとも一つの客体を認識する動作、及び前記認識された少なくとも一つの客体のうちターゲット客体を確認する動作を含んでよい。

また、前記ターゲット客体を確認する動作は、タッチ入力を受信する動作、前記受信したタッチ入力の前記ディスプレイ上の位置を確認する動作、及び前記確認されたタッチ入力の位置に基づいて前記ターゲット客体を確認する動作を含んでよい。

また、前記ターゲット客体を確認する動作は、前記少なくとも一つの客体のイメージを分析する動作、及び前記イメージ分析に基づいて前記ターゲット客体を確認する動作を含んでよい。

また、前記第２位置情報を生成する動作は、前記電子装置に含まれたカメラモジュール（例えば、カメラモジュール３２０）の拡大倍率情報、前記カメラモジュールの画角情報を含む付加情報をさらに確認する動作、及び前記確認された付加情報及び前記第１位置情報に基づいて前記第２位置情報を生成する動作を含んでよい。

また、前記第２位置情報は、左右距離又は左右方位角を含み、前記オーディオ信号を処理する動作は、前記オーディオ信号を前記第２位置情報に基づいてパンニング（ｐａｎｎｉｎｇ）して前記オーディオ信号を処理する動作を含んでよい。

また、前記第２位置情報は、高さをさらに含み、前記オーディオ信号を処理する動作は、前記オーディオ信号を前記第２位置情報に基づいて３次元レンダリングして前記オーディオ信号を処理する動作を含んでよい。

また、前記第２位置情報は、前記ターゲット客体の前記電子装置との距離をさらに含み、前記オーディオ信号を処理する動作は、前記第２位置情報に基づいて前記オーディオ信号の音量を調節する動作を含んでよい。

本文書に開示されている様々な実施例に係る電子装置は、様々な形態の装置であってよい。電子装置は、例えば、携帯用通信装置（例えば、スマートフォン）、コンピュータ装置、携帯用マルチメディア装置、携帯用医療機器、カメラ、ウェアラブル装置、又は家電装置を含んでよい。本文書の実施例に係る電子装置は、前述した機器に限定されない。

本文書の様々な実施例及びそれらに使われた用語は、本文書に記載された技術的特徴を特定の実施例に限定しようとするものではなく、当該実施例の様々な変更、均等物、又は代替物を含むものとして理解されるべきである。図面の説明と関連して、類似の又は関連する構成要素に対しては類似の参照符号が用いられてよい。アイテムに対応する名詞の単数型は、関連した文脈において特に断らない限り、前記アイテムを１個又は複数個含んでよい。本文書において、「Ａ又はＢ」、「Ａ及びＢのうち少なくとも一つ」、「Ａ又はＢのうち少なくとも一つ」、「Ａ、Ｂ又はＣ」、「Ａ、Ｂ及びＣのうち少なくとも一つ」、及び「Ａ、Ｂ、又はＣのうち少なくとも一つ」のような語句のそれぞれは、これらの語句のうち該当する語句に一緒に並べられた項目のいずれか一つ、又はそれらのあらゆる可能な組合せを含んでよい。「第１」、「第２」、又は「一番目」又は「二番目」のような用語は、単に、当該構成要素を他の該当構成要素と区別するために使われてよく、当該構成要素を他の側面（例えば、重要性又は順序）において限定するものではない。一つ（例えば、第１）の構成要素が他（例えば、第２）の構成要素に、「機能的に」又は「通信的に」という用語と一緒に又はこのような用語無しで「結合」又は「連結」されるとしたとき、それは、前記一つの構成要素が前記他の構成要素に直接に（例えば、有線で）、無線で、又は第３構成要素を介して連結され得るということを意味する。

本文書の様々な実施例において使われた用語「モジュール」は、ハードウェア、ソフトウェア又はファームウェアとして具現されたユニットを含んでよく、例えば、ロジック、論理ブロック、部品、又は回路のような用語と同じ意味で使われてよい。モジュールは、一体に構成された部品又は一つ又はそれ以上の機能を持つ、前記部品の最小単位又はその一部であってよい。例えば、一実施例によれば、モジュールは、ＡＳＩＣ（ａｐｐｌｉｃａｔｉｏｎ－ｓｐｅｃｉｆｉｃｉｎｔｅｇｒａｔｅｄｃｉｒｃｕｉｔ）の形態で具現されてよい。

本文書の様々な実施例は、機器（ｍａｃｈｉｎｅ）（例えば、電子装置１０１）で読み可能な記憶媒体（ｓｔｏｒａｇｅｍｅｄｉｕｍ）（例えば、内蔵メモリ１３６又は外付メモリ１３８）に保存された一つ以上の命令語を含むソフトウェア（例えば、プログラム１４０）として具現されてよい。例えば、機器（例えば、電子装置１０１）のプロセッサ（例えば、プロセッサ１２０）は、記憶媒体から、保存されている一つ以上の命令語のうち少なくとも一つの命令を呼び出し、それを実行することができる。これは、機器が前記呼び出された少なくとも一つの命令語によって少なくとも一つの機能を果たすように運営されることを可能にする。前記一つ以上の命令語は、コンパイラーによって生成されたコード又はインタープリターによって実行可能なコードを含んでよい。機器で読み可能な記憶媒体は、非一時的（ｎｏｎ－ｔｒａｎｓｉｔｏｒｙ）記憶媒体の形態で提供されてよい。ここで、「非一時的」は、記憶媒体が実在（ｔａｎｇｉｂｌｅ）する装置であり、信号（ｓｉｇｎａｌ）（例えば、電磁気波）を含まないということを意味するだけで、この用語は、データが記憶媒体に半永久的に保存される場合と臨時的に保存される場合とを区分しない。

一実施例によれば、本文書に開示されている様々な実施例に係る方法は、コンピュータプログラム製品（ｃｏｍｐｕｔｅｒｐｒｏｇｒａｍｐｒｏｄｕｃｔ）に含まれて提供されてよい。コンピュータプログラム製品は、商品として販売者及び購買者間に取引されてよい。コンピュータプログラム製品は、機器で読み可能な記憶媒体（例えば、ｃｏｍｐａｃｔｄｉｓｃｒｅａｄｏｎｌｙｍｅｍｏｒｙ（ＣＤ－ＲＯＭ））の形態で配布されたり、又はアプリケーションストア（例えば、ＰｌａｙｓｔｏｒｅＴＭ）を介して又は２つのユーザ装置（例えば、スマートフォン）間に直接、オンラインで配布（例えば、ダウンロード又はアップロード）できる。オンライン配布では、コンピュータプログラム製品の少なくとも一部が、メーカーのサーバー、アプリケーションストアのサーバー、又は中継サーバーのメモリのような、機器で読み可能な記憶媒体に少なくとも一時保存されたり、又は臨時的に生成されてよい。

様々な実施例によれば、前記記述した構成要素のそれぞれの構成要素（例えば、モジュール又はプログラム）は、単数又は複数の個体を含んでよく、複数の個体のうち一部は、別の構成要素に分離配置されてもよい。様々な実施例によれば、前述した当該構成要素のうち一つ以上の構成要素又は動作が省略されたり、又は一つ以上の他の構成要素又は動作が追加されてよい。代替として又は追加として、複数の構成要素（例えば、モジュール又はプログラム）は一つの構成要素として統合されてよい。この場合、統合された構成要素は、前記複数の構成要素のそれぞれの構成要素の一つ以上の機能を、前記統合以前に前記複数の構成要素のうち当構成要素によって行われるのと同一又は類似に行うことができる。様々な実施例によれば、モジュール、プログラム又は他の構成要素によって行われる動作は順次に、並列的に、反復的に、又はヒューリスティックに実行されたり、前記動作のうち一つ以上が他の順序で実行されたり、省略されたり、又は一つ以上の他の動作が追加されてよい。

１００ネットワーク環境
１０１電子装置
１０２電子装置
１０４電子装置
１０８サーバー
１２０プロセッサ
１２１メインプロセッサ
１２３補助プロセッサ
１３０メモリ
１３２揮発性メモリ
１３４不揮発性メモリ
１３６内蔵メモリ
１３８外付メモリ
１４０プログラム
１４２運営体制
１４４ミドルウェア
１４６アプリケーション
１５０入力モジュール
１５５音響出力モジュール
１６０ディスプレイモジュール
１７０オーディオモジュール
１７６センサーモジュール
１７７インターフェース
１７８連結端子
１７９ハプティックモジュール
１８０カメラモジュール
１８８電力管理モジュール
１８９バッテリー
１９０通信モジュール
１９２無線通信モジュール
１９４有線通信モジュール
１９６加入者識別モジュール
１９７アンテナモジュール
１９８第１ネットワーク
１９９第２ネットワーク
２００電子装置
２１０ディスプレイ
２１１イメージ客体
２１２タッチ領域
２２０外部電子装置
２２１第２客体
２３０被写体
３００電子装置
３１０通信モジュール
３２０カメラモジュール
３３０ディスプレイ
３３１入力モジュール
３４０メモリ
３５０プロセッサ
５００識別した客体
５０１第１識別された客体
５０２第２識別された客体
５０３第３識別された客体
９００音像
９０１第４音像
９１０第１音像
９２０第２音像

Claims

電子装置であって、
近距離無線通信を支援する通信モジュールと、
動画イメージを撮影するカメラモジュールと、
前記撮影する動画イメージを表示するディスプレイと、
前記通信モジュール、カメラモジュール及びディスプレイと作動的に（ｏｐｅｒａｔｉｖｅｌｙ）連結されるプロセッサと、
を含み、
前記プロセッサは、
前記通信モジュールを用いて外部電子装置と連結を確立し、
前記動画イメージの撮影と同時に前記外部電子装置からオーディオ信号を受信し、
前記撮影される動画イメージに含まれる少なくとも一つの客体のうちターゲットとなるターゲット客体を確認し、
前記ターゲット客体が前記ディスプレイ上に表示される位置に関する第１位置情報を確認し、
前記第１位置情報に基づいて前記ターゲット客体の実際位置を推定して、実際位置に関する第２位置情報を生成し、
前記生成された第２位置情報に基づいて前記オーディオ信号を処理する
ように設定された電子装置。
前記プロセッサは、
前記撮影中の動画イメージに含まれる少なくとも一つの客体を認識し、
前記認識された少なくとも一つの客体のうちターゲット客体を確認するように設定された、請求項１に記載の電子装置。
前記ディスプレイは、タッチ入力を受信する入力モジュールをさらに含み、
前記プロセッサは、
前記タッチ入力を受信し、
前記受信したタッチ入力の前記ディスプレイ上の位置を確認し、
前記確認されたタッチ入力の位置に基づいて前記ターゲット客体を確認するように設定された、請求項１に記載の電子装置。
前記プロセッサは、
前記少なくとも一つの客体のイメージを分析し、
前記イメージの分析に基づいて前記ターゲット客体を確認するように設定された、請求項１に記載の電子装置。
前記プロセッサは、
前記イメージ分析に基づいて前記外部電子装置のイメージ及び前記少なくとも一つの客体の顔イメージのうち少なくとも一つに対するイメージを認識し、
前記認識されたイメージに基づいて前記ターゲット客体を確認するように設定された、請求項４に記載の電子装置。
前記プロセッサは、
前記カメラモジュールの拡大倍率情報、前記カメラモジュールの画角情報を含む付加情報をさらに確認し、
前記確認された付加情報及び前記第１位置情報に基づいて前記第２位置情報を生成するように設定された、請求項１に記載の電子装置。
前記外部電子装置から前記外部電子装置の位置情報をさらに受信し、
前記プロセッサは、
前記外部電子装置の位置情報に基づいて前記第２位置情報を生成するように設定された、請求項１に記載の電子装置。
センサーをさらに含み、
前記プロセッサは、
前記センサーを用いて前記外部電子装置から発生する信号を感知し、
前記感知した信号に基づいて前記第２位置情報を生成するように設定された、請求項１に記載の電子装置。
前記第２位置情報は、左右距離又は左右方位角を含み、
前記プロセッサは、
前記オーディオ信号を前記第２位置情報に基づいてパンニング（ｐａｎｎｉｎｇ）して前記オーディオ信号を処理するように設定された、請求項１に記載の電子装置。
前記第２位置情報は、上下をさらに含み、
前記プロセッサは、
前記オーディオ信号を前記第２位置情報に基づいて３次元レンダリングして前記オーディオ信号を処理するように設定された、請求項９に記載の電子装置。
前記第２位置情報は、前記ターゲット客体の前記電子装置との距離をさらに含み、
前記プロセッサは、
前記オーディオ信号を、前記実際位置に基づいて前記オーディオ信号の音量を調節するように設定された、請求項９に記載の電子装置。
データを保存し、前記プロセッサと作動的に連結されたメモリをさらに含み、
前記プロセッサは、
前記処理されたオーディオ信号及び前記撮影された動画イメージをエンコードして前記メモリに保存するように設定された、請求項１に記載の電子装置。
電子装置がオーディオ信号を処理する方法であって、
外部電子装置と連結を確立する動作と、
動画イメージの撮影と同時に前記外部電子装置からオーディオ信号を受信する動作；
前記撮影される動画イメージに含まれる少なくとも一つの客体のうちターゲットとなるターゲット客体を確認する動作と、
前記ターゲット客体が前記電子装置のディスプレイ上に表示される位置に関する第１位置情報を確認する動作と、
前記第１位置情報に基づいて前記ターゲット客体の実際位置を推定して、実際位置に関する第２位置情報を生成する動作と、
前記生成された第２位置情報に基づいて前記オーディオ信号を処理する動作と、
を含む方法。
前記ターゲット客体を確認する動作は、
前記撮影中の動画イメージに含まれる少なくとも一つの客体を認識する動作と、
前記認識された少なくとも一つの客体のうちターゲット客体を確認する動作と、
を含む、請求項１３に記載の方法。
前記ターゲット客体を確認する動作は、
タッチ入力を受信する動作と、
前記受信したタッチ入力の前記ディスプレイ上の位置を確認する動作と、
前記確認されたタッチ入力の位置に基づいて前記ターゲット客体を確認する動作と、
を含む、請求項１３に記載の方法。