JP6147603B2 - 音声伝達装置、音声伝達方法 - Google Patents

音声伝達装置、音声伝達方法 Download PDF

Info

Publication number
JP6147603B2
JP6147603B2 JP2013158576A JP2013158576A JP6147603B2 JP 6147603 B2 JP6147603 B2 JP 6147603B2 JP 2013158576 A JP2013158576 A JP 2013158576A JP 2013158576 A JP2013158576 A JP 2013158576A JP 6147603 B2 JP6147603 B2 JP 6147603B2
Authority
JP
Japan
Prior art keywords
sound
transmission device
video
distance
audio transmission
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2013158576A
Other languages
English (en)
Other versions
JP2015032844A (ja
Inventor
大作 若松
大作 若松
堀内 俊治
俊治 堀内
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
KDDI Corp
Original Assignee
KDDI Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by KDDI Corp filed Critical KDDI Corp
Priority to JP2013158576A priority Critical patent/JP6147603B2/ja
Publication of JP2015032844A publication Critical patent/JP2015032844A/ja
Application granted granted Critical
Publication of JP6147603B2 publication Critical patent/JP6147603B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Headphones And Earphones (AREA)
  • Stereophonic System (AREA)
  • Circuit For Audible Band Transducer (AREA)

Description

本発明は、超音波成分を含む音声をヘッドホン又はイヤホンにより聴取する音声伝達装置、音声伝達方法に関するものである。
従来から、ヘッドホンやイヤホンが音楽を聞いたり通話を行ったりする場面で利用されている。しかし、ヘッドホン又はイヤホンを用いて音声を聴取すると頭の中で音声が鳴っているような不自然な聞こえ方をしてしまい、音場の臨場感がなかった。
ヘッドホンやイヤホンを用いて、立体音場を擬似的に補正する技術が、特許文献1及び特許文献2に開示されている。
しかし、特許文献1及び特許文献2に開示されている技術では、スピーカからの音が必須であるため、周りに聞こえない聴取スタイルは実現できなかった。
また、特許文献3には、携帯音楽プレイヤに外付けするヘッドホン端子に並列接続する超音波放射体を追加する技術が提案されている。この特許文献3の技術は、超高音域を再生して音の広がり感や、明瞭度を改善し、音質をよくするものである。したがって、音像を定位することに関しては、何ら示唆されていない。なお、仮に、特許文献3の技術を実用化したとしても、特許文献3の技術では、携帯音楽プレイヤに超音波放射装置をヘッドホンのコードや携帯音楽プレイヤのヘッドホン端子部に配置するものである。したがって、音像を定位させるための超音波放射体がユーザの正面に必ずしも配置されず、適切な音像定位の効果は得られない。
さらに、ヘッドホン又はイヤホンは、自分好みの形態等がある他、ハイレゾリューション・ハイサンプリング・サウンドに対応していないものも多い。したがって、従来は、利用するヘッドホン又はイヤホンによっては、ハイレゾリューション・ハイサンプリング・サウンドの恩恵を受けることができなかった。
特開昭61−219300号公報 特開2010−193105号公報 特開2011−77991号公報
本発明の課題は、超音波成分を含むハイレゾリューション・ハイサンプリング・サウンドを再生する場合に、利用するヘッドホン又はイヤホンによらずに、かつ、周囲に音声を聞かれることなく、音像を適切な位置に定位させることができる音声伝達装置、音声伝達方法を提供することである。
本発明は、上記の課題を解決するために、以下の事項を提案している。なお、理解を容易にするために、本発明の実施形態に対応する符号を付して説明するが、これに限定されるものではない。
(1)本発明は、超音波成分を含む音声をヘッドホン(10)又はイヤホンにより聴取させる音声伝達装置であって、音声から非可聴高周波帯域を抽出した音声を出力する少なくとも1つのスピーカ(104,204,304,404)と、ヘッドホン又はイヤホンへ出力される信号を、受聴者と前記スピーカとの間の音響経路の伝達関数を用いて畳み込む音響処理部(105,205,305,405)と、を備える音声伝達装置(100,200,300,400)を提案している。
この発明によれば、少なくとも1つのスピーカは、音声から非可聴高周波帯域を抽出した音声を出力する。音響処理部は、ヘッドホン又はイヤホンへ出力される信号を、受聴者と前記スピーカとの間の音響経路の伝達関数を用いて畳み込む。したがって、音声伝達装置は、超音波成分を含むハイレゾリューション・ハイサンプリング・サウンドを再生する場合に、利用するヘッドホン又はイヤホンによらずに、かつ、周囲に音声を聞かれることなく、音像を適切な位置に定位させることができる。また、利用するヘッドホン又はイヤホンによらずに、ハイレゾリューション・ハイサンプリング・サウンドの効果を享受できる。
(2)本発明は、(1)に記載の音声伝達装置において、前記音響処理部(205,305,405)を制御する制御部(209,309,409)を備えること、を特徴とする音声伝達装置(200,300,400)を提案している。
この発明によれば、音響処理部を制御する制御部を備える。したがって、音響処理部の動作を状況に合わせて適切に制御することが可能となる。
(3)本発明は、(2)に記載の音声伝達装置において、受聴者と前記スピーカ(204,304,404)との距離及び/又は方向を測定する少なくとも1つのセンサ(210,310,410)を備え、前記制御部(209,309,409)は、前記センサから得られた距離及び/又は方向に応じて前記音響処理部(205,305,405)を制御すること、を特徴とする音声伝達装置(200,300,400)を提案している。
この発明によれば、少なくとも1つのセンサは、受聴者とスピーカとの距離及び/又は方向を測定する。制御部は、センサから得られた距離及び/又は方向に応じて音響処理部を制御する。したがって、音声伝達装置は、受聴者との位置関係を自動的に把握して、自動的に適切な伝達関数を用いて処理を行うことができ、より簡単かつ的確に音像の定位を行える。
(4)本発明は、(2)又は(3)に記載の音声伝達装置において、出力する音声に同期する映像を作成する映像作成部(309)と、前記映像作成部が作成した映像を表示する表示部(311)と、を備えることを特徴とする音声伝達装置(300)を提案している。
この発明によれば、映像作成部は、出力する音声に同期する映像を作成する。表示部は、映像作成部が作成した映像を表示する。したがって、音声伝達装置は、音声に同期した映像を受聴者に視聴させることが可能であり、音像を定位させる効果をより高めることができる。
(5)本発明は、(2)から(4)までのいずれか1項に記載の音声伝達装置において、送話側から送信される映像信号であるビデオ通話信号を処理するビデオ通話信号処理部(412)と、前記ビデオ通話信号処理部が処理した映像信号を表示する表示部(411)と、を備え、前記制御部(409)は、前記ビデオ通話信号処理部が処理した映像信号を基に送話側のカメラと送話者との距離を推定した結果に基づいて前記音響処理部(405)を制御すること、を特徴とする音声伝達装置(400)を提案している。
この発明によれば、ビデオ通話信号処理部は、送話側から送信される映像信号であるビデオ通話信号を処理する。表示部は、ビデオ通話信号処理部が処理した映像信号を表示する。制御部は、ビデオ通話信号処理部が処理した映像信号を基に送話側のカメラと送話者との距離を推定した結果に基づいて音響処理部を制御する。したがって、音声伝達装置は、音声に同期した映像を受聴者に視聴させることが可能であり、音像を定位させる効果をより高めることができる。
(6)本発明は、(2)から(5)までのいずれか1項に記載の音声伝達装置において、前記制御部(209,309,409)は、予め設定されている複数の伝達関数の中から畳み込みに用いる伝達関数を選択して前記音響処理部(205,305,405)を制御すること、を特徴とする音声伝達装置(200,300,400)を提案している。
この発明によれば、制御部は、予め設定されている複数の伝達関数の中から畳み込みに用いる伝達関数を選択して音響処理部を制御する。したがって、音像を正しい位置に定位させるために適切な伝達関数を用いることができ、音像を定位させる効果をより高めることができる。
(7)本発明は、(2)から(5)までのいずれか1項に記載の音声伝達装置において、前記制御部(209,309,409)は、予め正規化された伝達関数と、受聴者と前記スピーカ(204,304,404)との距離及び/又は方向を参照して、畳み込みに用いる伝達関数を決定すること、を特徴とする音声伝達装置(200,300,400)を提案している。
この発明によれば、制御部は、予め正規化された伝達関数と、受聴者とスピーカとの距離及び/又は方向を参照して、畳み込みに用いる伝達関数を決定する。したがって、伝達関数の選択をより簡単かつ適切に行うことができる。
(8)本発明は、超音波成分を含む音声をヘッドホン(10)又はイヤホンにより聴取させる音声伝達方法であって、音声から非可聴高周波帯域を抽出した音声を少なくとも1つのスピーカ(104,204,304,404)から出力し、音響処理部(105,205,305,405)によって、ヘッドホン又はイヤホンへ出力される信号を、受聴者と前記スピーカとの間の音響経路の伝達関数を用いて畳み込む、音声伝達方法を提案している。
この発明によれば、音声から非可聴高周波帯域を抽出した音声を少なくとも1つのスピーカから出力する。音響処理部によって、ヘッドホン又はイヤホンへ出力される信号を、受聴者と前記スピーカとの間の音響経路の伝達関数を用いて畳み込む。したがって、この音声伝達方法を用いる音声伝達装置は、超音波成分を含むハイレゾリューション・ハイサンプリング・サウンドを再生する場合に、利用するヘッドホン又はイヤホンによらずに、かつ、周囲に音声を聞かれることなく、音像を適切な位置に定位させることができる。また、利用するヘッドホン又はイヤホンによらずに、ハイレゾリューション・ハイサンプリング・サウンドの効果を享受できる。
本発明によれば、音声伝達装置は、超音波成分を含むハイレゾリューション・ハイサンプリング・サウンドを再生する場合に、利用するヘッドホン又はイヤホンによらずに、かつ、周囲に音声を聞かれることなく、音像を適切な位置に定位させることができる。
本発明による音声伝達装置100の第1実施形態における使用状態を示す図である 音声伝達装置100の内部構成を示すブロック図である。 伝達関数の設定を説明する図である。 本発明による音声伝達装置200の第2実施形態における使用状態を示す図である。 音声伝達装置200の内部構成を示すブロック図である。 本発明による音声伝達装置300の第3実施形態における使用状態を示す図である。 音声伝達装置300の内部構成を示すブロック図である。 本発明による音声伝達装置400の第4実施形態における使用状態を示す図である。 音声伝達装置400の内部構成を示すブロック図である。
以下、図面を用いて、本発明の実施形態について詳細に説明する。
なお、本実施形態における構成要素は適宜、既存の構成要素等との置き換えが可能であり、また、他の既存の構成要素との組み合わせを含む様々なバリエーションが可能である。したがって、本実施形態の記載をもって、特許請求の範囲に記載された発明の内容を限定するものではない。
(第1実施形態)
図1は、本発明による音声伝達装置100の第1実施形態における使用状態を示す図である。
図2は、音声伝達装置100の内部構成を示すブロック図である。
なお、図1及び図2を含め、以下に示す各図は、模式的に示した図であり、各部の大きさ、形状は、理解を容易にするために、適宜誇張して示している。
音声伝達装置100は、ヘッドホン10が接続されて用いられることにより、非可聴と言われる高周波帯域成分を有する高音質なハイレゾリューション・ハイサンプリング・サウンドを聴取可能な装置である。
音声伝達装置100は、ハイパスフィルタ(HPF)101と、DA変換部(DA)102と、アンプ103と、高周波用スピーカ104と、DSP(digital signal processing)105と、DA106と、アンプ107と、端子部108とを備えている。
ハイパスフィルタ(HPF)101は、可聴音と非可聴な高周波帯域成分とを含むハイレゾリューション・ハイサンプリング・サウンドの音声データから、超音波成分を抽出し、DA102へ伝える。
DA変換部(DA)102は、HPF101から得たデジタル信号をアナログ信号に変換し、アンプ103に伝える。
アンプ103は、DA102から得た信号を増幅して、高周波用スピーカ104へ伝える。
高周波用スピーカ104は、超音波領域(例えば、周波数20kHz以上)の音声を出力可能なスピーカである。高周波用スピーカ104は、上述のHPF101を介した音声信号を出力するので、音源に含まれる可聴範囲外のいわゆる超音波成分を出力する。
DSP(digital signal processing)105は、ヘッドホン10へ出力される信号を、受聴者と前記スピーカとの間の音響経路の伝達関数を用いて畳み込む音響処理部である。DSP105による処理については、後述する。
DA106は、DSP105から得たデジタル信号をアナログ信号に変換し、アンプ107に伝える。
アンプ107は、DA106から得た信号を増幅して、端子部108を介してヘッドホン10へ伝える。
ここで、高周波用スピーカ104から出力する音量と、ヘッドホン10から出力する音量とが連動するように、アンプ103及びアンプ107の利得を調整する。図示しないが、音量調整スイッチや制御部(ソフトウェア制御)から音量を調整可能とする。高周波用スピーカ104の特性に合わせて予め各アンプの利得差を調整させておいてもよいし、受聴者によりヘッドホン10のアンプ107と高周波用スピーカ104のアンプ103との利得差を設定させてもよい。
本実施形態では、アンプ103及びアンプ107は、ヘッドホン10からの可聴音と同程度の音圧の超音波を高周波用スピーカ104から出力させるようにそれぞれが調整されている。これにより、本実施形態の音声伝達装置100は、超高周波を受聴者に伝えることができ、ヘッドホン10から出力する音声に高周波用スピーカ104から出力される非可聴な音声が重ねられる。
端子部108は、ヘッドホン10の端子部11を接続するいわゆるヘッドホンジャックである。
ヘッドホン10は、高周波用スピーカ104の音とヘッドホン10の音を重ねあわせ可能なように、密閉型よりも外部の音を遮断しないオープン型、より好ましくはフルオープン型のヘッドホンが望ましい。
ここで、DSP105が行う音響処理について説明する。
DSP105には、異なる位置の音源毎の伝達関数が設定されるか、又は、異なる位置の音源毎の伝達関数を正規化した関数が記憶されている。
図3は、伝達関数の設定を説明する図である。図3(a)は、DSP105に設定する伝達関数を測定する状態を説明する図であり、現実の音場を示している。図3(b)は、図3(a)に示した測定により得られた伝達関数を用いて畳み込みを行った音声をヘッドホン10により聴取する状態を示す図であり、仮想の音場を示している。
伝達関数を測定するために、図3(a)に示すようにダミーヘッドDにマイク20,20,20を設置する。マイク20は、ダミーヘッドDの右耳部分に設置し、マイク20は、ダミーヘッドDの中央部に埋め込み、マイク20は、ダミーヘッドDの左耳部分に設置する。この状態で、ダミーヘッドDの前に1つの音源を置き、その伝達関数を測定する。そして、音源を様々な位置に移動させ、その位置での伝達関数を測定することを繰り返す。こうすることで、様々な音源位置での伝達関数を得ることができる。
上述のようにして得られた複数の伝達関数の中から、音声を聴取するときの条件、すなわち、音源と受聴者との間の「距離及び方向」に近い条件下で測定された伝達関数を選択して、予め設定する。例えば、図3(b)に示した状態は、上記図3(a)に示した位置で測定した伝達関数を用いて音声の聴取を行う状態である。図3(b)中で、Hは音場の伝達関数を示し、Mは、マイクの伝達関数を示し、Pは、ヘッドホンの伝達関数を示す。本実施形態では、予め設定した伝達関数を用いて畳み込みを行った音声信号を聴取することにより、ヘッドホン10により音声を聴取している時に、仮想音源の音像が、設定した伝達関数と対応する位置に定位する。また、この仮想音源の音像に近い位置に、音声伝達装置100の高周波用スピーカ104を設置することにより、高周波用スピーカ104から受聴者に非可聴な高周波帯域成分が伝わる。この高周波帯域成分は、耳から受聴者に伝わる他、受聴者の皮膚からも伝わり、高周波用スピーカ104の位置を仮想音源の音像の位置として認識可能とする。
ここで、伝達関数の選択は、例えば、受聴者と本装置のスピーカとの間の「距離及び方向」を入力パラメータとし、それに応じた音響経路の伝達関数を選択するようにするとよい。
また、求めた伝達関数群を使用しやすいように正規化して、音源とダミーヘッド間の「距離及び方向」を入力とすることでその経路を伝達関数として表すようにしてもよい。
また、音声伝達装置100を用いて視聴される環境(パームトップ機器/デスクトップ機器/TV画面サイズ等)を想定して伝達関数の入力パラメータの「距離」と「方向」を予め設定しておいてもよいし、受聴者により伝達関数の入力パラメータである「距離」と「方向」を調整できるようにしてもよい。
以上説明したように、第1実施形態によれば、音声伝達装置100は、非可聴高周波帯域を抽出した音声を出力する高周波用スピーカ104を備え、さらに、ヘッドホン10に伝わる音声を伝達関数で畳み込むDSP105を備えるので、利用するヘッドホンによらずに、かつ、周囲に音声を聞かれることなく、頭の中でなっているような音場とならず装置の方向に(前方に)音像を定位させることができる。また、ハイレゾリューション・ハイサンプリング・サウンドに対応していない高周波成分の出力が不足するヘッドホンを使用しても高周波用スピーカ104から高周波成分が出力されヘッドホン出力音と重なり高周波成分が補完される。よって、利用するヘッドホンによらずに、超音波成分を含むハイレゾリューション・ハイサンプリング・サウンドを有効に利用でき、音質の向上等のハイレゾリューション・ハイサンプリング・サウンドの恩恵を享受できる。
(第2実施形態)
図4は、本発明による音声伝達装置200の第2実施形態における使用状態を示す図である。
図5は、音声伝達装置200の内部構成を示すブロック図である。
第2実施形態の音声伝達装置200は、第1実施形態の音声伝達装置100の構成に加えて、制御部209と、センサ210とをさらに備えている。
なお、第2実施形態は、制御部209と、センサ210とをさらに備える他は、第1実施形態と同様な形態をしている。よって、前述した第1実施形態と同様の機能を果たす部分には、末尾に同一の符号を付して、重複する説明を適宜省略する。
制御部209は、センサ210が検出した受聴者の距離及び/又は方向に応じてDSP205を制御する。すなわち、制御部209は、センサ210が検出した受聴者の距離及び/又は方向を伝達関数の入力パラメータに用いてDSP205を制御することで常に適切な音場を構成する。
センサ210は、受聴者の距離及び/又は方向を検出する。センサ210としては、例えば、距離画像センサやカメラ映像から得られる顔検出による顔の向きを推定する技術等、公知の様々な技術を利用できる。
センサ210は、例えば、ユーザの姿がカメラ画角のどの範囲まで撮像されているかによって、カメラ(センサ)からユーザまでの距離を推測する方法としてもよい。例えば、ほとんどユーザしか写っていない場合はセンサからユーザまでの距離30cmと推測し、背景が画角の半分を占めるようなら1mと推測し、全身が映るようなら3mと推測することができる。
なお、センサ210の機能として、距離センサ機能又は方向センサ機能のうち、どちらかの機能を有しない、又は、センサ210から計測結果を得られない場合は、本装置が視聴される環境(パームトップ機器/デスクトップ機器/TV画面サイズ等)を想定した「距離」又は「方向」を予め設定して用いるとよい。
第2実施形態によれば、センサ210が受聴者の距離及び/又は方向を検出し、その検出結果に応じて制御部209がDSP205を制御するので、受聴者の位置を常に正確に把握して、適切な伝達関数を利用できる。よって、第2実施形態の音声伝達装置200は、常に適切な仮想音場を提供できる。
(第3実施形態)
図6は、本発明による音声伝達装置300の第3実施形態における使用状態を示す図である。
図7は、音声伝達装置300の内部構成を示すブロック図である。
第3実施形態の音声伝達装置300は、第2実施形態の音声伝達装置200の構成に加えて、表示部311をさらに必須の構成として備えている。なお、上述した第1実施形態の音声伝達装置100及び第2実施形態の音声伝達装置200については、表示部を備えた例を例示しているが、これは必須ではない。
なお、第3実施形態は、表示部311を備え、また、制御部309が表示部311の制御を行う他は、第1実施形態及び第2実施形態と同様な形態をしている。よって、前述した第1実施形態及び第2実施形態と同様の機能を果たす部分には、末尾に同一の符号を付して、重複する説明を適宜省略する。
制御部309は、音声信号に基づいて、擬似アニメーションを作成する映像作成部としての機能をさらに有している。具体的には、制御部309は、デジタル音声信号をローパスフィルタで音声の包絡線を得て、その包絡線のレベルを制御信号とし擬似アニメーションのサイズを変更しながら表示部311に作成した疑似アニメーションを表示する。これにより、表示部311には、出力される音声の音量及びビートのバランス位置に応じて大きさと位置が変化するアニメーションが表示される。例えば円(○)の径をビートに応じて変化させる他、円の中心を音のバランスに応じて左右に移動させる。受聴者は、表示部311を見ながら音声を聴くことにより、音が出力されそうな視覚刺激を与えられ、その方向に音像を定位させる効果をさらに高めることができる。
なお、図示しないが、マルチチャネル音源の信号の場合は、前方のチャネル成分から音像位置を計算し擬似アニメーションの表示位置を変更しながら表示させるとよい。
以上説明したように、第3実施形態によれば、制御部309は、音声信号に基づいて、擬似アニメーションを作成して、それを表示部311に表示するので、受聴者に対して音像位置を定位させる効果をより高めることができる。
(第4実施形態)
図8は、本発明による音声伝達装置400の第4実施形態における使用状態を示す図である。
図9は、音声伝達装置400の内部構成を示すブロック図である。
第4実施形態の音声伝達装置400は、第2実施形態の音声伝達装置200の構成に加えて、表示部411と、デコーダ412とをさらに必須の構成として備えている。
なお、第4実施形態は、表示部411とデコーダ412とを備え、また、制御部409が行う制御内容が異なる他は、第1実施形態及び第2実施形態と同様な形態をしている。よって、前述した第1実施形態及び第2実施形態と同様の機能を果たす部分には、末尾に同一の符号を付して、重複する説明を適宜省略する。
第4実施形態の音声伝達装置400は、ビデオ通話を行うことができる装置である。
デコーダ412は、送話側から符号化されて送信されるビデオ通話信号を復号して再生可能な映像信号に変換する処理を行うビデオ通話信号処理部である。
なお、図9では、デジタルビデオ信号とデジタル音声信号とが別々に入力可能な形態として示されている。しかし、デジタルビデオ信号には、音声も含まれているので、ビデオ通話を行うときには、デコーダ412が音声データをHPF401,DSP405,制御部409へ伝える。また、映像を取り扱わない場合には、第1実施形態及び第2実施形態と同様に音声データのみを取り扱うこともできる。
制御部409は、デコーダ412から得た映像を表示部411に表示させる。また、制御部409は、デコーダ412によりデコードされたビデオ信号の映像スライスを解析し、相手の姿が画角のどの範囲まで撮像されているかにより、送信側のカメラから相手までの距離を推測する。例えば、制御部409は、ほとんど相手しか写っていない場合は撮影距離を30cmと推測し、背景が画角の半分を占めるようなら1mと推測し、全身が映るようなら3mと推測する。制御部409は、推測した距離を伝達関数の入力パラメータのうち「距離」に反映して用いて、DSP405を制御する。これにより、映像と伝達関数との整合性が高くなり、送信者がカメラから離れれば、より遠くから声が聞こえるといった、送信者の位置に応じた音像の移動を感じることができる音声効果を受聴者に与えることができる。
表示部411は、ビデオ通話の相手の映像を表示しており、制御部409は、その映像に同期したハイレゾリューション・ハイサンプリング・サウンドをヘッドホン10から出力させ、かつ、高周波用スピーカ404からもハイレゾリューション・ハイサンプリング・サウンドの超音波成分が出力される。
上述したように、表示部411には、ビデオ通話相手(送信者)が会話をしている映像が表示される。音声伝達装置400は、音が発生しそうな映像である、相手の姿を見せながら聴取させることで、その音場が相手の姿に定位される心理聴覚(腹話術効果)が得られ、音像を定位させる効果をさらに高めることができる。
なお、本実施形態では、ビデオ通話相手(送信者)のカメラからの距離に応じて音像の距離を変化させる例を挙げて説明したが、送信者の姿を表示部411に表示するだけであってもよい。
以上説明したように、第4実施形態によれば、制御部409は、ビデオ通話の相手の映像を表示させる。よって、音声伝達装置400は、受聴者に対して音像位置を定位させる効果をより高めることができる。
なお、音声伝達装置の処理をコンピュータ読み取り可能な記録媒体に記録し、この記録媒体に記録されたプログラムを音声伝達装置に読み込ませ、実行することによって本発明の音声伝達装置、音声伝達方法を実現することができる。ここでいうコンピュータとは、OSや周辺装置等のハードウェアを含む。
また、「コンピュータ」は、WWW(World Wide Web)システムを利用している場合であれば、ホームページ提供環境(又は表示環境)も含むものとする。また、上記プログラムは、このプログラムを記憶装置等に格納したコンピュータから、伝送媒体を介して、又は、伝送媒体中の伝送波により他のコンピュータに伝送されてもよい。ここで、プログラムを伝送する「伝送媒体」は、インターネット等のネットワーク(通信網)や電話回線等の通信回線(通信線)のように情報を伝送する機能を有する媒体のことをいう。
また、上記プログラムは、前述した機能の一部を実現するためのものであってもよい。さらに、前述した機能をコンピュータにすでに記録されているプログラムとの組み合せで実現できるもの、いわゆる差分ファイル(差分プログラム)であってもよい。
以上、この発明の実施形態につき、図面を参照して詳述してきたが、具体的な構成はこの実施形態に限られるものではなく、この発明の要旨を逸脱しない範囲の設計等も含まれる。
(変形形態)
(1)各実施形態において、ヘッドホンを用いる例を挙げて説明を行ったが、ここでヘッドホンとは、広い意味に解釈すべきであり、例えば、イヤホンもこの広義の意味のヘッドホンに含まれるものである。よって、例えば、上述した各実施形態のヘッドホンは、イヤホンに置き換えてもよい。
(2)各実施形態において、高周波用スピーカ104,204,304,404から出力する音は、周囲に聞かれないように超音波帯域としたが、これに限らず、フルレンジの周波数帯域の音声を出力してもよい。
(3)各実施形態において、高周波用スピーカ104,204,304,404を1つ有する例を挙げて説明した。これに限らず、例えば、マルチチャネルのスピーカを用意し、スピーカ間に音像を定位させるように音声を出力してもよい。
(4)各実施形態において、ハイパスフィルタ(HPF)101,201,301,401により可聴域をカットした音声データを高周波用スピーカ104,204,304,404から出力する例を挙げて説明した。これに限らず、例えば、スピーカ自体を超音波領域しか出力性能のないものとし、ハイパスフィルタを不要とした構成としてもよい。
(5)各実施形態において、ヘッドホン10は、オープン型のヘッドホンが望ましいとして説明を行った。これに限らず、例えば、密閉型のヘッドホンを用いても、伝達関数を適切に設計することで目的とする効果を得ることができる。この理由としては、超音波は、耳を介して知覚される成分の他、耳以外の人体(皮膚)を介して知覚される成分もあるからである。
(6)各実施形態において、ヘッドホン10は、オープン型のヘッドホンが望ましいとして説明を行った。上述したように、超音波は、耳を介して知覚される成分の他、耳以外の人体(皮膚)を介して知覚される成分もある。よって、例えば、密閉型のヘッドホンとして、高周波用スピーカ104,204,304,404の出力音量を調整可能とし高周波成分量を調整可能としてもよい。
(7)各実施形態において、高周波用スピーカ104,204,304,404の出力をDSP105,205,305,405の前段から得る例を挙げて説明した。これに限らず、例えば、DSPにより加工処理した後の音声信号を高周波用スピーカから出力するようにしてもよい。
(8)第2実施形態から第4実施形態において、センサ210,310,410は、カメラを用いる例を挙げて説明した。これに限らず、例えば、センサは、超音波センサを用いてもよい。センサを超音波センサとする場合には、音声信号を聞き取るための聴覚に影響しないよう有意パルス間隔を長めにとるか、100kHz以上の周波数を用いるとよい。
また、センサ210,310,410は、複数の異なる方式又は同一方式のセンサを組み合わせて精度を向上させてもよい。
(9)第4実施形態において、制御部409は、デコーダ412によりデコードされたビデオ信号の映像スライスを解析し、相手の姿が画角のどの範囲まで撮像されているかにより、送信側のカメラから相手までの距離を推測する例を挙げて説明した。
これに限らず、例えば、制御部409は、送信者の画像から顔認識をさせて目鼻口の間隔の広さから送信者とカメラとの距離を推測してもよい。
また、送信者の装置に距離センサを設けて送信者とカメラとの距離を測定し、その距離情報のデータを送受信してもよい。そして、制御部409は、伝達関数の入力パラメータのうち「距離」について受信した距離情報を加味してDSP405を制御するとよい。
なお、第1実施形態から第4実施形態及び変形形態は、適宜組み合わせて用いることもできるが、詳細な説明は省略する。
10 ヘッドホン
11 端子部
20C,20L,20R マイク
100,200,300,400 音声伝達装置
101,201,301,401 ハイパスフィルタ(HPF)
102,202,302,402 DA変換部(DA)
103,203,303,403 アンプ
104,204,304,404 高周波用スピーカ
105,205,305,405 音響処理部(DSP)
106,206,306,406 DA変換部(DA)
107,207,307,407 アンプ
108,208,308,408 端子部
209,309,409 制御部
210,310,410 センサ
311,411 表示部
412 デコーダ

Claims (4)

  1. 超音波成分を含む音声をヘッドホン又はイヤホンにより聴取させる音声伝達装置であって、
    音声から非可聴高周波帯域を抽出した音声を受聴者の耳および皮膚に伝達するよう出力する少なくとも1つのスピーカと、
    ヘッドホン又はイヤホンへ出力される信号を、ダミーヘッドと音源との間の音響経路の伝達関数を用いて畳み込む音響処理部と、
    受聴者と前記スピーカの距離及び/又は方向に応じて、前記スピーカの位置に音像を定位させる前記伝達関数を、予め設定されている複数の伝達関数の中から選択して決定する前記音響処理部を制御する制御部と、
    を備えることを特徴とする音声伝達装置。
  2. 請求項に記載の音声伝達装置において、
    受聴者と前記スピーカとの距離及び/又は方向を検出する少なくとも1つのセンサを備え、
    前記制御部は、前記センサから得られた距離及び/又は方向に応じて前記音響処理部を制御すること、
    を特徴とする音声伝達装置。
  3. 請求項又は請求項に記載の音声伝達装置において、
    出力する音声に同期する新たな疑似アニメーション映像を作成する映像作成部と、
    前記映像作成部が作成した映像を表示する表示部と、
    を備えることを特徴とする音声伝達装置。
  4. 請求項1又は請求項2に記載の音声伝達装置において、
    送話側から送信される映像信号であるビデオ通話信号を処理するビデオ通話信号処理部と、
    前記ビデオ通話信号処理部が処理した映像信号を表示する表示部と、
    を備え、
    前記制御部は、前記ビデオ通話信号処理部が処理した映像信号を基に送話側のカメラと送話者との距離を推定した結果に基づいて受聴者とスピーカとの前記距離に加えて前記音響処理部を制御すること、
    を特徴とする音声伝達装置。
JP2013158576A 2013-07-31 2013-07-31 音声伝達装置、音声伝達方法 Active JP6147603B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2013158576A JP6147603B2 (ja) 2013-07-31 2013-07-31 音声伝達装置、音声伝達方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2013158576A JP6147603B2 (ja) 2013-07-31 2013-07-31 音声伝達装置、音声伝達方法

Publications (2)

Publication Number Publication Date
JP2015032844A JP2015032844A (ja) 2015-02-16
JP6147603B2 true JP6147603B2 (ja) 2017-06-14

Family

ID=52517868

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013158576A Active JP6147603B2 (ja) 2013-07-31 2013-07-31 音声伝達装置、音声伝達方法

Country Status (1)

Country Link
JP (1) JP6147603B2 (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5997806B1 (ja) * 2015-06-10 2016-09-28 株式会社トクミ 電気音響変換器
JP6790654B2 (ja) * 2016-09-23 2020-11-25 株式会社Jvcケンウッド フィルタ生成装置、フィルタ生成方法、及びプログラム
CN111050271B (zh) * 2018-10-12 2021-01-29 北京微播视界科技有限公司 用于处理音频信号的方法和装置
US20220191638A1 (en) * 2020-12-16 2022-06-16 Nvidia Corporation Visually tracked spatial audio
WO2023058466A1 (ja) * 2021-10-06 2023-04-13 ソニーグループ株式会社 情報処理装置およびデータ構造

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08181962A (ja) * 1994-12-22 1996-07-12 Hitachi Ltd 音像定位方法および音像定位制御装置およびテレビ会議システム
JP3810110B2 (ja) * 1995-09-08 2006-08-16 富士通株式会社 線型予測係数を用いた立体音響処理装置
DE69637736D1 (de) * 1995-09-08 2008-12-18 Fujitsu Ltd Dreidimensionaler akustischer Prozessor mit Anwendung von linearen prädiktiven Koeffizienten
JP2003248837A (ja) * 2001-11-12 2003-09-05 Mega Chips Corp 画像作成装置、画像作成システム、音声生成装置、音声生成システム、画像作成用サーバ、プログラム、および記録媒体
JP4009660B2 (ja) * 2005-11-01 2007-11-21 株式会社アクション・リサーチ 陽電子放射断層撮像装置とそれに用いる振動呈示装置
JP2008113118A (ja) * 2006-10-05 2008-05-15 Sony Corp 音響再生システムおよび音響再生方法
JP4780119B2 (ja) * 2008-02-15 2011-09-28 ソニー株式会社 頭部伝達関数測定方法、頭部伝達関数畳み込み方法および頭部伝達関数畳み込み装置
JP5380945B2 (ja) * 2008-08-05 2014-01-08 ヤマハ株式会社 音響再生装置およびプログラム
JP2010050532A (ja) * 2008-08-19 2010-03-04 Sharp Corp 身体装着型ノイズキャンセリング指向性スピーカ
JP2011077991A (ja) * 2009-10-01 2011-04-14 Toshitaka Takei ヘッドフォンに外付けする超音波放射装置
JP2011160182A (ja) * 2010-02-01 2011-08-18 Toshitaka Takei 超音波放射体を筺体に直付けしたヘッドフォン

Also Published As

Publication number Publication date
JP2015032844A (ja) 2015-02-16

Similar Documents

Publication Publication Date Title
US8855341B2 (en) Systems, methods, apparatus, and computer-readable media for head tracking based on recorded sound signals
JP5526042B2 (ja) 音響システム及びサウンドを提供する方法
JP5665134B2 (ja) ヒアリングアシスタンス装置
EP2337375B1 (en) Automatic environmental acoustics identification
US9071900B2 (en) Multi-channel recording
JP6824155B2 (ja) 音声再生システム及び方法
JP5497217B2 (ja) ヘッドホーン補正のためのシステム
WO2017134973A1 (ja) 音響出力装置、音響出力方法、プログラム、音響システム
JP6147603B2 (ja) 音声伝達装置、音声伝達方法
WO2015163031A1 (ja) 情報処理装置、情報処理方法及びプログラム
US10555108B2 (en) Filter generation device, method for generating filter, and program
US10206053B1 (en) Extra-aural headphone device and method
US11523244B1 (en) Own voice reinforcement using extra-aural speakers
WO2016167007A1 (ja) 頭部伝達関数選択装置、頭部伝達関数選択方法、頭部伝達関数選択プログラム、音声再生装置
CN112956210B (zh) 基于均衡滤波器的音频信号处理方法及装置
US20230143588A1 (en) Bone conduction transducers for privacy
JP2006352728A (ja) オーディオ装置
US11853642B2 (en) Method and system for adaptive volume control
US11451907B2 (en) Techniques combining plural head-related transfer function (HRTF) spheres to place audio objects
JP2010178373A (ja) 頭部伝達関数測定方法、頭部伝達関数畳み込み方法および頭部伝達関数畳み込み装置
JP2022019619A (ja) 聴覚デバイスを含む電子デバイスにおける方法
JP2023080769A (ja) 再生制御装置、頭外定位処理システム、及び再生制御方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20160202

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20160923

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20161011

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20161207

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20170516

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20170517

R150 Certificate of patent or registration of utility model

Ref document number: 6147603

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150