JP6445407B2 - 音生成装置、音生成方法、プログラム - Google Patents
音生成装置、音生成方法、プログラム Download PDFInfo
- Publication number
- JP6445407B2 JP6445407B2 JP2015148269A JP2015148269A JP6445407B2 JP 6445407 B2 JP6445407 B2 JP 6445407B2 JP 2015148269 A JP2015148269 A JP 2015148269A JP 2015148269 A JP2015148269 A JP 2015148269A JP 6445407 B2 JP6445407 B2 JP 6445407B2
- Authority
- JP
- Japan
- Prior art keywords
- sound
- channel
- unit
- signal
- enhancement
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 15
- 230000005236 sound signal Effects 0.000 claims description 51
- 238000012545 processing Methods 0.000 claims description 36
- 238000000605 extraction Methods 0.000 claims description 16
- 230000015572 biosynthetic process Effects 0.000 claims description 14
- 238000003786 synthesis reaction Methods 0.000 claims description 14
- 238000001228 spectrum Methods 0.000 claims description 9
- 239000000284 extract Substances 0.000 claims description 8
- 238000012546 transfer Methods 0.000 claims description 7
- 230000002194 synthesizing effect Effects 0.000 claims description 5
- 230000007613 environmental effect Effects 0.000 description 17
- 238000010586 diagram Methods 0.000 description 11
- 230000006870 function Effects 0.000 description 11
- 230000003595 spectral effect Effects 0.000 description 7
- 238000004364 calculation method Methods 0.000 description 4
- 238000004891 communication Methods 0.000 description 4
- 239000011159 matrix material Substances 0.000 description 4
- 238000012935 Averaging Methods 0.000 description 2
- 230000007717 exclusion Effects 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 230000001427 coherent effect Effects 0.000 description 1
- 210000005069 ears Anatomy 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 102220272824 rs563079629 Human genes 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 230000001629 suppression Effects 0.000 description 1
Images
Landscapes
- Circuit For Audible Band Transducer (AREA)
- Stereophonic System (AREA)
Description
(参考非特許文献1:柏野、平原、「一度に何人の声を聞き分けられるか?」、日本音響学会研究発表会講演論文集、一般社団法人日本音響学会、平成8年3月1日、pp.467-468)
(参考非特許文献2:Y.Hioka et al., “Underdetermined sound source separation using power spectrum density estimated by combination of directivity gain,” Audio, Speech, and Language Processing, IEEE Transactions on, IEEE, 2013.2.22, Volume:21, Issue:6, pp.1240-1250)
を左右のチャンネルそれぞれに等しい信号(ダイオティック信号)とし、右チャンネル用に所望する任意の方向(第1方向とする)の音信号と原音が合成された音を、他方の左チャンネル用に、所望する他方の方向(第2方向とする)の音と原音が合成された音を生成する。合成部35で生成された音は、拡声のステレオスピーカ、ステレオヘッドホンを用いて良好に再生できる。
(参考非特許文献3:安藤彰男著、「音響サイエンスシリーズ(第10巻)−音場再現」、株式会社コロナ社、2014年12月10日、第6章高臨場感音場再現)
本発明のポイントは、収録された環境音、背景音の中から2つの方向の音を抽出し、その他の音(原音)との3つを合成することでマイク収録によって失われた空間情報を補完し、高い臨場感の環境音、背景音を生成する点である。また、抽出した2方向の音を、左右のスピーカもしくは仮想的に空間の任意の場所から再生させることで、再度人間の空間弁別能力の利用を可能とし、より高い臨場感を創出する点である。
本発明の装置は、例えば単一のハードウェアエンティティとして、キーボードなどが接続可能な入力部、液晶ディスプレイなどが接続可能な出力部、ハードウェアエンティティの外部に通信可能な通信装置(例えば通信ケーブル)が接続可能な通信部、CPU(Central Processing Unit、キャッシュメモリやレジスタなどを備えていてもよい)、メモリであるRAMやROM、ハードディスクである外部記憶装置並びにこれらの入力部、出力部、通信部、CPU、RAM、ROM、外部記憶装置の間のデータのやり取りが可能なように接続するバスを有している。また必要に応じて、ハードウェアエンティティに、CD−ROMなどの記録媒体を読み書きできる装置(ドライブ)などを設けることとしてもよい。このようなハードウェア資源を備えた物理的実体としては、汎用コンピュータなどがある。
Claims (6)
- Mを3以上の整数とし、M方向の音をMチャネルの音信号として収音する収音部と、
前記Mチャネルの音信号のうち、任意の所望の方向の2つのチャネルの音信号をそれぞれ第1、第2方向チャネルの音信号として選択する強調処理部と、
前記Mチャネルの音信号のうち少なくとも何れかのチャネルの音信号を用いて原音を抽出する原音抽出部と、
予め定めた規則により、前記第1、第2方向チャネルの強調度を決定する強調度決定部と、
前記決定された強調度に応じて前記第1、第2方向チャネルの音信号を増幅し、前記原音と合成する合成部
を含む音生成装置。 - 請求項1に記載の音生成装置であって、
前記強調処理部は、
第1、第2方向強調部を含み、
前記第1、第2方向強調部は、
各チャネルの音信号を、ターゲットとなる音を強調するフィルタでフィルタリングするフィルタ部と、
前記フィルタリングされた各チャネルの音信号を足し合わせる足し合わせ部と、
予め定めた各方向のパワースペクトル密度推定値に基づいて、ターゲットエリア、雑音エリアそれぞれのパワースペクトル密度推定値を推定するターゲット/雑音エリアPSD推定部と、
前記ターゲットエリア、および前記雑音エリアのパワースペクトル密度推定値のそれぞれについて、前記ターゲットエリアから到来する音に由来する非定常成分と、雑音に由来する定常成分のそれぞれを抽出する定常/非定常成分抽出部と、
前記非定常成分と、前記定常成分に基づいてポストフィルタを計算するポストフィルタ計算部と、
前記ポストフィルタと、前記足し合わせられた信号を掛け合わせて目的方向強調信号を生成する掛け合わせ部と、
前記目的方向強調信号を逆フーリエ変換する逆フーリエ変換部
を含む音生成装置。 - 請求項1または2に記載の音生成装置であって、
前記合成部は、
前記決定された強調度に応じて前記第1方向チャネルの音信号を増幅して前記原音と合成し、ステレオ方式における右チャネル音を生成する右チャネル合成部と、
前記決定された強調度に応じて前記第2方向チャネルの音信号を増幅して前記原音と合成し、ステレオ方式における左チャネル音を生成する左チャネル合成部と、
を含む音生成装置。 - 請求項1または2に記載の音生成装置であって、
前記第1方向チャネルの音信号に前記第1方向に対応する頭部伝達関数を畳込む第1方向音響特性付加部と、
前記第2方向チャネルの音信号に前記第2方向に対応する頭部伝達関数を畳込む第2方向音響特性付加部と、
を含む音生成装置。 - 音生成装置が実行する音生成方法であって、
前記音生成装置は、
Mを3以上の整数とし、M方向の音をMチャネルの音信号として収音するステップと、
前記Mチャネルの音信号のうち、任意の所望の方向の2つのチャネルの音信号をそれぞれ第1、第2方向チャネルの音信号として選択するステップと、
前記Mチャネルの音信号のうち少なくとも何れかのチャネルの音信号を用いて原音を抽出するステップと、
予め定めた規則により、前記第1、第2方向チャネルの強調度を決定するステップと、
前記決定された強調度に応じて前記第1、第2方向チャネルの音信号を増幅し、前記原音と合成するステップを実行する
音生成方法。 - コンピュータを請求項1から4の何れかに記載の音生成装置として機能させるプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015148269A JP6445407B2 (ja) | 2015-07-28 | 2015-07-28 | 音生成装置、音生成方法、プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015148269A JP6445407B2 (ja) | 2015-07-28 | 2015-07-28 | 音生成装置、音生成方法、プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2017026967A JP2017026967A (ja) | 2017-02-02 |
JP6445407B2 true JP6445407B2 (ja) | 2018-12-26 |
Family
ID=57949693
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015148269A Active JP6445407B2 (ja) | 2015-07-28 | 2015-07-28 | 音生成装置、音生成方法、プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6445407B2 (ja) |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3556987B2 (ja) * | 1995-02-07 | 2004-08-25 | 富士通株式会社 | 環境音伝送型ヘッドセット装置 |
JP2004289511A (ja) * | 2003-03-24 | 2004-10-14 | Yamaha Corp | 情景音発生装置 |
JP4345784B2 (ja) * | 2006-08-21 | 2009-10-14 | ソニー株式会社 | 音響収音装置及び音響収音方法 |
JP2009260574A (ja) * | 2008-04-15 | 2009-11-05 | Sony Ericsson Mobilecommunications Japan Inc | 音声信号処理装置、音声信号処理方法及び音声信号処理装置を備えた携帯端末 |
-
2015
- 2015-07-28 JP JP2015148269A patent/JP6445407B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2017026967A (ja) | 2017-02-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10382849B2 (en) | Spatial audio processing apparatus | |
JP6466969B2 (ja) | 適応性のある関数に基づく矛盾しない音響場面再生のためのシステムおよび装置および方法 | |
KR101333031B1 (ko) | HRTFs을 나타내는 파라미터들의 생성 및 처리 방법 및디바이스 | |
US8705750B2 (en) | Device and method for converting spatial audio signal | |
US10097943B2 (en) | Apparatus and method for reproducing recorded audio with correct spatial directionality | |
KR20160020377A (ko) | 음향 신호를 생성하고 재생하는 방법 및 장치 | |
JP4620468B2 (ja) | オーディオ信号を再生するためのオーディオ再生システムおよび方法 | |
CN104919821B (zh) | 用于重放音频信号的方法和系统 | |
TW201727623A (zh) | 聲場增強裝置及方法 | |
EP3776544A1 (en) | Spatial audio parameters and associated spatial audio playback | |
JP5611970B2 (ja) | オーディオ信号を変換するためのコンバータ及び方法 | |
US11122381B2 (en) | Spatial audio signal processing | |
JP2012509632A5 (ja) | オーディオ信号を変換するためのコンバータ及び方法 | |
EP2268064A1 (en) | Device and method for converting spatial audio signal | |
Duong et al. | Audio zoom for smartphones based on multiple adaptive beamformers | |
JP6445407B2 (ja) | 音生成装置、音生成方法、プログラム | |
WO2021212287A1 (zh) | 音频信号处理方法、音频处理装置及录音设备 | |
CN113286252B (zh) | 一种声场重建方法、装置、设备及存储介质 | |
CN113873420B (zh) | 音频数据处理方法及装置 | |
JP6017352B2 (ja) | 音声信号変換装置及び方法 | |
JP6526582B2 (ja) | 再合成装置、再合成方法、プログラム | |
WO2020027062A1 (ja) | 集音拡声装置、その方法、およびプログラム | |
JP6027873B2 (ja) | インパルス応答生成装置、インパルス応答生成システム及びインパルス応答生成プログラム | |
KR20150005438A (ko) | 오디오 신호 처리 방법 및 장치 | |
Gauthier et al. | Sound field capture with microphone arrays, proximity microphones, and optimal filters |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20170704 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20180516 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20180529 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20180719 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20181127 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20181129 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6445407 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |