JP6604331B2 - 音声処理装置および方法、並びにプログラム - Google Patents
音声処理装置および方法、並びにプログラム Download PDFInfo
- Publication number
- JP6604331B2 JP6604331B2 JP2016553046A JP2016553046A JP6604331B2 JP 6604331 B2 JP6604331 B2 JP 6604331B2 JP 2016553046 A JP2016553046 A JP 2016553046A JP 2016553046 A JP2016553046 A JP 2016553046A JP 6604331 B2 JP6604331 B2 JP 6604331B2
- Authority
- JP
- Japan
- Prior art keywords
- spatial
- frequency
- sound
- time
- spatial filter
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01S—RADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
- G01S3/00—Direction-finders for determining the direction from which infrasonic, sonic, ultrasonic, or electromagnetic waves, or particle emission, not having a directional significance, are being received
- G01S3/80—Direction-finders for determining the direction from which infrasonic, sonic, ultrasonic, or electromagnetic waves, or particle emission, not having a directional significance, are being received using ultrasonic, sonic or infrasonic waves
- G01S3/802—Systems for determining direction or deviation from predetermined direction
- G01S3/808—Systems for determining direction or deviation from predetermined direction using transducers spaced apart and measuring phase or time difference between signals therefrom, i.e. path-difference systems
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R3/00—Circuits for transducers, loudspeakers or microphones
- H04R3/005—Circuits for transducers, loudspeakers or microphones for combining the signals of two or more microphones
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R1/00—Details of transducers, loudspeakers or microphones
- H04R1/20—Arrangements for obtaining desired frequency or directional characteristics
- H04R1/32—Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only
- H04R1/40—Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R1/00—Details of transducers, loudspeakers or microphones
- H04R1/20—Arrangements for obtaining desired frequency or directional characteristics
- H04R1/32—Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only
- H04R1/40—Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers
- H04R1/406—Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers microphones
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S7/00—Indicating arrangements; Control arrangements, e.g. balance control
- H04S7/30—Control circuits for electronic adaptation of the sound field
- H04S7/302—Electronic adaptation of stereophonic sound system to listener position or orientation
- H04S7/303—Tracking of listener position or orientation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2201/00—Details of transducers, loudspeakers or microphones covered by H04R1/00 but not provided for in any of its subgroups
- H04R2201/40—Details of arrangements for obtaining desired directional characteristic by combining a number of identical transducers covered by H04R1/40 but not provided for in any of its subgroups
- H04R2201/403—Linear arrays of transducers
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2400/00—Details of stereophonic systems covered by H04S but not provided for in its groups
- H04S2400/15—Aspects of sound capture and related signal processing for recording or reproduction
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Otolaryngology (AREA)
- Physics & Mathematics (AREA)
- Signal Processing (AREA)
- Acoustics & Sound (AREA)
- General Physics & Mathematics (AREA)
- Radar, Positioning & Navigation (AREA)
- Remote Sensing (AREA)
- General Health & Medical Sciences (AREA)
- Circuit For Audible Band Transducer (AREA)
- Obtaining Desirable Characteristics In Audible-Bandwidth Transducers (AREA)
- Stereophonic System (AREA)
Description
〈空間エリアシング制御器の構成例〉
本技術は、平面スピーカアレイや直線スピーカアレイを用いて音場を再現する場合に、波面合成を行うためのスピーカ駆動信号を生成する際、スピーカ駆動信号に適切な空間フィルタを適用することで、スピーカの離散配置によって生じる空間エリアシングを低減させるものである。
時間周波数分析部32は、マイクアレイ31を構成する各マイクロフォンで得られた収音信号s(nmic,t)の時間周波数情報を分析する。
続いて空間周波数分析部33は、時間周波数分析部32から供給された時間周波数スペクトルS(nmic,nT,l)に対して、次式(7)を計算することで空間周波数変換を行い、空間周波数スペクトルSSP(nS,nT,l)を算出する。
駆動信号生成部37には、通信部36および通信部34を介して、空間周波数分析部33から空間周波数スペクトルSSP(nS,nT,l)が供給される。
空間フィルタ適用部38は、駆動信号生成部37から供給されたスピーカ駆動信号DSP(mS,nT,l)と、方位情報取得部35から供給された話者方位情報θにより特性が決定される空間バンドパスフィルタBθ(mS,nT)とを用いて、空間フィルタスペクトルF(mS,nT,l)を求める。なお、ここでは空間バンドパスフィルタBθ(mS,nT)の形状が矩形状であるものとするが、空間バンドパスフィルタBθ(mS,nT)の形状は他のどのような形状であってもよい。
続いて、空間周波数合成部39について説明する。
時間周波数合成部40は、次式(13)の計算を行うことで、空間周波数合成部39から供給された時間周波数スペクトルD(nspk,nT,l)の時間周波数合成を行い、出力フレーム信号dfr(nspk,nfr,l)を得る。ここでは、時間周波数合成として、ISTFT(Inverse Short Time Fourier Transform)(短時間逆フーリエ変換)が用いられているが、時間周波数分析部32で行われる時間周波数変換(順変換)の逆変換に相当するものを用いればよい。
次に、以上において説明した空間エリアシング制御器11により行われる処理の流れについて説明する。空間エリアシング制御器11は、収音空間における音声の平面波の収音が指示されると、その平面波の収音を行って音場を再現する音場再現処理を行う。
音源の方向を示す方位情報を取得する方位情報取得部と、
複数のマイクロフォンからなるマイクアレイにより前記音源からの音声を収音して得られた収音信号に対して、前記方位情報により定まる特性の空間フィルタを適用する空間フィルタ適用部と
を備える音声処理装置。
[2]
前記空間フィルタ適用部は、前記方位情報に基づいて、前記空間フィルタの特性として中心周波数およびバンド幅を決定する
[1]に記載の音声処理装置。
[3]
前記空間フィルタは、前記中心周波数および前記バンド幅により定まる空間周波数の帯域を透過周波数帯域として、前記収音信号の透過周波数帯域の成分を透過させるフィルタである
[2]に記載の音声処理装置。
[4]
前記空間フィルタは、前記中心周波数および前記バンド幅により定まる時間周波数の帯域を透過周波数帯域として、前記収音信号の透過周波数帯域の成分を透過させるフィルタである
[2]または[3]に記載の音声処理装置。
[5]
前記空間フィルタ適用部は、前記方位情報により示される前記音源の方向と、前記マイクアレイとのなす角度がπ/2に近くなるほど前記バンド幅が広くなるように前記空間フィルタの特性を決定する
[2]乃至[4]の何れか一項に記載の音声処理装置。
[6]
前記マイクアレイは直線マイクアレイである
[1]乃至[5]の何れか一項に記載の音声処理装置。
[7]
音源の方向を示す方位情報を取得し、
複数のマイクロフォンからなるマイクアレイにより前記音源からの音声を収音して得られた収音信号に対して、前記方位情報により定まる特性の空間フィルタを適用する
ステップを含む音声処理方法。
[8]
音源の方向を示す方位情報を取得し、
複数のマイクロフォンからなるマイクアレイにより前記音源からの音声を収音して得られた収音信号に対して、前記方位情報により定まる特性の空間フィルタを適用する
ステップを含む処理をコンピュータに実行させるプログラム。
Claims (7)
- 音源の方向を示す方位情報を取得する方位情報取得部と、
前記方位情報に基づいて、空間フィルタの特性として中心周波数およびバンド幅を決定し、複数のマイクロフォンからなるマイクアレイにより前記音源からの音声を収音して得られた収音信号に対して、前記空間フィルタを適用する空間フィルタ適用部と
を備える音声処理装置。 - 前記空間フィルタは、前記中心周波数および前記バンド幅により定まる空間周波数の帯域を透過周波数帯域として、前記収音信号の透過周波数帯域の成分を透過させるフィルタである
請求項1に記載の音声処理装置。 - 前記空間フィルタは、前記中心周波数および前記バンド幅により定まる時間周波数の帯域を透過周波数帯域として、前記収音信号の透過周波数帯域の成分を透過させるフィルタである
請求項1または請求項2に記載の音声処理装置。 - 前記空間フィルタ適用部は、前記方位情報により示される前記音源の方向と、前記マイクアレイとのなす角度がπ/2に近くなるほど前記バンド幅が広くなるように前記空間フィルタの特性を決定する
請求項1乃至請求項3の何れか一項に記載の音声処理装置。 - 前記マイクアレイは直線マイクアレイである
請求項1乃至請求項4の何れか一項に記載の音声処理装置。 - 音源の方向を示す方位情報を取得し、
前記方位情報に基づいて、空間フィルタの特性として中心周波数およびバンド幅を決定し、複数のマイクロフォンからなるマイクアレイにより前記音源からの音声を収音して得られた収音信号に対して、前記空間フィルタを適用する
ステップを含む音声処理方法。 - 音源の方向を示す方位情報を取得し、
前記方位情報に基づいて、空間フィルタの特性として中心周波数およびバンド幅を決定し、複数のマイクロフォンからなるマイクアレイにより前記音源からの音声を収音して得られた収音信号に対して、前記空間フィルタを適用する
ステップを含む処理をコンピュータに実行させるプログラム。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014208865 | 2014-10-10 | ||
JP2014208865 | 2014-10-10 | ||
PCT/JP2015/077242 WO2016056410A1 (ja) | 2014-10-10 | 2015-09-28 | 音声処理装置および方法、並びにプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2016056410A1 JPWO2016056410A1 (ja) | 2017-07-20 |
JP6604331B2 true JP6604331B2 (ja) | 2019-11-13 |
Family
ID=55653027
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016553046A Active JP6604331B2 (ja) | 2014-10-10 | 2015-09-28 | 音声処理装置および方法、並びにプログラム |
Country Status (5)
Country | Link |
---|---|
US (1) | US10602266B2 (ja) |
EP (1) | EP3206415B1 (ja) |
JP (1) | JP6604331B2 (ja) |
CN (1) | CN106797526B (ja) |
WO (1) | WO2016056410A1 (ja) |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106165444B (zh) | 2014-04-16 | 2019-09-17 | 索尼公司 | 声场再现设备、方法和程序 |
WO2017038543A1 (ja) | 2015-09-03 | 2017-03-09 | ソニー株式会社 | 音声処理装置および方法、並びにプログラム |
EP3389285B1 (en) | 2015-12-10 | 2021-05-05 | Sony Corporation | Speech processing device, method, and program |
JP6881459B2 (ja) | 2016-09-01 | 2021-06-02 | ソニーグループ株式会社 | 情報処理装置、情報処理方法及び記録媒体 |
CN106604191A (zh) * | 2016-12-20 | 2017-04-26 | 广州视源电子科技股份有限公司 | 一种扩音方法及扩音系统 |
US11565365B2 (en) * | 2017-11-13 | 2023-01-31 | Taiwan Semiconductor Manufacturing Co., Ltd. | System and method for monitoring chemical mechanical polishing |
JP6959134B2 (ja) * | 2017-12-28 | 2021-11-02 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America | エリア再生方法、エリア再生プログラム及びエリア再生システム |
WO2020241050A1 (ja) * | 2019-05-28 | 2020-12-03 | ソニー株式会社 | 音声処理装置、音声処理方法およびプログラム |
Family Cites Families (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS59193380A (ja) * | 1983-04-18 | 1984-11-01 | Yokogawa Medical Syst Ltd | 方位角適応型フエ−ズド・アレイ・ソ−ナ− |
JP4124182B2 (ja) | 2004-08-27 | 2008-07-23 | ヤマハ株式会社 | アレイスピーカ装置 |
JP2008048294A (ja) | 2006-08-18 | 2008-02-28 | Kanazawa Univ | 指向性アレーマイクロホンおよび指向性アレースピーカ |
US8238569B2 (en) * | 2007-10-12 | 2012-08-07 | Samsung Electronics Co., Ltd. | Method, medium, and apparatus for extracting target sound from mixed sound |
JP5299233B2 (ja) * | 2009-11-20 | 2013-09-25 | ソニー株式会社 | 信号処理装置、および信号処理方法、並びにプログラム |
US9552840B2 (en) | 2010-10-25 | 2017-01-24 | Qualcomm Incorporated | Three-dimensional sound capturing and reproducing with multi-microphones |
RU2570359C2 (ru) | 2010-12-03 | 2015-12-10 | Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. | Прием звука посредством выделения геометрической информации из оценок направления его поступления |
JP2012150237A (ja) * | 2011-01-18 | 2012-08-09 | Sony Corp | 音信号処理装置、および音信号処理方法、並びにプログラム |
JP2014014410A (ja) * | 2012-07-06 | 2014-01-30 | Sony Corp | 記憶制御装置、記憶制御システムおよびプログラム |
EP2738762A1 (en) * | 2012-11-30 | 2014-06-04 | Aalto-Korkeakoulusäätiö | Method for spatial filtering of at least one first sound signal, computer readable storage medium and spatial filtering system based on cross-pattern coherence |
EP2747451A1 (en) * | 2012-12-21 | 2014-06-25 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Filter and method for informed spatial filtering using multiple instantaneous direction-of-arrivial estimates |
CN104010265A (zh) * | 2013-02-22 | 2014-08-27 | 杜比实验室特许公司 | 音频空间渲染设备及方法 |
JP5741866B2 (ja) * | 2013-03-05 | 2015-07-01 | 日本電信電話株式会社 | 音場収音再生装置、方法及びプログラム |
JP5986966B2 (ja) * | 2013-08-12 | 2016-09-06 | 日本電信電話株式会社 | 音場収音再生装置、方法及びプログラム |
-
2015
- 2015-09-28 US US15/516,563 patent/US10602266B2/en active Active
- 2015-09-28 JP JP2016553046A patent/JP6604331B2/ja active Active
- 2015-09-28 WO PCT/JP2015/077242 patent/WO2016056410A1/ja active Application Filing
- 2015-09-28 CN CN201580053837.5A patent/CN106797526B/zh active Active
- 2015-09-28 EP EP15849523.4A patent/EP3206415B1/en active Active
Also Published As
Publication number | Publication date |
---|---|
CN106797526B (zh) | 2019-07-12 |
EP3206415A4 (en) | 2018-06-06 |
EP3206415A1 (en) | 2017-08-16 |
WO2016056410A1 (ja) | 2016-04-14 |
EP3206415B1 (en) | 2019-09-04 |
CN106797526A (zh) | 2017-05-31 |
JPWO2016056410A1 (ja) | 2017-07-20 |
US10602266B2 (en) | 2020-03-24 |
US20180279042A1 (en) | 2018-09-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6604331B2 (ja) | 音声処理装置および方法、並びにプログラム | |
EP3320692B1 (en) | Spatial audio processing apparatus | |
US11310617B2 (en) | Sound field forming apparatus and method | |
US9361898B2 (en) | Three-dimensional sound compression and over-the-air-transmission during a call | |
EP2777298B1 (en) | Method and apparatus for processing signals of a spherical microphone array on a rigid sphere used for generating a spherical harmonics representation or an ambisonics representation of the sound field | |
EP3080806B1 (en) | Extraction of reverberant sound using microphone arrays | |
WO2015196729A1 (zh) | 一种麦克风阵列语音增强方法及装置 | |
US20160066117A1 (en) | Sound Signal Processing Method and Apparatus | |
EP3073766A1 (en) | Sound field re-creation device, method, and program | |
EP3133833B1 (en) | Sound field reproduction apparatus, method and program | |
JP6508539B2 (ja) | 音場収音装置および方法、音場再生装置および方法、並びにプログラム | |
WO2017208822A1 (ja) | 局所消音音場形成装置および方法、並びにプログラム | |
JP5734329B2 (ja) | 音場収音再生装置、方法及びプログラム | |
CN110890100B (zh) | 语音增强、多媒体数据采集、播放方法、装置及监控系统 | |
US20130253923A1 (en) | Multichannel enhancement system for preserving spatial cues | |
JP4116600B2 (ja) | 収音方法、収音装置、収音プログラム、およびこれを記録した記録媒体 | |
JP6323901B2 (ja) | 収音装置および収音方法、並びにプログラム | |
JP2013150027A (ja) | 音場収音再生装置、方法及びプログラム | |
WO2021212287A1 (zh) | 音频信号处理方法、音频处理装置及录音设备 | |
JP5734327B2 (ja) | 音場収音再生装置、方法及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20180921 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20180921 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20190711 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20190828 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20190917 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20190930 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 6604331 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |