JP5262324B2 - 音声合成装置およびプログラム - Google Patents
音声合成装置およびプログラム Download PDFInfo
- Publication number
- JP5262324B2 JP5262324B2 JP2008152772A JP2008152772A JP5262324B2 JP 5262324 B2 JP5262324 B2 JP 5262324B2 JP 2008152772 A JP2008152772 A JP 2008152772A JP 2008152772 A JP2008152772 A JP 2008152772A JP 5262324 B2 JP5262324 B2 JP 5262324B2
- Authority
- JP
- Japan
- Prior art keywords
- speech
- sound
- data
- unit
- synthesizer
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S7/00—Indicating arrangements; Control arrangements, e.g. balance control
- H04S7/30—Control circuits for electronic adaptation of the sound field
- H04S7/302—Electronic adaptation of stereophonic sound system to listener position or orientation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10H—ELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
- G10H1/00—Details of electrophonic musical instruments
- G10H1/0091—Means for obtaining special acoustic effects
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10H—ELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
- G10H2210/00—Aspects or methods of musical processing having intrinsic musical character, i.e. involving musical theory or musical parameters or relying on musical knowledge, as applied in electrophonic musical tools or instruments
- G10H2210/155—Musical effects
- G10H2210/265—Acoustic effect simulation, i.e. volume, spatial, resonance or reverberation effects added to a musical sound, usually by appropriate filtering or delays
- G10H2210/295—Spatial effects, musical uses of multiple audio channels, e.g. stereo
- G10H2210/301—Soundscape or sound field simulation, reproduction or control for musical purposes, e.g. surround or 3D sound; Granular synthesis
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R5/00—Stereophonic arrangements
- H04R5/027—Spatial or constructional arrangements of microphones, e.g. in dummy heads
Description
本発明の好適な態様において、設定手段は、複数の受音点の位置を利用者からの指示に応じて可変に設定し、音声合成手段は、複数の受音点の各々について音声の合成を実行し、各受音点について合成された音声を混合する。
また、本発明の好適な態様の音声合成装置は、音声データ群と、1個の収音点で収音された音声素片データを音声素片毎に含む特定音声データとを利用して音声を合成する音声合成装置であって、音声合成手段は、時系列に指定される音声素片毎に、音声データ群のうち当該音声素片の複数の音声素片データを、各々に対応する収音点の位置と受音点の位置との関係に応じて処理することで時間領域の波形を生成し、時間軸上で各波形を連結して音声を合成する動作と、特定音声データのうち時系列に指定される音声素片の音声素片データを利用して音声を合成する動作とを選択的に実行する。
図1は、本発明の第1実施形態に係る音声合成装置のブロック図である。図1に示すように、音声合成装置100は、制御装置10と記憶装置12と入力装置22と表示装置24と音出力装置26とを具備するコンピュータシステムで実現される。
VE(f)=W[1]・vE_1(f)+W[2]・vE_2(f)+……+W[N]・vE_N(f) ……(1)
VS(f)=W[1]・vS_1(f)+W[2]・vS_2(f)+……+W[N]・vS_N(f) ……(2)
式(3)から理解されるように、受音点Uの位置PUと収録時の収音機器M[i]の位置P[i]とが近い(距離L[i]が小さい)ほど係数α[i]は増加する。したがって、利用者が指定した受音点U(位置PU)に近い位置P[i]にて収録された音声データD[i]の音声素片データDS[i](包絡線E[i]および周波数スペクトルS[i])ほど、調整部46が生成する包絡線EAや周波数スペクトルSAに対する影響は大きい。
r[i]=1/2・cosθ[i]+1/2 ……(4A)
r[i]=1 ……(4B)
r[i]=cosθ[i] ……(4C)
次に、本発明の第2実施形態について説明する。なお、以下の各形態において第1実施形態と同等の要素については、以上と共通の符号を付して各々の詳細な説明を適宜に省略する。
図12は、本発明の第3実施形態に係る音声合成装置100のブロック図である。図12に示すように、本形態の記憶装置12は、複数の音声データ群Gと複数の音声データD0とを記憶する。複数の音声データ群Gの各々は、相異なる特性の音声(例えば、相異なる発声者uによる発声音や相異なる空間R内での発声音)から個別に生成され、第1実施形態と同様に、別個の位置で並列に採取された音声の特徴を表す複数の音声データDで構成される。複数の音声データD0の各々は、音声データDと同様に、1個の収音機器で収音された音声の特徴を音声素片毎に表す複数の音声素片データDSで構成される。
以上の各形態には様々な変形が加えられる。具体的な変形の態様を例示すれば以下の通りである。なお、以上の各形態や以下の各変形例から2以上の態様を任意に選択して組合わせてもよい。
以上の各形態においては音声データ群Gの生成時に空間R内で複数の発声者uが発声する場合(すなわち合唱音の音声データ群Gを生成する場合)を例示したが、ひとりの発声者uによる発声音(独唱音)から音声データ群Gを生成する構成も好適である。また、以上の各形態においては人間の発声音を収音して音声データD(第3実施形態の音声データD0)を生成したが、音声データD(D0)が楽器の演奏音を表す構成も採用される。
以上の各形態においては収音点(収音機器M[i])が空間R内に平面的(2次元的)に配置された場合を例示したが、収音点(収音機器M[i])を空間R内に3次元的に配置した場合にも以上の各形態が同様に適用される。収音点(収音機器M[i])を3次元的に配置した場合、位置P[i]はx-y-z空間(空間R)における3次元的な座標として規定される。
音声合成部42による音声の合成には公知の技術が任意に採用される。合成音に受音情報QBを反映させる方法は、音声合成部42による合成の方法(合成に使用する変数)に応じて適宜に選定される。また、以上の各形態においては包絡線E[1]〜E[N]および周波数スペクトルS[1]〜S[N]の双方に受音情報QB(加重値W[1]〜W[N])を反映させたが、例えば、包絡線EAを図6の方法で受音情報QBに応じて生成する一方、周波数スペクトルS[1]〜S[N]の何れか(または周波数スペクトルS[1]〜S[N]の平均)を図7の周波数スペクトルSAとして利用することで音声信号SOUTを生成する構成も採用される。
受音情報QBの内容は以上の例示から適宜に変更される。例えば、指向態様tUと受音感度hUと指向方向dUとのうちの少なくともひとつが省略される。指向態様tUを省略した構成においては係数β[i]の算定に1種類の感度関数のみが適用され、受音感度hUを省略した構成においては式(5)の変数hUが所定値(例えば「1」)に設定される。また、係数α[i]および係数β[i]の一方のみを加重値W[i]として式(1)や式(2)の演算を実行する構成も好適である。以上の例示から理解されるように、音声データD[i]に対応する収音の位置P[i]と受音点Uの位置PUとの関係(距離L[i]や角度θ[i])に応じて複数の音声データD(D[1]〜D[N])の各々を処理することで音声を合成する構成が本発明においては好適に採用される。
音声素片データDSの内容は以上の例示(周波数スペクトルSおよび包絡線E)に限定されない。例えば、音声素片データDSが音声素片の時間軸上の波形を表す構成も採用される。音声素片データDSが音声素片の波形を表す場合、音声合成部42は、例えば離散フーリエ変換を含む周波数分析を音声素片データDSに実行することで周波数スペクトルSや包絡線Eを算定したうえで音声の合成に使用する。
Claims (7)
- 相異なる収音点で収音された複数の音声について音声素片毎の音声素片データを含む音声データ群を利用して音声を合成する音声合成装置であって、
受音点の位置を利用者からの指示に応じて可変に設定する設定手段と、
時系列に指定される音声素片毎に、前記音声データ群のうち当該音声素片の複数の音声素片データを、各々に対応する前記収音点の位置と前記受音点の位置との関係に応じて処理することで時間領域の波形を生成し、時間軸上で各波形を連結して音声を合成する音声合成手段と
を具備する音声合成装置。 - 前記設定手段は、前記受音点における指向特性の種類を、複数の候補から利用者が選択した種類に設定し、
前記音声合成手段は、前記複数の音声素片データを、各々に対応する前記収音点に対する前記受音点からの方向について前記指向特性が示す感度に応じて処理することで音声を合成する
請求項1の音声合成装置。 - 前記設定手段は、複数の受音点の位置を利用者からの指示に応じて可変に設定し、
前記音声合成手段は、前記複数の受音点の各々について前記音声の合成を実行し、前記各受音点について合成された音声を混合する
請求項1または請求項2の音声合成装置。 - 前記音声データ群と、1個の収音点で収音された音声素片データを音声素片毎に含む特定音声データとを利用して音声を合成する音声合成装置であって、
前記音声合成手段は、時系列に指定される音声素片毎に、前記音声データ群のうち当該音声素片の複数の音声素片データを、各々に対応する前記収音点の位置と前記受音点の位置との関係に応じて処理することで時間領域の波形を生成し、時間軸上で各波形を連結して音声を合成する動作と、前記特定音声データのうち時系列に指定される音声素片の音声素片データを利用して音声を合成する動作とを選択的に実行する
請求項1から請求項3の何れかの音声合成装置。 - 前記音声データ群は、複数の発声者が並列に発声した合唱音を相異なる収音点で収音した複数の音声について音声素片毎の音声素片データを含む
請求項1から請求項4の何れかの音声合成装置。 - 前記音声合成手段は、前記複数の音声素片データの各々が示す音声の周波数スペクトルの包絡線を、当該音声素片データに対応する前記収音点の位置と前記受音点の位置との関係に応じた係数で加重して加算することで新たな包絡線を算定し、当該新たな包絡線をもつ音声を生成する
請求項1から請求項5の何れかの音声合成装置。 - 相異なる収音点で収音された複数の音声について音声素片毎の音声素片データを含む音声データ群を利用して音声を合成するために、コンピュータに、
受音点の位置を利用者からの指示に応じて可変に設定する設定処理と、
時系列に指定される音声素片毎に、前記音声データ群のうち当該音声素片の複数の音声素片データを、各々に対応する前記収音点の位置と前記受音点の位置との関係に応じて処理することで時間領域の波形を生成し、時間軸上で各波形を連結して音声を合成する音声合成処理と
を実行させるプログラム。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008152772A JP5262324B2 (ja) | 2008-06-11 | 2008-06-11 | 音声合成装置およびプログラム |
EP09161768.8A EP2133865B1 (en) | 2008-06-11 | 2009-06-03 | Sound synthesizer |
US12/477,597 US7999169B2 (en) | 2008-06-11 | 2009-06-03 | Sound synthesizer |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008152772A JP5262324B2 (ja) | 2008-06-11 | 2008-06-11 | 音声合成装置およびプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2009300576A JP2009300576A (ja) | 2009-12-24 |
JP5262324B2 true JP5262324B2 (ja) | 2013-08-14 |
Family
ID=40785483
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008152772A Expired - Fee Related JP5262324B2 (ja) | 2008-06-11 | 2008-06-11 | 音声合成装置およびプログラム |
Country Status (3)
Country | Link |
---|---|
US (1) | US7999169B2 (ja) |
EP (1) | EP2133865B1 (ja) |
JP (1) | JP5262324B2 (ja) |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9037468B2 (en) * | 2008-10-27 | 2015-05-19 | Sony Computer Entertainment Inc. | Sound localization for user in motion |
JP5842545B2 (ja) * | 2011-03-02 | 2016-01-13 | ヤマハ株式会社 | 発音制御装置、発音制御システム、プログラム及び発音制御方法 |
KR101394306B1 (ko) * | 2012-04-02 | 2014-05-13 | 삼성전자주식회사 | 효과 음향을 출력하는 휴대용 단말기의 장치 및 방법 |
LV14747B (lv) * | 2012-04-04 | 2014-03-20 | Sonarworks, Sia | Elektroakustisko izstarotāju akustisko parametru korekcijas paņēmiens un iekārta tā realizēšanai |
US9401684B2 (en) | 2012-05-31 | 2016-07-26 | The University Of North Carolina At Chapel Hill | Methods, systems, and computer readable media for synthesizing sounds using estimated material parameters |
US9230526B1 (en) * | 2013-07-01 | 2016-01-05 | Infinite Music, LLC | Computer keyboard instrument and improved system for learning music |
WO2015027950A1 (zh) * | 2013-08-30 | 2015-03-05 | 华为技术有限公司 | 立体声录制方法、装置和终端 |
US10553188B2 (en) * | 2016-12-26 | 2020-02-04 | CharmPI, LLC | Musical attribution in a two-dimensional digital representation |
Family Cites Families (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3282201B2 (ja) * | 1991-11-26 | 2002-05-13 | ソニー株式会社 | 収音装置、再生装置、収音方法および再生方法、および、音信号処理装置 |
US5536902A (en) * | 1993-04-14 | 1996-07-16 | Yamaha Corporation | Method of and apparatus for analyzing and synthesizing a sound by extracting and controlling a sound parameter |
GB9307934D0 (en) * | 1993-04-16 | 1993-06-02 | Solid State Logic Ltd | Mixing audio signals |
JP3514263B2 (ja) * | 1993-05-31 | 2004-03-31 | 富士通株式会社 | 歌声合成装置 |
JP2988289B2 (ja) * | 1994-11-15 | 1999-12-13 | ヤマハ株式会社 | 音像音場制御装置 |
WO1997015914A1 (en) * | 1995-10-23 | 1997-05-01 | The Regents Of The University Of California | Control structure for sound synthesis |
JP3575730B2 (ja) * | 1997-05-22 | 2004-10-13 | ヤマハ株式会社 | 歌唱音声合成装置、歌唱音声合成方法および記憶媒体 |
JPH11187499A (ja) * | 1997-12-25 | 1999-07-09 | Nec Corp | 音場制御方法 |
US6239348B1 (en) * | 1999-09-10 | 2001-05-29 | Randall B. Metcalf | Sound system and method for creating a sound event based on a modeled sound field |
JP2003099078A (ja) | 2001-09-20 | 2003-04-04 | Seiko Epson Corp | 合成音声再生方法および合成音声再生装置 |
JP3815347B2 (ja) | 2002-02-27 | 2006-08-30 | ヤマハ株式会社 | 歌唱合成方法と装置及び記録媒体 |
JP4062959B2 (ja) * | 2002-04-26 | 2008-03-19 | ヤマハ株式会社 | 残響付与装置、残響付与方法、インパルス応答生成装置、インパルス応答生成方法、残響付与プログラム、インパルス応答生成プログラムおよび記録媒体 |
US7138575B2 (en) * | 2002-07-29 | 2006-11-21 | Accentus Llc | System and method for musical sonification of data |
US20080056517A1 (en) | 2002-10-18 | 2008-03-06 | The Regents Of The University Of California | Dynamic binaural sound capture and reproduction in focued or frontal applications |
EP1685554A1 (en) | 2003-10-09 | 2006-08-02 | TEAC America, Inc. | Method, apparatus, and system for synthesizing an audio performance using convolution at multiple sample rates |
JP4181511B2 (ja) * | 2004-02-09 | 2008-11-19 | 日本放送協会 | サラウンド音声ミキシング装置およびサラウンド音声ミキシングプログラム |
US7636448B2 (en) * | 2004-10-28 | 2009-12-22 | Verax Technologies, Inc. | System and method for generating sound events |
FR2890480B1 (fr) | 2005-09-05 | 2008-03-14 | Centre Nat Rech Scient | Procede et dispositif de correction active des proprietes acoustiques d'une zone d'ecoute d'un espace sonore |
JP4839891B2 (ja) * | 2006-03-04 | 2011-12-21 | ヤマハ株式会社 | 歌唱合成装置および歌唱合成プログラム |
JP2008072541A (ja) * | 2006-09-15 | 2008-03-27 | D & M Holdings Inc | オーディオ装置 |
-
2008
- 2008-06-11 JP JP2008152772A patent/JP5262324B2/ja not_active Expired - Fee Related
-
2009
- 2009-06-03 EP EP09161768.8A patent/EP2133865B1/en not_active Not-in-force
- 2009-06-03 US US12/477,597 patent/US7999169B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2009300576A (ja) | 2009-12-24 |
US20090308230A1 (en) | 2009-12-17 |
EP2133865A2 (en) | 2009-12-16 |
US7999169B2 (en) | 2011-08-16 |
EP2133865A3 (en) | 2011-04-27 |
EP2133865B1 (en) | 2014-01-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5262324B2 (ja) | 音声合成装置およびプログラム | |
JP4207902B2 (ja) | 音声合成装置およびプログラム | |
JP4645241B2 (ja) | 音声処理装置およびプログラム | |
US20140109751A1 (en) | Musical modification effects | |
JP4062959B2 (ja) | 残響付与装置、残響付与方法、インパルス応答生成装置、インパルス応答生成方法、残響付与プログラム、インパルス応答生成プログラムおよび記録媒体 | |
WO2020171033A1 (ja) | 音信号合成方法、生成モデルの訓練方法、音信号合成システムおよびプログラム | |
WO2020095950A1 (ja) | 情報処理方法および情報処理システム | |
WO2021060493A1 (ja) | 情報処理方法、推定モデル構築方法、情報処理装置、および推定モデル構築装置 | |
WO2018055892A1 (ja) | 電子打楽器の音源 | |
JP7443823B2 (ja) | 音響処理方法 | |
JP7419666B2 (ja) | 音信号処理装置および音信号処理方法 | |
Einbond | Mapping the Klangdom Live: Cartographies for piano with two performers and electronics | |
JP2020194098A (ja) | 推定モデル確立方法、推定モデル確立装置、プログラムおよび訓練データ準備方法 | |
JP3503268B2 (ja) | 音色パラメータ編集装置 | |
JP6337698B2 (ja) | 音響処理装置 | |
JP3414150B2 (ja) | コーラス効果付与装置 | |
JPH06335096A (ja) | 音場再生装置 | |
Dony Armstrong et al. | Pedal effects modeling for stringed instruments by employing schemes of dsp in real time for vocals and music | |
JP5211437B2 (ja) | 音声処理装置およびプログラム | |
Lokki et al. | Applying anechoic recordings in auralization | |
JP2018054859A (ja) | 楽音生成装置、楽音生成方法、電子楽器、及びプログラム | |
Ackermann et al. | Musical instruments as dynamic sound sources | |
JP2016050995A (ja) | 音響処理装置 | |
JP2019126076A (ja) | 音信号制御方法および表示制御方法 | |
JP4631783B2 (ja) | ハウラー装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20110420 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20120628 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120807 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20121003 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130402 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130415 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 Ref document number: 5262324 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |