JP5063363B2 - 音声合成方法 - Google Patents
音声合成方法 Download PDFInfo
- Publication number
- JP5063363B2 JP5063363B2 JP2007554693A JP2007554693A JP5063363B2 JP 5063363 B2 JP5063363 B2 JP 5063363B2 JP 2007554693 A JP2007554693 A JP 2007554693A JP 2007554693 A JP2007554693 A JP 2007554693A JP 5063363 B2 JP5063363 B2 JP 5063363B2
- Authority
- JP
- Japan
- Prior art keywords
- sine wave
- wave component
- parameter
- sinusoidal
- component
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
- G10L13/02—Methods for producing synthetic speech; Speech synthesisers
- G10L13/04—Details of speech synthesis systems, e.g. synthesiser structure or memory management
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10H—ELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
- G10H7/00—Instruments in which the tones are synthesised from a data store, e.g. computer organs
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10H—ELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
- G10H7/00—Instruments in which the tones are synthesised from a data store, e.g. computer organs
- G10H7/02—Instruments in which the tones are synthesised from a data store, e.g. computer organs in which amplitudes at successive sample points of a tone waveform are stored in one or more memories
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10H—ELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
- G10H7/00—Instruments in which the tones are synthesised from a data store, e.g. computer organs
- G10H7/08—Instruments in which the tones are synthesised from a data store, e.g. computer organs by calculating functions or polynomial approximations to evaluate amplitudes at successive sample points of a tone waveform
- G10H7/10—Instruments in which the tones are synthesised from a data store, e.g. computer organs by calculating functions or polynomial approximations to evaluate amplitudes at successive sample points of a tone waveform using coefficients or parameters stored in a memory, e.g. Fourier coefficients
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10H—ELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
- G10H2230/00—General physical, ergonomic or hardware implementation of electrophonic musical tools or instruments, e.g. shape or architecture
- G10H2230/025—Computing or signal processing architecture features
- G10H2230/041—Processor load management, i.e. adaptation or optimization of computational load or data throughput in computationally intensive musical processes to avoid overload artifacts, e.g. by deliberately suppressing less audible or less relevant tones or decreasing their complexity
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10H—ELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
- G10H2250/00—Aspects of algorithms or signal processing methods without intrinsic musical character, yet specifically adapted for or used in electrophonic musical processing
- G10H2250/025—Envelope processing of music signals in, e.g. time domain, transform domain or cepstrum domain
- G10H2250/031—Spectrum envelope processing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10H—ELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
- G10H2250/00—Aspects of algorithms or signal processing methods without intrinsic musical character, yet specifically adapted for or used in electrophonic musical processing
- G10H2250/471—General musical sound synthesis principles, i.e. sound category-independent synthesis methods
Description
−知覚的関連性値を用いて、ある数の周波数帯域のそれぞれから、制限された数の正弦波成分を選択する選択手段と、
−前記選択された正弦波成分のみを合成する合成手段と、
を備える装置を提供する。
−知覚的関連性値を用いて、ある数の周波数帯域のそれぞれから、制限された数の正弦波成分を選択するステップと、
−前記選択された正弦波成分のみを合成するステップと、
を含む方法を提供する。
及び
は、切り捨て演算を示すことを特記される)、またここで、
Claims (13)
- 振幅パラメータ及び/又は周波数パラメータを含むパラメータであって、量子化された値に基づくパラメータによって表現される正弦波成分を含む音声を合成する装置であり、
−知覚的関連性値を用いて、多数の周波数帯域のそれぞれから、制限された数の正弦波成分を選択する選択手段と、
−前記選択された正弦波成分のみを合成する合成手段と、
を備える装置であって、
前記合成手段が、前記合成の一部として前記選択された正弦波成分のみの前記パラメータを逆量子化するよう構成され、
前記選択手段が、前記合成手段による逆量子化の前に、前記パラメータの前記量子化された値に基づいて、前記制限された数の正弦波成分を選択するよう構成されることを特徴とする装置。 - 前記知覚的関連性値が、該それぞれの正弦波成分の振幅、エネルギ及び/又は空間位置を含む、請求項1に記載の装置。
- 前記正弦波成分が、複数の音声チャネルのうちの1つとそれぞれ関連付けられ、前記知覚的関連性値が、前記それぞれのチャネルの包絡線を含む、請求項1に記載の装置。
- 前記周波数帯域が、ERBスケール等の知覚的関連性値に基づく、請求項1に記載の装置。
- いずれの却下される正弦波成分のいずれのエネルギ損失に関しても、前記選択された正弦波成分の利得を補償する利得補償手段を更に備える、請求項1に記載の装置。
- 請求項1乃至5の何れか一項に記載の合成する装置を含む、携帯電話、ゲーム機、オーディオプレーヤ、又は留守番電話機などの、民生装置。
- 振幅パラメータ及び/又は周波数パラメータを含むパラメータであって、量子化された値に基づくパラメータによって表現される正弦波成分を含む音声を合成する方法であり、
−知覚的関連性値を用いて、多数の周波数帯域のそれぞれから、制限された数の正弦波成分を選択するステップと、
−前記選択された正弦波成分のみを合成するステップと、
を含む方法であって、
前記合成するステップが、前記合成の一部として前記選択された正弦波成分のみの前記パラメータの逆量子化を含み、
前記選択するステップが、前記合成するステップによる逆量子化の前に、前記パラメータの前記量子化された値に基づく、前記制限された数の正弦波成分の選択を含むことを特徴とする方法。 - 前記知覚的関連性値が、該それぞれの正弦波成分の振幅、エネルギ及び/又は空間位置を含む、請求項7に記載の方法。
- 前記正弦波成分が、複数の音声チャネルのうちの1つとそれぞれ関連付けられ、前記知覚的関連性値が、前記それぞれのチャネルの包絡線を含む、請求項7に記載の方法。
- いずれの却下される正弦波成分のいずれのエネルギ損失に関しても、前記選択された正弦波成分の利得を補償するステップを更に備える、請求項7に記載の方法。
- 請求項7乃至10の何れか一項に記載の方法を実行する計算機プログラム。
- 正弦波成分を含む音声を合成する装置であり、
−知覚的関連性値を用いて、多数の周波数帯域のそれぞれから、制限された数の正弦波成分を選択する選択手段と、
−前記選択された正弦波成分のみを合成する合成手段と、
を備える装置であって、
いずれの却下される正弦波成分のいずれのエネルギ損失に関しても、前記選択された正弦波成分の利得を補償する利得補償手段を更に備えることを特徴とする装置。 - 正弦波成分を含む音声を合成する方法であり、
−知覚的関連性値を用いて、多数の周波数帯域のそれぞれから、制限された数の正弦波成分を選択するステップと、
−前記選択された正弦波成分のみを合成するステップと、
を含む方法であって、
いずれの却下される正弦波成分のいずれのエネルギ損失に関しても、前記選択された正弦波成分の利得を補償するステップを更に含むことを特徴とする方法。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP05100945 | 2005-02-10 | ||
EP05100945.4 | 2005-02-10 | ||
PCT/IB2006/050337 WO2006085243A2 (en) | 2005-02-10 | 2006-02-01 | Sound synthesis |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2008530607A JP2008530607A (ja) | 2008-08-07 |
JP5063363B2 true JP5063363B2 (ja) | 2012-10-31 |
Family
ID=36686032
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007554693A Expired - Fee Related JP5063363B2 (ja) | 2005-02-10 | 2006-02-01 | 音声合成方法 |
Country Status (6)
Country | Link |
---|---|
US (1) | US7649135B2 (ja) |
EP (1) | EP1851760B1 (ja) |
JP (1) | JP5063363B2 (ja) |
KR (1) | KR101315075B1 (ja) |
CN (1) | CN101116136B (ja) |
WO (1) | WO2006085243A2 (ja) |
Families Citing this family (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1851760B1 (en) | 2005-02-10 | 2015-10-07 | Koninklijke Philips N.V. | Sound synthesis |
EP2038882A2 (en) * | 2006-06-29 | 2009-03-25 | Nxp B.V. | Decoding sound parameters |
US20080184872A1 (en) * | 2006-06-30 | 2008-08-07 | Aaron Andrew Hunt | Microtonal tuner for a musical instrument using a digital interface |
CN101606192B (zh) | 2007-02-06 | 2014-10-08 | 皇家飞利浦电子股份有限公司 | 低复杂度参数化立体声解码器 |
KR20080073925A (ko) * | 2007-02-07 | 2008-08-12 | 삼성전자주식회사 | 파라메트릭 부호화된 오디오 신호를 복호화하는 방법 및장치 |
US7718882B2 (en) * | 2007-03-22 | 2010-05-18 | Qualcomm Incorporated | Efficient identification of sets of audio parameters |
US7678986B2 (en) * | 2007-03-22 | 2010-03-16 | Qualcomm Incorporated | Musical instrument digital interface hardware instructions |
US8489403B1 (en) * | 2010-08-25 | 2013-07-16 | Foundation For Research and Technology—Institute of Computer Science ‘FORTH-ICS’ | Apparatuses, methods and systems for sparse sinusoidal audio processing and transmission |
JP5561497B2 (ja) * | 2012-01-06 | 2014-07-30 | ヤマハ株式会社 | 波形データ生成装置及び波形データ生成プログラム |
CN103811011B (zh) * | 2012-11-02 | 2017-05-17 | 富士通株式会社 | 音频弦波检测方法和装置 |
JP6284298B2 (ja) * | 2012-11-30 | 2018-02-28 | Kddi株式会社 | 音声合成装置、音声合成方法および音声合成プログラム |
CN110010140B (zh) | 2013-04-05 | 2023-04-18 | 杜比国际公司 | 立体声音频编码器和解码器 |
CN104347082B (zh) * | 2013-07-24 | 2017-10-24 | 富士通株式会社 | 弦波帧检测方法和设备以及音频编码方法和设备 |
CN103854642B (zh) * | 2014-03-07 | 2016-08-17 | 天津大学 | 基于物理的火焰声音合成方法 |
JP6410890B2 (ja) * | 2017-07-04 | 2018-10-24 | Kddi株式会社 | 音声合成装置、音声合成方法および音声合成プログラム |
Family Cites Families (30)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5029509A (en) * | 1989-05-10 | 1991-07-09 | Board Of Trustees Of The Leland Stanford Junior University | Musical synthesizer combining deterministic and stochastic waveforms |
US5220629A (en) * | 1989-11-06 | 1993-06-15 | Canon Kabushiki Kaisha | Speech synthesis apparatus and method |
US5248845A (en) * | 1992-03-20 | 1993-09-28 | E-Mu Systems, Inc. | Digital sampling instrument |
US5763800A (en) * | 1995-08-14 | 1998-06-09 | Creative Labs, Inc. | Method and apparatus for formatting digital audio data |
FR2738099B1 (fr) * | 1995-08-25 | 1997-10-24 | France Telecom | Procede de simulation de la qualite acoustique d'une salle et processeur audio-numerique associe |
DE69629486T2 (de) * | 1995-10-23 | 2004-06-24 | The Regents Of The University Of California, Oakland | Kontrollstruktur für klangsynthesierung |
US5686683A (en) * | 1995-10-23 | 1997-11-11 | The Regents Of The University Of California | Inverse transform narrow band/broad band sound synthesis |
US5689080A (en) * | 1996-03-25 | 1997-11-18 | Advanced Micro Devices, Inc. | Computer system and method for performing wavetable music synthesis which stores wavetable data in system memory which minimizes audio infidelity due to wavetable data access latency |
US5920843A (en) * | 1997-06-23 | 1999-07-06 | Mircrosoft Corporation | Signal parameter track time slice control point, step duration, and staircase delta determination, for synthesizing audio by plural functional components |
US7756892B2 (en) * | 2000-05-02 | 2010-07-13 | Digimarc Corporation | Using embedded data with file sharing |
US5900568A (en) * | 1998-05-15 | 1999-05-04 | International Business Machines Corporation | Method for automatic sound synthesis |
US6298322B1 (en) * | 1999-05-06 | 2001-10-02 | Eric Lindemann | Encoding and synthesis of tonal audio signals using dominant sinusoids and a vector-quantized residual tonal signal |
JP3707300B2 (ja) * | 1999-06-02 | 2005-10-19 | ヤマハ株式会社 | 楽音発生装置用拡張ボード |
JP2002140067A (ja) * | 2000-11-06 | 2002-05-17 | Casio Comput Co Ltd | 電子楽器および電子楽器のレジストレーション方法 |
SG118122A1 (en) * | 2001-03-27 | 2006-01-27 | Yamaha Corp | Waveform production method and apparatus |
US7136418B2 (en) * | 2001-05-03 | 2006-11-14 | University Of Washington | Scalable and perceptually ranked signal coding and decoding |
AUPR647501A0 (en) * | 2001-07-19 | 2001-08-09 | Vast Audio Pty Ltd | Recording a three dimensional auditory scene and reproducing it for the individual listener |
CN1288624C (zh) * | 2001-11-23 | 2006-12-06 | 皇家飞利浦电子股份有限公司 | 感觉噪声替换的方法和装置 |
US20040002859A1 (en) * | 2002-06-26 | 2004-01-01 | Chi-Min Liu | Method and architecture of digital conding for transmitting and packing audio signals |
WO2004021331A1 (en) | 2002-09-02 | 2004-03-11 | Telefonaktiebolaget Lm Ericsson (Publ) | Sound synthesiser |
US7650277B2 (en) * | 2003-01-23 | 2010-01-19 | Ittiam Systems (P) Ltd. | System, method, and apparatus for fast quantization in perceptual audio coders |
CN100508030C (zh) * | 2003-06-30 | 2009-07-01 | 皇家飞利浦电子股份有限公司 | 一种编码/解码音频信号的方法及相应设备 |
ES2322264T3 (es) | 2003-07-18 | 2009-06-18 | Koninklijke Philips Electronics N.V. | Codificacion de audio de baja tasa de transmision de bits. |
JP5238256B2 (ja) * | 2004-11-04 | 2013-07-17 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | 多チャンネル音声信号の符号化及び復号化 |
BRPI0517949B1 (pt) * | 2004-11-04 | 2019-09-03 | Koninklijke Philips Nv | dispositivo de conversão para converter um sinal dominante, método de conversão de um sinal dominante, e meio não transitório legível por computador |
US7676362B2 (en) * | 2004-12-31 | 2010-03-09 | Motorola, Inc. | Method and apparatus for enhancing loudness of a speech signal |
KR101207325B1 (ko) * | 2005-02-10 | 2012-12-03 | 코닌클리케 필립스 일렉트로닉스 엔.브이. | 음성 합성 장치 및 방법 |
EP1851760B1 (en) | 2005-02-10 | 2015-10-07 | Koninklijke Philips N.V. | Sound synthesis |
US7885809B2 (en) * | 2005-04-20 | 2011-02-08 | Ntt Docomo, Inc. | Quantization of speech and audio coding parameters using partial information on atypical subsequences |
US8046218B2 (en) * | 2006-09-19 | 2011-10-25 | The Board Of Trustees Of The University Of Illinois | Speech and method for identifying perceptual features |
-
2006
- 2006-02-01 EP EP06710800.1A patent/EP1851760B1/en not_active Not-in-force
- 2006-02-01 KR KR1020077020742A patent/KR101315075B1/ko not_active IP Right Cessation
- 2006-02-01 CN CN2006800045913A patent/CN101116136B/zh not_active Expired - Fee Related
- 2006-02-01 WO PCT/IB2006/050337 patent/WO2006085243A2/en active Application Filing
- 2006-02-01 JP JP2007554693A patent/JP5063363B2/ja not_active Expired - Fee Related
- 2006-02-01 US US11/908,379 patent/US7649135B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2008530607A (ja) | 2008-08-07 |
US7649135B2 (en) | 2010-01-19 |
WO2006085243A3 (en) | 2006-11-09 |
WO2006085243A2 (en) | 2006-08-17 |
KR101315075B1 (ko) | 2013-10-08 |
KR20070107117A (ko) | 2007-11-06 |
US20080250913A1 (en) | 2008-10-16 |
CN101116136B (zh) | 2011-05-18 |
EP1851760B1 (en) | 2015-10-07 |
EP1851760A2 (en) | 2007-11-07 |
CN101116136A (zh) | 2008-01-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5063363B2 (ja) | 音声合成方法 | |
JP6386634B2 (ja) | オーディオ信号の符号化及び復号化方法並びにその装置 | |
JP5063364B2 (ja) | 音声合成方法 | |
US20120134511A1 (en) | Multichannel audio coder and decoder | |
KR20100039433A (ko) | 디코딩 장치 | |
KR20080096998A (ko) | 고주파수 영역 부호화 및 복호화 방법 및 장치 | |
JP5651980B2 (ja) | 復号装置、復号方法、およびプログラム | |
KR20120095920A (ko) | 최적의 저-스루풋 파라메트릭 코딩/디코딩 | |
JP2006171751A (ja) | 音声符号化装置及び方法 | |
JPWO2011155144A1 (ja) | 復号装置、符号化装置及びこれらの方法 | |
JP3191257B2 (ja) | 音響信号符号化方法、音響信号復号化方法、音響信号符号化装置、音響信号復号化装置 | |
JP2009500669A (ja) | パラメトリック・マルチチャンネル復号化 | |
JP2796408B2 (ja) | 音声情報圧縮装置 | |
JP4403721B2 (ja) | ディジタルオーディオデコーダ | |
JP5188913B2 (ja) | 量子化装置、量子化方法、逆量子化装置、逆量子化方法、音声音響符号化装置および音声音響復号装置 | |
JP2002076904A (ja) | 符号化されたオーディオ信号の復号化方法、及び符号化されたオーディオ信号の復号化装置 | |
JPH07295593A (ja) | 音声符号化装置 | |
JP2014240974A (ja) | 符号化装置、符号化方法、およびプログラム | |
KR20080033841A (ko) | 믹스 신호 처리 방법 및 장치 | |
JP2001265366A (ja) | オーディオ信号の符号化方法、オーディオ信号の符号化装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20090130 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110802 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20111102 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120124 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120710 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120807 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150817 Year of fee payment: 3 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |