JP2014002338A - 音声処理装置 - Google Patents
音声処理装置 Download PDFInfo
- Publication number
- JP2014002338A JP2014002338A JP2012139455A JP2012139455A JP2014002338A JP 2014002338 A JP2014002338 A JP 2014002338A JP 2012139455 A JP2012139455 A JP 2012139455A JP 2012139455 A JP2012139455 A JP 2012139455A JP 2014002338 A JP2014002338 A JP 2014002338A
- Authority
- JP
- Japan
- Prior art keywords
- voice
- voice quality
- spectrum
- speech
- target
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000012545 processing Methods 0.000 title claims abstract description 100
- 238000001228 spectrum Methods 0.000 claims abstract description 73
- 238000006243 chemical reaction Methods 0.000 claims abstract description 36
- 230000005236 sound signal Effects 0.000 claims description 76
- 238000005070 sampling Methods 0.000 claims description 5
- 239000011295 pitch Substances 0.000 description 17
- 238000000034 method Methods 0.000 description 14
- 230000002093 peripheral effect Effects 0.000 description 11
- 230000015572 biosynthetic process Effects 0.000 description 8
- 238000003786 synthesis reaction Methods 0.000 description 8
- 238000004891 communication Methods 0.000 description 5
- 206010013952 Dysphonia Diseases 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 208000027498 hoarse voice Diseases 0.000 description 4
- 230000006870 function Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 230000007423 decrease Effects 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 210000001260 vocal cord Anatomy 0.000 description 2
- MQJKPEGWNLWLTK-UHFFFAOYSA-N Dapsone Chemical compound C1=CC(N)=CC=C1S(=O)(=O)C1=CC=C(N)C=C1 MQJKPEGWNLWLTK-UHFFFAOYSA-N 0.000 description 1
- 238000012952 Resampling Methods 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000001771 impaired effect Effects 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/26—Pre-filtering or post-filtering
- G10L19/265—Pre-filtering, e.g. high frequency emphasis prior to encoding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/003—Changing voice quality, e.g. pitch or formants
- G10L21/007—Changing voice quality, e.g. pitch or formants characterised by the process used
- G10L21/013—Adapting to target pitch
Landscapes
- Engineering & Computer Science (AREA)
- Quality & Reliability (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Telephone Function (AREA)
- Circuit For Audible Band Transducer (AREA)
Abstract
【解決手段】調整処理部34は、目標声質の音声を示す目標音声信号QBの基本周波数PSを、目標声質とは相違する初期声質の音声を示す音声信号VXの基本周波数PVに時間領域で調整する。声質変換部38は、調整処理部34による調整後の目標音声信号QCのスペクトルS[k]を調波成分毎に区分した各調波帯域成分H[i]を音声信号VXの基本周波数PVに対応する各調波周波数fiに配置するとともに各調波帯域成分H[i]の包絡線および位相を音声信号VXのスペクトルX[k]の包絡線および位相に応じて調整したスペクトルY[k]を順次に生成する。
【選択図】図1
Description
以上に例示した形態は多様に変形される。具体的な変形の態様を以下に例示する。以下の例示から任意に選択された2以上の態様は適宜に併合され得る。
Claims (5)
- 目標声質の音声を示す第1音声信号の基本周波数を、前記目標声質とは相違する初期声質の音声を示す第2音声信号の基本周波数に時間領域で調整する調整処理手段と、
前記調整処理手段による調整後の第1音声信号のスペクトルを調波成分毎に区分した各調波帯域成分を前記第2音声信号の基本周波数に対応する各調波周波数に配置するとともに各調波帯域成分の包絡線および位相を前記第2音声信号のスペクトルの包絡線および位相に応じて調整したスペクトルを順次に生成する声質変換手段と
を具備する音声処理装置。 - 前記声質変換手段は、前記調整処理手段による調整後の第1音声信号のスペクトルの第i番目の調波帯域成分を、前記調整処理手段による調整前の第1音声信号のスペクトルの第i次の調波成分の近傍の前記各調波周波数に配置する
請求項1の音声処理装置。 - 前記調整処理手段は、前記第1音声信号の基本周波数と前記第2音声信号の基本周波数とに応じた比率で前記第1音声信号を標本化することで基本周波数を調整する
請求項1または請求項2の音声処理装置。 - 特定の音素を前記目標声質で定常的に発声した音声を示す目標音声信号の各区間を時間軸上で相互に連結することで前記第1音声信号を生成する継続処理手段
を具備する請求項1から請求項3の何れかの音声処理装置。 - 前記第2音声信号のスペクトルと前記声質変換手段による処理後のスペクトルとを加重加算する混合処理手段
を具備する請求項1から請求項4の何れかの音声処理装置。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012139455A JP5772739B2 (ja) | 2012-06-21 | 2012-06-21 | 音声処理装置 |
US13/923,203 US9286906B2 (en) | 2012-06-21 | 2013-06-20 | Voice processing apparatus |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012139455A JP5772739B2 (ja) | 2012-06-21 | 2012-06-21 | 音声処理装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2014002338A true JP2014002338A (ja) | 2014-01-09 |
JP5772739B2 JP5772739B2 (ja) | 2015-09-02 |
Family
ID=49779002
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012139455A Active JP5772739B2 (ja) | 2012-06-21 | 2012-06-21 | 音声処理装置 |
Country Status (2)
Country | Link |
---|---|
US (1) | US9286906B2 (ja) |
JP (1) | JP5772739B2 (ja) |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2016050995A (ja) * | 2014-08-29 | 2016-04-11 | ヤマハ株式会社 | 音響処理装置 |
JP2016122157A (ja) * | 2014-12-25 | 2016-07-07 | ヤマハ株式会社 | 音声処理装置 |
WO2018084305A1 (ja) | 2016-11-07 | 2018-05-11 | ヤマハ株式会社 | 音声合成方法 |
JP2018077281A (ja) * | 2016-11-07 | 2018-05-17 | ヤマハ株式会社 | 音声合成方法 |
JP2018077282A (ja) * | 2016-11-07 | 2018-05-17 | ヤマハ株式会社 | 音声合成方法 |
JP2018077280A (ja) * | 2016-11-07 | 2018-05-17 | ヤマハ株式会社 | 音声合成方法 |
WO2019138871A1 (ja) | 2018-01-11 | 2019-07-18 | ヤマハ株式会社 | 音声合成方法、音声合成装置およびプログラム |
WO2019172397A1 (ja) | 2018-03-09 | 2019-09-12 | ヤマハ株式会社 | 音処理方法、音処理装置および記録媒体 |
JP2020194139A (ja) * | 2019-05-30 | 2020-12-03 | セイコーエプソン株式会社 | 半導体装置、電子機器及び移動体 |
US11348596B2 (en) | 2018-03-09 | 2022-05-31 | Yamaha Corporation | Voice processing method for processing voice signal representing voice, voice processing device for processing voice signal representing voice, and recording medium storing program for processing voice signal representing voice |
Families Citing this family (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6561499B2 (ja) * | 2015-03-05 | 2019-08-21 | ヤマハ株式会社 | 音声合成装置および音声合成方法 |
CN106887241A (zh) * | 2016-10-12 | 2017-06-23 | 阿里巴巴集团控股有限公司 | 一种语音信号检测方法与装置 |
CN109417504A (zh) * | 2017-04-07 | 2019-03-01 | 微软技术许可有限责任公司 | 自动聊天中的语音转发 |
TWI658458B (zh) * | 2018-05-17 | 2019-05-01 | 張智星 | 歌聲分離效能提升之方法、非暫態電腦可讀取媒體及電腦程式產品 |
US20190362737A1 (en) * | 2018-05-25 | 2019-11-28 | i2x GmbH | Modifying voice data of a conversation to achieve a desired outcome |
CN109065068B (zh) * | 2018-08-17 | 2021-03-30 | 广州酷狗计算机科技有限公司 | 音频处理方法、装置及存储介质 |
CN109192218B (zh) * | 2018-09-13 | 2021-05-07 | 广州酷狗计算机科技有限公司 | 音频处理的方法和装置 |
WO2020171034A1 (ja) | 2019-02-20 | 2020-08-27 | ヤマハ株式会社 | 音信号生成方法、生成モデルの訓練方法、音信号生成システムおよびプログラム |
US11094328B2 (en) * | 2019-09-27 | 2021-08-17 | Ncr Corporation | Conferencing audio manipulation for inclusion and accessibility |
CN113241082B (zh) * | 2021-04-22 | 2024-02-20 | 杭州网易智企科技有限公司 | 变声方法、装置、设备和介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000003197A (ja) * | 1998-06-16 | 2000-01-07 | Yamaha Corp | 音声変換装置、音声変換方法、および音声変換プログラムを記録した記録媒体 |
JP2002189472A (ja) * | 2000-12-22 | 2002-07-05 | Roland Corp | 音色制御装置 |
JP2006064799A (ja) * | 2004-08-25 | 2006-03-09 | Yamaha Corp | ピッチ変換装置とプログラム |
US20070208566A1 (en) * | 2004-03-31 | 2007-09-06 | France Telecom | Voice Signal Conversation Method And System |
JP2008058986A (ja) * | 2007-10-15 | 2008-03-13 | Yamaha Corp | ピッチ変換装置とプログラム |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO1993018505A1 (en) * | 1992-03-02 | 1993-09-16 | The Walt Disney Company | Voice transformation system |
US5567901A (en) * | 1995-01-18 | 1996-10-22 | Ivl Technologies Ltd. | Method and apparatus for changing the timbre and/or pitch of audio signals |
US6336092B1 (en) * | 1997-04-28 | 2002-01-01 | Ivl Technologies Ltd | Targeted vocal transformation |
-
2012
- 2012-06-21 JP JP2012139455A patent/JP5772739B2/ja active Active
-
2013
- 2013-06-20 US US13/923,203 patent/US9286906B2/en active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000003197A (ja) * | 1998-06-16 | 2000-01-07 | Yamaha Corp | 音声変換装置、音声変換方法、および音声変換プログラムを記録した記録媒体 |
JP2002189472A (ja) * | 2000-12-22 | 2002-07-05 | Roland Corp | 音色制御装置 |
US20070208566A1 (en) * | 2004-03-31 | 2007-09-06 | France Telecom | Voice Signal Conversation Method And System |
JP2006064799A (ja) * | 2004-08-25 | 2006-03-09 | Yamaha Corp | ピッチ変換装置とプログラム |
JP2008058986A (ja) * | 2007-10-15 | 2008-03-13 | Yamaha Corp | ピッチ変換装置とプログラム |
Non-Patent Citations (2)
Title |
---|
CSNG200100868024; 坂野 秀樹 Hideki BANNO: '時間領域平滑化群遅延による位相制御を用いた声質制御方式 Speech Manipulation Method Using Phase Manip' 電子情報通信学会論文誌 (J83-D-II) 第11号 THE TRANSACTIONS OF THE INSTITUTE OF ELECTRO , 200011, p.2276-2282, 社団法人電子情報通信学会 THE INSTITUTE OF ELECTRO * |
JPN6014045693; 坂野 秀樹 Hideki BANNO: '時間領域平滑化群遅延による位相制御を用いた声質制御方式 Speech Manipulation Method Using Phase Manip' 電子情報通信学会論文誌 (J83-D-II) 第11号 THE TRANSACTIONS OF THE INSTITUTE OF ELECTRO , 200011, p.2276-2282, 社団法人電子情報通信学会 THE INSTITUTE OF ELECTRO * |
Cited By (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2016050995A (ja) * | 2014-08-29 | 2016-04-11 | ヤマハ株式会社 | 音響処理装置 |
JP2016122157A (ja) * | 2014-12-25 | 2016-07-07 | ヤマハ株式会社 | 音声処理装置 |
US9865276B2 (en) | 2014-12-25 | 2018-01-09 | Yamaha Corporation | Voice processing method and apparatus, and recording medium therefor |
JPWO2018084305A1 (ja) * | 2016-11-07 | 2019-09-26 | ヤマハ株式会社 | 音声合成方法、音声合成装置およびプログラム |
WO2018084305A1 (ja) | 2016-11-07 | 2018-05-11 | ヤマハ株式会社 | 音声合成方法 |
JP2018077281A (ja) * | 2016-11-07 | 2018-05-17 | ヤマハ株式会社 | 音声合成方法 |
JP2018077282A (ja) * | 2016-11-07 | 2018-05-17 | ヤマハ株式会社 | 音声合成方法 |
JP2018077280A (ja) * | 2016-11-07 | 2018-05-17 | ヤマハ株式会社 | 音声合成方法 |
CN109952609A (zh) * | 2016-11-07 | 2019-06-28 | 雅马哈株式会社 | 声音合成方法 |
CN109952609B (zh) * | 2016-11-07 | 2023-08-15 | 雅马哈株式会社 | 声音合成方法 |
US11410637B2 (en) | 2016-11-07 | 2022-08-09 | Yamaha Corporation | Voice synthesis method, voice synthesis device, and storage medium |
WO2019138871A1 (ja) | 2018-01-11 | 2019-07-18 | ヤマハ株式会社 | 音声合成方法、音声合成装置およびプログラム |
US11094312B2 (en) | 2018-01-11 | 2021-08-17 | Yamaha Corporation | Voice synthesis method, voice synthesis apparatus, and recording medium |
JP2019120892A (ja) * | 2018-01-11 | 2019-07-22 | ヤマハ株式会社 | 音声合成方法およびプログラム |
US11348596B2 (en) | 2018-03-09 | 2022-05-31 | Yamaha Corporation | Voice processing method for processing voice signal representing voice, voice processing device for processing voice signal representing voice, and recording medium storing program for processing voice signal representing voice |
WO2019172397A1 (ja) | 2018-03-09 | 2019-09-12 | ヤマハ株式会社 | 音処理方法、音処理装置および記録媒体 |
US11646044B2 (en) * | 2018-03-09 | 2023-05-09 | Yamaha Corporation | Sound processing method, sound processing apparatus, and recording medium |
JP2020194139A (ja) * | 2019-05-30 | 2020-12-03 | セイコーエプソン株式会社 | 半導体装置、電子機器及び移動体 |
JP7326879B2 (ja) | 2019-05-30 | 2023-08-16 | セイコーエプソン株式会社 | 半導体装置、電子機器及び移動体 |
Also Published As
Publication number | Publication date |
---|---|
US20140006018A1 (en) | 2014-01-02 |
JP5772739B2 (ja) | 2015-09-02 |
US9286906B2 (en) | 2016-03-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5772739B2 (ja) | 音声処理装置 | |
US8706496B2 (en) | Audio signal transforming by utilizing a computational cost function | |
CN111542875B (zh) | 声音合成方法、声音合成装置及存储介质 | |
JP6024191B2 (ja) | 音声合成装置および音声合成方法 | |
JP5961950B2 (ja) | 音声処理装置 | |
WO2018084305A1 (ja) | 音声合成方法 | |
EP3719795B1 (en) | Voice synthesizing method, voice synthesizing apparatus, and computer program | |
JP2006215204A (ja) | 音声合成装置およびプログラム | |
JP4516157B2 (ja) | 音声分析装置、音声分析合成装置、補正規則情報生成装置、音声分析システム、音声分析方法、補正規則情報生成方法、およびプログラム | |
US11289066B2 (en) | Voice synthesis apparatus and voice synthesis method utilizing diphones or triphones and machine learning | |
US20210375248A1 (en) | Sound signal synthesis method, generative model training method, sound signal synthesis system, and recording medium | |
JP2016161919A (ja) | 音声合成装置 | |
WO2020095951A1 (ja) | 音響処理方法および音響処理システム | |
JP6977818B2 (ja) | 音声合成方法、音声合成システムおよびプログラム | |
Bonada et al. | Generation of growl-type voice qualities by spectral morphing | |
WO2020241641A1 (ja) | 生成モデル確立方法、生成モデル確立システム、プログラムおよび訓練データ準備方法 | |
CN1647152A (zh) | 合成语音的方法 | |
US11756558B2 (en) | Sound signal generation method, generative model training method, sound signal generation system, and recording medium | |
JP6213217B2 (ja) | 音声合成装置及び音声合成用コンピュータプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20140620 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20141009 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20141028 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20141225 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20150410 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20150602 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20150615 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 5772739 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |