JP2012088392A - 話速変換装置及びプログラム - Google Patents
話速変換装置及びプログラム Download PDFInfo
- Publication number
- JP2012088392A JP2012088392A JP2010232822A JP2010232822A JP2012088392A JP 2012088392 A JP2012088392 A JP 2012088392A JP 2010232822 A JP2010232822 A JP 2010232822A JP 2010232822 A JP2010232822 A JP 2010232822A JP 2012088392 A JP2012088392 A JP 2012088392A
- Authority
- JP
- Japan
- Prior art keywords
- speech
- time
- fundamental frequency
- change
- power
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000006243 chemical reaction Methods 0.000 title claims abstract description 152
- 230000008859 change Effects 0.000 claims abstract description 137
- 230000008602 contraction Effects 0.000 claims description 67
- 238000000034 method Methods 0.000 description 20
- 238000004364 calculation method Methods 0.000 description 17
- 238000012545 processing Methods 0.000 description 16
- 230000006870 function Effects 0.000 description 8
- 230000002123 temporal effect Effects 0.000 description 8
- 238000009499 grossing Methods 0.000 description 6
- 210000001260 vocal cord Anatomy 0.000 description 5
- 230000000694 effects Effects 0.000 description 4
- 230000006866 deterioration Effects 0.000 description 3
- 230000003044 adaptive effect Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000015572 biosynthetic process Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 210000000056 organ Anatomy 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
- 230000001755 vocal effect Effects 0.000 description 1
Images
Abstract
【解決手段】本発明の話速変換装置100は、入力音声について区分した各区間について所定の倍率で時間伸縮を施す時間伸縮部122,124と、入力音声について区分した各区間における基本周波数の変化量を算出し、該変化量を基に、前記時間伸縮した各区間の音声に対して基本周波数を変換する基本周波数変換部206,208及び/又はパワーを変換するパワー変換部306を備える。
【選択図】図1
Description
また、本発明の話速変換装置において、前記基本周波数変換手段は、前記時間伸縮による話速変換前の値に対して、基本周波数の周波数差で求めた単位時間当たりの変化量が、当該時間伸縮前の値に対して、正の値をとる係数βを乗じた値となるよう、当該基本周波数を変換するように構成することができる。
なお、本発明の話速変換装置において、前記パワー変換手段は、当該音声の各区間におけるパワー差の単位時間当たりの変化量が、前記時間伸縮による話速変換前の値に対して、正の値をとる係数βを乗じた値となるよう、当該時間伸縮前の値に対して音声のパワーを変換するように構成することができる。
さらに、本発明のプログラムは、入力された音声に対して話速変換を行う話速変換装置として構成するコンピュータに、入力音声について区分した各区間について所定の倍率で時間伸縮を施すステップと、入力音声について区分した各区間における前記時間伸縮による話速変換前の基本周波数の変化量を算出し、該変化量を基に、前記時間伸縮した各区間の音声に対して基本周波数を変換するステップと、入力音声について区分した各区間における前記時間伸縮による話速変換前のパワーの変化量を算出し、該変化量を基に、前記時間伸縮した各区間の音声に対して音声のパワーを変換するステップと、を実行させるためのプログラムである。
また、基本周波数の変化量やパワーの変化量に制限を設けることで、音質の劣化を抑えることもできる。
本発明に係る要素を全て包含する態様であるが、幾つかの変形例があることは後述の説明から明らかになる。
図1に、本発明による一実施例の話速変換装置のブロック図を示す。本実施例の話速変換装置100は、入力波形について、音声区間の波形と無音区間の波形に分離する音声/無音判定部102と、無音区間波形用の処理系統の時間伸縮(話速変換)部126と、「音声区間波形用の処理系統の処理部群」(後述する)と、時間伸縮した無音区間波形及び音声区間波形を接続する波形接続部134とから構成される。尚、無音区間波形について処理しない場合には、話速変換装置100を「音声区間波形用処理系統の処理部群」のみから構成することができる。
Rs(t):時刻tにおける無音区間の時間伸縮倍率である。
Rv(t):時刻tにおける有声音区間の時間伸縮倍率である。
Ru(t):時刻tにおける無声音区間の時間伸縮倍率である。
αv,βv:有声音区間の基本周波数変換用の周波数比算出時の係数αまたは周波数差算出時の係数βである。
αu,βu:無声音区間の基本周波数変換用の周波数比を利用する場合の係数αまたは周波数差を利用する場合の係数βである。
αp,βp:パワー変換用のパワー比を利用する場合の係数αまたはパワー差を利用する場合の係数βである。
また、話速変換前の値に対する変換量に、上限または下限をパラメータとして設定する。
図2は、本発明による一実施例の話速変換装置の動作を示すフローチャートである。まず、話速変換装置100は、話速調整を行なう信号を入力するとともに、各パラメータを入力する(ステップS1)。次に、話速変換装置100は、音声/無音判定部102によって、入力波形について音声区間の波形と無音区間の波形に分離する(ステップS2)。尚、音声区間は声帯が振動して発せられる有声音の区間と、声帯が振動せずに発せられる無声音の区間があるが、必ずしも無声音区間についは処理しなくともよい。
102 音声/無音判定部
104 有声音/無声音判定部
106 基本周波数抽出部
108 擬似基本周波数算出部
122 時間伸縮(話速変換)部
124 時間伸縮(話速変換)部
126 時間伸縮(話速変換)部
132 波形接続部
134 波形接続部
200 基本周波数制御部
202 基本周波数変化量算出部
204 擬似基本周波数変化量算出部
206 基本周波数変換部
208 擬似基本周波数変換部
300 パワー制御部
302 パワー算出部
304 パワー変化量算出部
306 パワー変換部
Claims (9)
- 入力された音声に対して話速変換を行う話速変換装置であって、
入力音声について区分した各区間について所定の倍率で時間伸縮を施す時間伸縮手段と、
入力音声について区分した各区間における前記時間伸縮による話速変換前の、所定の時間当たりの基本周波数の変化量を算出し、該変化量を基に、前記時間伸縮した各区間の音声に対して基本周波数を変換する基本周波数変換手段と、
を備えることを特徴とする、話速変換装置。 - 前記基本周波数変換手段は、有声音区間と無声音区間のそれぞれの区間における、所定の時間当たりの基本周波数の変化量を算出し、前記時間伸縮した各区間の音声に対して基本周波数を変換する手段を有することを特徴とする、請求項1に記載の話速変換装置。
- 入力音声について区分した各区間におけるパワーの変化量を算出し、前記時間伸縮による話速変換前の、所定の時間当たりのパワーの変化量に応じて、前記時間伸縮した各区間の音声に対して、音声のパワーを変換するパワー変換手段を更に備えることを特徴とする、請求項1又は2に記載の話速変換装置。
- 入力された音声に対して話速変換を行う話速変換装置であって、
入力音声について区分した各区間について所定の倍率で時間伸縮を施す時間伸縮手段と、
入力音声について区分した各区間における前記時間伸縮による話速変換前の、所定の時間当たりのパワーの変化量に応じて、前記時間伸縮した各区間の音声に対して、音声のパワーを変換するパワー変換手段と、
を備えることを特徴とする、話速変換装置。 - 入力音声について区分した各区間における基本周波数の変化量を算出するにあたり、一定の時間間隔で実際に抽出された基本周波数の時間変化を平滑化して、前記一定の時間間隔で定義される基本周波数の時間変化の概形を用いて、当該基本周波数の所定の時間当たりの変化量を求める手段を有することを特徴とする、請求項1〜3のいずれか一項に記載の話速変換装置。
- 前記基本周波数変換手段は、入力音声について区分した各区間におけるパワーの変化量を算出するにあたり、一定の時間間隔で実際に抽出されたパワーの時間変化を平滑化して、前記一定の時間間隔で定義されるパワーの時間変化の概形を用いて、当該パワーの所定の時間当たりの変化量を求める手段を有することを特徴とする、請求項3または4に記載の話速変換装置。
- 入力された音声に対して話速変換を行う話速変換装置として構成するコンピュータに、
入力音声について区分した各区間について所定の倍率で時間伸縮を施すステップと、
入力音声について区分した各区間における前記時間伸縮による話速変換前の基本周波数の変化量を算出し、該変化量を基に、前記時間伸縮した各区間の音声に対して基本周波数を変換するステップと、
を実行させるためのプログラム。 - 入力された音声に対して話速変換を行う話速変換装置として構成するコンピュータに、
入力音声について区分した各区間について所定の倍率で時間伸縮を施すステップと、
入力音声について区分した各区間における前記時間伸縮による話速変換前のパワーの変化量を算出し、該変化量を基に、前記時間伸縮した各区間の音声に対して音声のパワーを変換するステップと、
を実行させるためのプログラム。 - 入力された音声に対して話速変換を行う話速変換装置として構成するコンピュータに、
入力音声について区分した各区間について所定の倍率で時間伸縮を施すステップと、
入力音声について区分した各区間における前記時間伸縮による話速変換前の基本周波数の変化量を算出し、該変化量を基に、前記時間伸縮した各区間の音声に対して基本周波数を変換するステップと、
入力音声について区分した各区間における前記時間伸縮による話速変換前のパワーの変化量を算出し、該変化量を基に、前記時間伸縮した各区間の音声に対して音声のパワーを変換するステップと、
を実行させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010232822A JP5723568B2 (ja) | 2010-10-15 | 2010-10-15 | 話速変換装置及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010232822A JP5723568B2 (ja) | 2010-10-15 | 2010-10-15 | 話速変換装置及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2012088392A true JP2012088392A (ja) | 2012-05-10 |
JP5723568B2 JP5723568B2 (ja) | 2015-05-27 |
Family
ID=46260109
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010232822A Active JP5723568B2 (ja) | 2010-10-15 | 2010-10-15 | 話速変換装置及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5723568B2 (ja) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0193795A (ja) * | 1987-10-06 | 1989-04-12 | Nippon Hoso Kyokai <Nhk> | 音声の発声速度変換方法 |
JPH06289895A (ja) * | 1993-04-05 | 1994-10-18 | Nippon Hoso Kyokai <Nhk> | リアルタイム話速変換方法 |
JPH1097291A (ja) * | 1996-09-20 | 1998-04-14 | Matsushita Electric Ind Co Ltd | Vcv波形接続音声のピッチ変換方法及び音声合成装置 |
JP2006301464A (ja) * | 2005-04-22 | 2006-11-02 | Kyushu Institute Of Technology | ピッチ周期等化装置及びピッチ周期等化方法、並びに音声符号化装置、音声復号装置及び音声符号化方法 |
JP2009075280A (ja) * | 2007-09-20 | 2009-04-09 | Nippon Hoso Kyokai <Nhk> | コンテンツ再生装置 |
JP2010014955A (ja) * | 2008-07-03 | 2010-01-21 | Panasonic Corp | ディジタル音声処理装置および音声処理方法 |
-
2010
- 2010-10-15 JP JP2010232822A patent/JP5723568B2/ja active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0193795A (ja) * | 1987-10-06 | 1989-04-12 | Nippon Hoso Kyokai <Nhk> | 音声の発声速度変換方法 |
JPH06289895A (ja) * | 1993-04-05 | 1994-10-18 | Nippon Hoso Kyokai <Nhk> | リアルタイム話速変換方法 |
JPH1097291A (ja) * | 1996-09-20 | 1998-04-14 | Matsushita Electric Ind Co Ltd | Vcv波形接続音声のピッチ変換方法及び音声合成装置 |
JP2006301464A (ja) * | 2005-04-22 | 2006-11-02 | Kyushu Institute Of Technology | ピッチ周期等化装置及びピッチ周期等化方法、並びに音声符号化装置、音声復号装置及び音声符号化方法 |
JP2009075280A (ja) * | 2007-09-20 | 2009-04-09 | Nippon Hoso Kyokai <Nhk> | コンテンツ再生装置 |
JP2010014955A (ja) * | 2008-07-03 | 2010-01-21 | Panasonic Corp | ディジタル音声処理装置および音声処理方法 |
Non-Patent Citations (1)
Title |
---|
JPN6014029488; 中村章他: '"リアルタイム話速変換型受聴システム"' 日本音響学会誌 Vol.50,No.7, 199407, pp.509-520 * |
Also Published As
Publication number | Publication date |
---|---|
JP5723568B2 (ja) | 2015-05-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4355772B2 (ja) | 力み変換装置、音声変換装置、音声合成装置、音声変換方法、音声合成方法およびプログラム | |
US8255222B2 (en) | Speech separating apparatus, speech synthesizing apparatus, and voice quality conversion apparatus | |
JP4705203B2 (ja) | 声質変換装置、音高変換装置および声質変換方法 | |
US8311842B2 (en) | Method and apparatus for expanding bandwidth of voice signal | |
JP5593244B2 (ja) | 話速変換倍率決定装置、話速変換装置、プログラム、及び記録媒体 | |
JP2001249677A (ja) | テキスト音声変換装置におけるピッチパタン制御方法 | |
US8370153B2 (en) | Speech analyzer and speech analysis method | |
JPH086592A (ja) | 音声合成方法及び装置 | |
JP5039865B2 (ja) | 声質変換装置及びその方法 | |
US20100217584A1 (en) | Speech analysis device, speech analysis and synthesis device, correction rule information generation device, speech analysis system, speech analysis method, correction rule information generation method, and program | |
JP2020507819A (ja) | スペクトル包絡線のフォルマントの周波数シフトによって声の音質を動的に修正するための方法および装置 | |
JP3732793B2 (ja) | 音声合成方法、音声合成装置及び記録媒体 | |
JP2004272292A (ja) | 音信号加工方法 | |
JP2904279B2 (ja) | 音声合成方法および装置 | |
JP2007079606A (ja) | 音信号加工方法 | |
JP5723568B2 (ja) | 話速変換装置及びプログラム | |
JP2013033103A (ja) | 声質変換装置および声質変換方法 | |
CN112420062A (zh) | 一种音频信号处理方法及设备 | |
JP4963345B2 (ja) | 音声合成方法及び音声合成プログラム | |
JP5106274B2 (ja) | 音声処理装置、音声処理方法及びプログラム | |
JP2612867B2 (ja) | 音声ピッチ変換方法 | |
JP5935545B2 (ja) | 音声合成装置 | |
JP2011141470A (ja) | 素片情報生成装置、音声合成システム、音声合成方法、及び、プログラム | |
JPH08110796A (ja) | 音声強調方法および装置 | |
JPH08254992A (ja) | 話速変換装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20130806 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20140626 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20140715 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20140903 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20150303 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20150330 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5723568 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |