JP5679451B2 - 音声処理装置およびそのプログラム - Google Patents
音声処理装置およびそのプログラム Download PDFInfo
- Publication number
- JP5679451B2 JP5679451B2 JP2011169300A JP2011169300A JP5679451B2 JP 5679451 B2 JP5679451 B2 JP 5679451B2 JP 2011169300 A JP2011169300 A JP 2011169300A JP 2011169300 A JP2011169300 A JP 2011169300A JP 5679451 B2 JP5679451 B2 JP 5679451B2
- Authority
- JP
- Japan
- Prior art keywords
- basic period
- conversion
- magnification
- spectrum
- preserving
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Description
所望倍率が所定の範囲内(一例として、倍率1を中心として、上下に各所定パーセンテージの範囲内。さらに、例えば、上下に各40パーセントの範囲内、つまり、所望倍率0.6以上且つ1.4以下)の場合にはサンプリングレート変換型基本周期変換部による周期変換の倍率を1として、それに合わせてスペクトル包絡保存型基本周期変換部による周期変換の倍率を定めることができる(一例として、所望倍率αに対して、スペクトル包絡保存型基本周期変換部による周期変換の倍率もαとする)。これにより、声の個人性を維持できる
所望倍率が、上記所定範囲の外(つまり、基本周期を40%以上変えることを所望する)の場合には、サンプリングレート変換型基本周期変換部による周期変換の倍率を1以外の値として、これによってスペクトル包絡保存型基本周期変換部による周期変換の倍率を上位所定範囲内の値(例えば、その範囲の境界である0.6または1.4)として、これにより音質の劣化を防止することができる。
次に、図面を参照しながら、本発明の一実施形態について説明する。
図1は、本実施形態による音声処理装置の機能構成を示すブロック図である。図示するように、音声処理装置1は、有声度算出部100と、サンプリングレート変換型基本周期変換部110と、接続部120と、基本周期変換部200とを含んで構成される。またさらに、基本周期変換部200は、基本周期抽出部210と、基本周期区間分割部220と、変換倍率算出部260と、変換倍率設定部270と、スペクトル包絡保存型基本周期変換部240と、サンプリングレート変換型基本周期変換部250とを含んで構成される。
接続部120は、無変換で渡される音声と、サンプリングレート変換型基本周期変換部110から渡される音声と、基本周期変換部200から渡される音声とを、再度接続し、出力音声として出力する。
基本周期抽出部210は、入力される音声の基本周期を求める。
基本周期区間分割部220は、基本周期の長さに合わせて、入力音声波形を基本周期ごとに区分化する。
サンプリングレート変換型基本周期変換部250は、変換倍率算出部260から渡されるθの値を用いて、サンプリングレート変換型の基本周期変換方式で、入力される音声の基本周期をθ倍に(第2の倍率で)変換して出力する。サンプリングレート変換型基本周期変換部250は、サンプリングレート変換型の基本周期得変換を、入力音声の波形の線形伸縮により行う。
変換倍率算出部260は、スペクトル包絡保存型基本周期変換部240による周期変換およびサンプリングレート変換型基本周期変換部250による周期変換を合わせた所望倍率αに基づいて、それぞれの変換における倍率(後述するβおよびθ)を算出し、算出された倍率の情報を、スペクトル包絡保存型基本周期変換部240とサンプリングレート変換型基本周期変換部250に渡す。
また、α(α>0)は入力音声に対して与えられる所望の基本周期変換倍率である。
なお、ここでは、0.2および0.4をそれぞれ基準値として有声度Rの大/中/小を判別しているが、異なる基準値を用いても良い。
基本周期抽出部210は、入力音声の基本周期を求める。基本周期を抽出方法は、既存技術を用いて行うことができる。基本周期抽出部210は、例えば、自己相関法やケプストラム法などを用いて入力音声の基本周期を求める。
このように、α<0.65の場合には、前述の「場合1−1」や「場合1−2」よりも、βがより大きな値となり、θがより小さな値となる。つまり、「場合1−1」や「場合1−2」よりも、サンプリングレート変換型基本周期変換方式のほうをより強く作用させる結果となる。
このように、α>1.35の場合には、前述の「場合1−1」や「場合1−3」よりも、βがより小さな値となり、θがより大きな値となる。つまり、「場合1−1」や「場合1−3」よりも、サンプリングレート変換型基本周期変換方式のほうをより強く作用させる結果となる。
の場合と、αL<αの場合に分けることができる。上述したのは、αS=0.6且つαL=1.4の場合と、αS=0.65且つαL=1.35の場合であるが、αSおよびαLとして、適宜異なる値を用いても良い。
つまり上記の、場合1−1から場合1−3までと、場合2−1から場合2−3までのそれぞれにおいて、β<1の場合には、それぞれの場合において示した値よりも、βを若干大きくする。また、θ<1の場合には、それぞれの場合において示した値よりも、θを若干大きくする。逆に、β>1の場合には、それぞれの場合において示した値よりも、βを若干小さくする。また、θ>1の場合には、それぞれの場合において示した値よりも、θを若干小さくする。
つまり、このとき、変換倍率算出部260は、α<1の場合には、α<(β・θ)<(α+αdiff)<1となるように、βおよびθの値を設定する。また、変換倍率算出部260は、α>1の場合には、1<(α−αdiff)<(β・θ)<αとなるように、βおよびθの値を設定する。なおここで、αdiffは、適宜決定される正数であり、例えば、αdiffを0.01以上且つ0.05以下の数とする。
次に、第2の実施形態について説明する。なお、本実施形態の技術事項において、前述の実施形態と共通する部分については同一の符号を付すとともに、その詳細な説明を省略する。以下では、本実施形態に特有な部分を中心に説明する。
スペクトル算出部440は、スペクトル包絡保存型基本周期変換部430によって周期変換された結果の音声のスペクトルを算出する。
スペクトル算出部450は、外部からの入力音声のスペクトルを算出する。
スペクトル歪み量算出部460は、スペクトル算出部440によって算出されたスペクトルと、スペクトル算出部450によって算出されたスペクトルとに基づいて、スペクトル歪み量Wを算出する。
基本周期抽出部210は、前実施形態におけるそれと同様に、入力音声の基本周期を求める。基本周期区間分割部220は、前実施形態におけるそれと同様に、基本周期の長さに合わせて、入力音声波形を基本周期ごとに区分化する。
スペクトル算出部440は、FFT(高速フーリエ変換)等によって、スペクトル包絡保存型基本周期変換部430から渡された波形を周波数領域に変換し、パワースペクトルやスペクトル包絡を算出し、スペクトル歪み量算出部460へ出力する。
100 有声度算出部
110 サンプリングレート変換型基本周期変換部
120 接続部
200 基本周期変換部
210 基本周期抽出部
220 基本周期区間分割部
240 スペクトル包絡保存型基本周期変換部
250 サンプリングレート変換型基本周期変換部
260 変換倍率算出部
270 変換倍率設定部
400 基本周期変換部
430 スペクトル包絡保存型基本周期変換部
440 スペクトル算出部(第1のスペクトル算出部)
450 スペクトル算出部(第2のスペクトル算出部)
460 スペクトル歪み量算出部
470 変換倍率算出部
Claims (4)
- スペクトル包絡保存型の基本周期変換方式で、入力される音声の基本周期を第1の倍率で変換して出力するスペクトル包絡保存型基本周期変換部と、
サンプリングレート変換型の基本周期変換方式で、入力される音声の基本周期を第2の倍率で変換して出力するサンプリングレート変換型基本周期変換部と、
を具備し、
(a)外部からの入力音声を前記スペクトル包絡保存型基本周期変換部への入力に接続し、前記スペクトル包絡保存型基本周期変換部からの出力を前記サンプリングレート変換型基本周期変換部への入力に接続し、前記サンプリングレート変換型基本周期変換部からの出力音声を外部への出力とし、
または、
(b)外部からの入力音声を前記サンプリングレート変換型基本周期変換部への入力に接続し、前記サンプリングレート変換型基本周期変換部からの出力を前記スペクトル包絡保存型基本周期変換部への入力に接続し、前記スペクトル包絡保存型基本周期変換部からの出力音声を外部への出力とする、
ことを特徴とする音声処理装置。 - 前記スペクトル包絡保存型基本周期変換部による周期変換および前記サンプリングレート変換型基本周期変換部による周期変換を合成したときの所望倍率に基づいて、前記第1の倍率および前記第2の倍率を算出し、前記第1の倍率の情報を前記スペクトル包絡保存型基本周期変換部に渡し、前記第2の倍率の情報を前記サンプリングレート変換型基本周期変換部に渡す変換倍率算出部、
を更に具備することを特徴とする請求項1に記載の音声処理装置。 - スペクトル包絡保存型の基本周期変換方式で前記外部からの入力音声を周期変換した結果の音声のスペクトルを算出する第1のスペクトル算出部と、
前記外部からの入力音声のスペクトルを算出する第2のスペクトル算出部と、
前記第1のスペクトル算出部によって算出されたスペクトルと、前記第2のスペクトル算出部によって算出されたスペクトルとに基づいて、スペクトル包絡保存型の基本周期変換方式によるスペクトル歪み量を算出するスペクトル歪み量算出部と、
を更に具備し、
前記変換倍率算出部は、算出された前記スペクトル歪み量にも基づいて前記第1の倍率および前記第2の倍率を算出する、
ことを特徴とする請求項2に記載の音声処理装置。 - スペクトル包絡保存型の基本周期変換方式で、入力される音声の基本周期を第1の倍率で変換して出力するスペクトル包絡保存型基本周期変換部と、
サンプリングレート変換型の基本周期変換方式で、入力される音声の基本周期を第2の倍率で変換して出力するサンプリングレート変換型基本周期変換部と、
を具備し、
(a)外部からの入力音声を前記スペクトル包絡保存型基本周期変換部への入力に接続し、前記スペクトル包絡保存型基本周期変換部からの出力を前記サンプリングレート変換型基本周期変換部への入力に接続し、前記サンプリングレート変換型基本周期変換部からの出力音声を外部への出力とし、
または、
(b)外部からの入力音声を前記サンプリングレート変換型基本周期変換部への入力に接続し、前記サンプリングレート変換型基本周期変換部からの出力を前記スペクトル包絡保存型基本周期変換部への入力に接続し、前記スペクトル包絡保存型基本周期変換部からの出力音声を外部への出力とする、
ことを特徴とする音声処理装置としてコンピューターを機能させるプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011169300A JP5679451B2 (ja) | 2011-08-02 | 2011-08-02 | 音声処理装置およびそのプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011169300A JP5679451B2 (ja) | 2011-08-02 | 2011-08-02 | 音声処理装置およびそのプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2013033140A JP2013033140A (ja) | 2013-02-14 |
JP5679451B2 true JP5679451B2 (ja) | 2015-03-04 |
Family
ID=47789083
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011169300A Active JP5679451B2 (ja) | 2011-08-02 | 2011-08-02 | 音声処理装置およびそのプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5679451B2 (ja) |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3693981B2 (ja) * | 1995-03-06 | 2005-09-14 | ローランド株式会社 | ピッチ変換装置 |
JPH1074096A (ja) * | 1996-08-30 | 1998-03-17 | Fujitsu Ltd | 音声処理装置 |
US6049766A (en) * | 1996-11-07 | 2000-04-11 | Creative Technology Ltd. | Time-domain time/pitch scaling of speech or audio signals with transient handling |
JPH10301599A (ja) * | 1997-04-30 | 1998-11-13 | Nec Corp | 音声合成装置 |
-
2011
- 2011-08-02 JP JP2011169300A patent/JP5679451B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2013033140A (ja) | 2013-02-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9368103B2 (en) | Estimation system of spectral envelopes and group delays for sound analysis and synthesis, and audio signal synthesis system | |
US8898055B2 (en) | Voice quality conversion device and voice quality conversion method for converting voice quality of an input speech using target vocal tract information and received vocal tract information corresponding to the input speech | |
JP4705203B2 (ja) | 声質変換装置、音高変換装置および声質変換方法 | |
US20070185715A1 (en) | Method and apparatus for generating a frequency warping function and for frequency warping | |
US8370153B2 (en) | Speech analyzer and speech analysis method | |
JP4516157B2 (ja) | 音声分析装置、音声分析合成装置、補正規則情報生成装置、音声分析システム、音声分析方法、補正規則情報生成方法、およびプログラム | |
JP6349112B2 (ja) | サウンドマスキング装置、方法及びプログラム | |
JP2012159540A (ja) | 話速変換倍率決定装置、話速変換装置、プログラム、及び記録媒体 | |
JP2018004870A (ja) | 音声合成装置および音声合成方法 | |
JP2012208177A (ja) | 帯域拡張装置及び音声補正装置 | |
JP2009223210A (ja) | 信号帯域拡張装置および信号帯域拡張方法 | |
EP3113180B1 (en) | Method for performing audio inpainting on a speech signal and apparatus for performing audio inpainting on a speech signal | |
JP5830364B2 (ja) | 韻律変換装置およびそのプログラム | |
JP5679451B2 (ja) | 音声処理装置およびそのプログラム | |
JP2006215228A (ja) | 音声信号分析方法およびこの分析方法を実施する装置、この音声信号分析装置を用いた音声認識装置、この分析方法を実行するプログラムおよびその記憶媒体 | |
Dorran et al. | A comparison of time-domain time-scale modification algorithms | |
JP4468506B2 (ja) | 音声データ作成装置および声質変換方法 | |
KR100484666B1 (ko) | 성도특성 변환을 이용한 음색변환장치 및 방법 | |
JP6232710B2 (ja) | 録音音声の明瞭化装置 | |
JP6213217B2 (ja) | 音声合成装置及び音声合成用コンピュータプログラム | |
JPH08254992A (ja) | 話速変換装置 | |
JP5677137B2 (ja) | 韻律変換装置およびプログラム | |
JP3302075B2 (ja) | 合成パラメータ変換方法および装置 | |
JP6371530B2 (ja) | 音声信号処理装置及び音声ピッチ変換プログラム | |
JP5723568B2 (ja) | 話速変換装置及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20140217 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20141128 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20141202 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20141226 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5679451 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |