JP2008026565A - ピッチ変換方法及び装置 - Google Patents
ピッチ変換方法及び装置 Download PDFInfo
- Publication number
- JP2008026565A JP2008026565A JP2006198560A JP2006198560A JP2008026565A JP 2008026565 A JP2008026565 A JP 2008026565A JP 2006198560 A JP2006198560 A JP 2006198560A JP 2006198560 A JP2006198560 A JP 2006198560A JP 2008026565 A JP2008026565 A JP 2008026565A
- Authority
- JP
- Japan
- Prior art keywords
- pitch
- deterioration
- degree
- input signal
- pattern
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000006243 chemical reaction Methods 0.000 title claims abstract description 405
- 238000000034 method Methods 0.000 title claims abstract description 64
- 230000006866 deterioration Effects 0.000 claims abstract description 414
- 238000012545 processing Methods 0.000 claims abstract description 77
- 239000011295 pitch Substances 0.000 claims description 984
- 230000008859 change Effects 0.000 claims description 277
- 238000011156 evaluation Methods 0.000 claims description 134
- 238000006731 degradation reaction Methods 0.000 claims description 96
- 230000015556 catabolic process Effects 0.000 claims description 94
- 238000000605 extraction Methods 0.000 claims description 35
- NUHSROFQTUXZQQ-UHFFFAOYSA-N isopentenyl diphosphate Chemical compound CC(=C)CCO[P@](O)(=O)OP(O)(O)=O NUHSROFQTUXZQQ-UHFFFAOYSA-N 0.000 abstract description 19
- AYEKOFBPNLCAJY-UHFFFAOYSA-O thiamine pyrophosphate Chemical compound CC1=C(CCOP(O)(=O)OP(O)(O)=O)SC=[N+]1CC1=CN=C(C)N=C1N AYEKOFBPNLCAJY-UHFFFAOYSA-O 0.000 abstract description 17
- 238000004364 calculation method Methods 0.000 description 143
- 230000008569 process Effects 0.000 description 20
- 238000010586 diagram Methods 0.000 description 17
- 239000000284 extract Substances 0.000 description 6
- 230000007704 transition Effects 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 2
- 238000012854 evaluation process Methods 0.000 description 2
- 230000000630 rising effect Effects 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 230000008602 contraction Effects 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 230000002542 deteriorative effect Effects 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/04—Time compression or expansion
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/003—Changing voice quality, e.g. pitch or formants
Landscapes
- Engineering & Computer Science (AREA)
- Quality & Reliability (AREA)
- Human Computer Interaction (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Electrophonic Musical Instruments (AREA)
- Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Testing Resistance To Weather, Investigating Materials By Mechanical Methods (AREA)
- Monitoring And Testing Of Exchanges (AREA)
Abstract
【解決手段】所定の処理単位分の入力信号ピッチパターンIPPと目標ピッチパターンTPPとを入力して、入力信号ピッチパターンIPPから目標ピッチパターンTPPへのピッチ変換を行う際に入力信号の波形が劣化する劣化度DGRを算出する。或いは、予測される全ての音声状態及び音素種別の組合せと劣化度DRGとを対応付けて記録したデータベース中から、入力信号の音声状態及び音素種別に対応する劣化度DGRを抽出する。そして、劣化度DGRに応じて、ピッチ変換を小さいデータ処理量で行うピッチ変換部410と大きいデータ処理量で行うピッチ変換部420とを切り替える。
【選択図】図1
Description
このピッチ変換技術は、入力信号のピッチ周期毎の波形を目標のピッチに合わせて重複加算することによりピッチ変換を行う(すなわち結果として、入力信号が時間軸方向に伸縮される)ものであり、一般に、PSOLA(Pitch-Synchronous Overlap and Add)方式と呼ばれている(例えば、特許文献1参照。)。
このピッチ変換技術では、まず、入力信号を線形予測分析して包絡信号(フォルマント成分)と残差信号(ハーモニクス成分)に分離する。そして、該残差信号だけを上記の従来例[1]と同様にピッチ変換すると共に、該ピッチ変換した残差信号と元の包絡信号とを、該入力信号から算出した線形予測係数を用いて合成する。
I. 実施例[1]:図1〜13
I.1. 構成例 (劣化評価部の実施例(1)〜(7)に共通):図1
I.2. 全体動作例 (実施例[2]及び[3]にも共通):図2
I.3. 劣化評価部の実施例(1)〜(7):図3〜13
I.3.A 劣化評価部の実施例(1):図3及び4
I.3.A.a 構成例:図3
I.3.A.b 動作例:図4
I.3.B 劣化評価部の実施例(2):図5及び6
I.3.B.a 構成例:図5
I.3.B.b 動作例:図6
I.3.C 劣化評価部の実施例(3):図7〜9
I.3.C.a 構成例:図7
I.3.C.b 動作例:図8及び9
I.3.D 劣化評価部の実施例(4):図10
I.3.E 劣化評価部の実施例(5):図11
I.3.F 劣化評価部の実施例(6):図12
I.3.G 劣化評価部の実施例(7):図13
II. 実施例[2]:図14及び15
II.1. 構成例:図14
II.2. 動作例:図15
III. 実施例[3]:図16〜23
III.1. 構成例 (劣化評価部の実施例(8)〜(14)にも共通):図16
III.2. 動作例:図17〜23
III.3. 劣化評価部の実施例(8)〜(14):図17〜23
III.3.A 劣化評価部の実施例(8):図17
III.3.B 劣化評価部の実施例(9):図18
III.3.C 劣化評価部の実施例(10):図19
III.3.D 劣化評価部の実施例(11):図20
III.3.E 劣化評価部の実施例(12):図21
III.3.F 劣化評価部の実施例(13):図22
III.3.G 劣化評価部の実施例(14):図23
I.1.構成例 (劣化評価部の実施例(1)〜(7)に共通):図1
図1に示す本発明の実施例[1]に係るピッチ変換装置10は、所定の処理単位分の入力信号ピッチパターンIPP、このピッチパターンIPPに対する目標ピッチパターンTPP、及びピッチマークPMとを入力し、劣化度DGRを算出する劣化評価部100と、この劣化度DGRに応じてピッチ変換を行うピッチ変換部200とで構成されている。
図2に示すように、劣化評価部100は、所定の処理単位分の入力信号ピッチパターンIPP、ピッチマークPM、及び目標ピッチパターンTPPを入力し(ステップS1)、後述する劣化評価処理を実行して得た劣化度DGRを、ピッチ変換部200内の切替部400に与える(ステップS2)。
I.3.A劣化評価部の実施例(1):図3及び4
I.3.A.a構成例:図3
図3に示す劣化評価部100は、入力信号ピッチパターンIPP、ピッチマークPM、及び目標ピッチパターンTPPを入力し、平均ピッチ変換量PCを算出する平均ピッチ変換量算出部110と、この平均ピッチ変換量PCから劣化度DGRを算出する劣化度算出部120とを備えている。
図4(i)に示すように、平均ピッチ変換量算出部110は、入力信号に対する平均ピッチ変換量PCを以下の式(1)に従って算出し、これを劣化度算出部120に与える(ステップS10の平均ピッチ変換量算出処理T1)。
・劣化度DGR = f1(PC)
= a・PC+b …式(2)
I.3.B.a構成例:図5
図5に示す劣化評価部100は、入力信号ピッチパターンIPP、ピッチマークPM、及び目標ピッチパターンTPPの内の「一部」を入力し、平均信号差分DIFを算出する平均信号差分算出部130と、この平均信号差分DIFから劣化度DGRを算出する劣化度算出部120とを備えている。
図6に示すように、平均信号差分算出部130は、平均信号差分算出処理T2を実行して出力信号Out2に対する出力信号Out1の平均信号差分DIFを算出する。
・劣化度DGR = f2(DIF)
= c・DIF+d (c,dは係数) …式(4)
I.3.C.a構成例:図7
図7に示す劣化評価部100は、入力信号ピッチパターンIPP及び目標ピッチパターンTPPが推移し得る変化傾向とピッチパターン変化度CHGとを対応付けて記録したピッチパターン変化度算出テーブルTBLと、入力信号ピッチパターンIPP、ピッチマークPM、及び目標ピッチパターンTPPを入力すると共に、このテーブルTBLを参照し、ピッチパターン変化度CHGを決定して出力するピッチパターン変化度算出部140と、このピッチパターン変化度CHGから劣化度DGRを算出する劣化度算出部120とを備えている。
図8に示すように、ピッチパターン変化度算出部140は、ピッチパターン変化度算出処理T3を実行して入力信号ピッチパターンIPPに対する目標ピッチパターンTPPへのピッチパターン変化度CHGを決定する。
・劣化度DGR = f3(CHG) …式(5)
ここで、上記の関数f3は、上記の劣化評価部の実施例(1)又は(2)で説明した関数f1又はf2と同様のものを使用することができる。
図10(i)に示す劣化評価部100は、上記の劣化評価部の実施例(1)の構成に加えて、上記の劣化評価部の実施例(2)と同様の平均信号差分算出部130を備えており、但し、劣化度算出部120が、平均ピッチ変換量算出部110及び平均信号差分算出部130から出力される平均ピッチ変換量PC及び平均信号差分DIFから劣化度DGRを算出する点が異なっている。
・劣化度DGR = f4(PC, DIF)
= α1・f1(PC)+(1-α1)・f2(DIF) (α1は係数) …式(6)
図11(i)に示す劣化評価部100は、上記の劣化評価部の実施例(1)の構成に加えて、上記の劣化評価部の実施例(3)と同様のピッチパターン変化度算出部140及びピッチパターン変化度算出テーブルTBLを備えており、但し、劣化度算出部120が、平均ピッチ変換量算出部110及びピッチパターン変化度算出部140から出力される平均ピッチ変換量PC及びピッチパターン変化度CHGから劣化度DGRを算出する点が異なっている。
・劣化度DGR = f5(PC, CHG)
= α2・f1(PC)+(1-α2)・f3(CHG) (α2は係数) …式(7)
図12(i)に示す劣化評価部100は、上記の劣化評価部の実施例(2)の構成に加えて、上記の劣化評価部の実施例(3)と同様のピッチパターン変化度算出部140及びピッチパターン変化度算出テーブルTBLを備えており、但し、劣化度算出部120が、平均信号差分算出部130及びピッチパターン変化度算出部140から出力される平均信号差分DIF及びピッチパターン変化度CHGから劣化度DGRを算出する点が異なっている。
・劣化度DGR = f6(DIF, CHG)
= α3・f2(DIF)+(1-α3)・f3(CHG) (α3は係数) …式(8)
図13(i)に示す劣化評価部100は、上記の劣化評価部の実施例(4)の構成に加えて、上記の劣化評価部の実施例(3)と同様のピッチパターン変化度算出部140及びピッチパターン変化度算出テーブルTBLを備えており、但し、劣化度算出部120が、平均ピッチ変換量算出部110、平均信号差分算出部130、及びピッチパターン変化度算出部140から出力される平均ピッチ変換量PC、平均信号差分DIF、及びピッチパターン変化度CHGから劣化度DGRを算出する点が異なっている。
・劣化度DGR = f7(PC, DIF, CHG)
=β1・f1(PC)+β2・f2(DIF)
+β3・f3(CHG) (β1〜β3は、β1+β2+β3=1を満たす係数) …式(9)
II.1.構成例:図14
図14に示す本発明の実施例[2]に係るピッチ変換装置10は、上記の実施例[1]において、劣化評価部100に代えて、入力信号として予測される全ての音声状態及び音素種別の組合せと劣化度DGRとを対応付けて記録した劣化ルールデータベースDBと、入力信号の音声状態及び音素種別を示す付加情報INFOを入力して、このデータベースDBから劣化度DGRを抽出する劣化度抽出部500とを含むように構成されている点が異なっている。
図15(1)に示すように、劣化度抽出部500は、入力した付加情報INFOが示す音声状態及び音素種別に対応する劣化度DGRを、同図(2)に示す劣化ルールデータベースDBから抽出して切替部400に与える(劣化度抽出処理T4)。
III.1.構成例 (劣化評価部の実施例(8)〜(14)にも共通):図16
図16に示す本発明の実施例[3]に係るピッチ変換装置10は、上記の実施例[1]の構成に加えて、入力信号の音声状態及び音素種別を示す付加情報INFOを劣化評価部100に対して入力するように構成されている。
次に、本実施例の動作を説明するが、劣化評価部100における劣化度DGRの算出処理に係る構成及び動作を除いては上記の実施例[1]及び[2]と共通であるため、劣化評価部100の実施例(8)〜(14)のみを、図17〜23を参照して説明する。
III.3.A劣化評価部の実施例(8):図17
図17(i)に示す劣化評価部100は、上記の実施例[1]及び[2]と同様の平均ピッチ変換量算出部110、劣化度抽出部500、及び劣化ルールデータベースDBに加えて、これらの算出部110及び抽出部500から出力される平均ピッチ変換量PC及び劣化度DGRから劣化度DGRを算出する劣化度算出部120とを備えている点が異なっている。
・劣化度DGR = f8(PC, DGR)
= α4・f1(PC)+(1-α4)・DGR …式(10)
図18(i)に示す劣化評価部100は、上記の実施例[1]及び[2]と同様の平均信号差分算出部130、劣化度抽出部500、及び劣化ルールデータベースDBに加えて、これらの算出部130及び抽出部500から出力される平均信号差分DIF及び劣化度DGRから劣化度DGRを算出する劣化度算出部120とを備えている点が異なっている。
・劣化度DGR = f9(PC, DGR)
= α5・f2(DIF)+(1-α5)・DGR (α5は係数) …式(11)
図19(i)に示す劣化評価部100は、上記の実施例[1]及び[2]と同様のピッチパターン変化度算出部140、ピッチパターン変化度算出テーブルTBL、劣化度抽出部500、及び劣化ルールデータベースDBに加えて、これらの算出部150及び抽出部500から出力されるピッチパターン変化度CHG及び劣化度DGRから劣化度DGRを算出する劣化度算出部120とを備えている点が異なっている。
・劣化度DGR = f10(CHG, DGR)
= α6・f3(CHG)+(1-α6)・DGR (α6は係数) …式(12)
図20(i)に示す劣化評価部100は、上記の劣化評価部の実施例(8)に加えて、上記の実施例[1]と同様の平均信号差分算出部130を追加した点が異なっている。
・劣化度DGR = f11(PC, DIF, DGR)
= γ1・f1(PC)+γ2・f2(DIF)
+γ3・DGR (γ1〜γ3は、γ1+γ2+γ3=1を満たす係数) …式(13)
図21(i)に示す劣化評価部100は、上記の劣化評価部の実施例(8)に加えて、上記の実施例[1]と同様のピッチパターン変化度算出部140及びピッチパターン変化度算出テーブルTBLを追加した点が異なっている。
・劣化度DGR = f12(PC, CHG, DGR)
= δ1・f1(PC)+δ2・f3(CHG)
+δ3・DGR (δ1〜δ3は、δ1+δ2+δ3=1を満たす係数) …式(14)
図22(i)に示す劣化評価部100は、上記の劣化評価部の実施例(9)に加えて、上記の実施例[1]と同様のピッチパターン変化度算出部140及びピッチパターン変化度算出テーブルTBLを追加した点が異なっている。
・劣化度DGR = f13(DIF, CHG, DGR)
= ε1・f2(DIF)+ε2・f3(CHG)
+ε3・DGR (ε1〜ε3は、ε1+ε2+ε3=1を満たす係数) …式(15)
図23(i)に示す劣化評価部100は、上記の劣化評価部の実施例(11)に加えて、上記の実施例[1]と同様のピッチパターン変化度算出部140及びピッチパターン変化度算出テーブルTBLを追加した点が異なっている。
・劣化度DGR = f14(PC, DIF, CHG, DGR)
= ζ1・f1(PC)+ζ2・f2(DIF)+ζ3・f3(CHG)
+ζ4・DGR (ζ1〜ζ4は、ζ1+ζ2+ζ3+ζ4=1を満たす係数)…式(16)
所定の処理単位分の入力信号ピッチパターンと該入力信号ピッチパターンに対する目標のピッチパターンとを入力して、該入力信号ピッチパターンから該目標ピッチパターンへのピッチ変換を行う際に該入力信号の波形が劣化する劣化度を算出する劣化評価ステップと、
該劣化度に応じて、予め定めたデータ処理量で該ピッチ変換を行うピッチ変換ステップと、
を備えたことを特徴とするピッチ変換方法。
(付記2)付記1において、
該劣化評価ステップが、
該目標ピッチパターンと該入力信号ピッチパターンとの所定周期毎のピッチ差の総和を、該入力信号ピッチパターンの該所定周期毎のピッチの総和で除算することにより平均ピッチ変換量を算出する平均ピッチ変換量算出ステップと、
該平均ピッチ変換量を所定の係数で重み付けした値を該劣化度として該ピッチ変換ステップに与える劣化度算出ステップと、
を含むことを特徴としたピッチ変換方法。
(付記3)付記1において、
該ピッチ変換ステップが、該劣化度の高低に応じた第1及び第2のピッチ変換ステップを含み、
これに合わせて、該劣化評価ステップも同一の第1及び第2のピッチ変換ステップを含み、
該劣化評価ステップが、さらに、該所定の処理単位分の該入力信号ピッチパターン及び該目標ピッチパターンの内の一部を、該第1のピッチ変換ステップでピッチ変換させて得られた第1ピッチ変換結果と、該第2のピッチ変換ステップでピッチ変換させて得られた第2ピッチ変換結果との所定周期毎のパワー差の総和を該第2ピッチ変換結果の該所定周期毎のパワーの総和で除算することにより平均信号差分を算出する平均信号差分算出ステップと、該平均信号差分を所定の係数で重み付けした値を該劣化度として該ピッチ変換ステップに与える劣化度算出ステップとを含むことを特徴としたピッチ変換方法。
(付記4)付記1において、
該劣化評価ステップが、
該入力信号ピッチパターンの変化傾向と該目標ピッチパターンの変化傾向を、それぞれ、該ピッチパターンの所定時間間隔毎の平均ピッチを算出して各平均ピッチの大きさを順次比較することにより予め定めた複数の変化傾向の内のいずれかに分類し、両変化傾向の組合せから該入力信号ピッチパターンに対する該目標ピッチパターンへのピッチパターン変化度を決定するピッチパターン変化度算出ステップと、
該ピッチパターン変化度を所定の係数で重み付けした値を該劣化度として該ピッチ変換ステップに与える劣化度算出ステップと、
を含むことを特徴としたピッチ変換方法。
(付記5)付記2において、
該ピッチ変換ステップが、該劣化度の高低に応じた第1及び第2のピッチ変換ステップを含み、
これに合わせて、該劣化評価ステップも同一の第1及び第2のピッチ変換ステップを含み、
該劣化評価ステップが、さらに、該所定の処理単位分の該入力信号ピッチパターン及び該目標ピッチパターンの内の一部を、該第1のピッチ変換ステップでピッチ変換させて得られた第1ピッチ変換結果と、該第2のピッチ変換ステップでピッチ変換させて得られた第2ピッチ変換結果との所定周期毎のパワー差の総和を該第2ピッチ変換結果の該所定周期毎のパワーの総和で除算することにより平均信号差分を算出する平均信号差分算出ステップを含み、
該劣化度算出ステップが、該平均ピッチ変換量及び該平均信号差分をそれぞれ所定の係数で重み付けした値の和を該劣化度として該ピッチ変換ステップに与えることを特徴としたピッチ変換方法。
(付記6)付記2において、
該劣化評価ステップが、さらに、該入力信号ピッチパターンの変化傾向と該目標ピッチパターンの変化傾向を、それぞれ、該ピッチパターンの所定時間間隔毎の平均ピッチを算出して各平均ピッチの大きさを順次比較することにより予め定めた複数の変化傾向の内のいずれかに分類し、両変化傾向の組合せから該入力信号ピッチパターンに対する該目標ピッチパターンへのピッチパターン変化度を決定するピッチパターン変化度算出ステップを含み、
該劣化度算出ステップが、該平均ピッチ変換量及び該ピッチパターン変化度をそれぞれ所定の係数で重み付けした値の和を該劣化度として該ピッチ変換ステップに与えることを特徴としたピッチ変換方法。
(付記7)付記3において、
該劣化評価ステップが、さらに、該入力信号ピッチパターンの変化傾向と該目標ピッチパターンの変化傾向を、それぞれ、該ピッチパターンの所定時間間隔毎の平均ピッチを算出して各平均ピッチの大きさを順次比較することにより予め定めた複数の変化傾向の内のいずれかに分類し、両変化傾向の組合せから該入力信号ピッチパターンに対する該目標ピッチパターンへのピッチパターン変化度を決定するピッチパターン変化度算出ステップを含み、
該劣化度算出ステップが、該平均信号差分及び該ピッチパターン変化度をそれぞれ所定の係数で重み付けした値の和を該劣化度として該ピッチ変換ステップに与えることを特徴としたピッチ変換方法。
(付記8)付記5において、
該劣化評価ステップが、さらに、該入力信号ピッチパターンの変化傾向と該目標ピッチパターンの変化傾向を、それぞれ、該ピッチパターンの所定時間間隔毎の平均ピッチを算出して各平均ピッチの大きさを順次比較することにより予め定めた複数の変化傾向の内のいずれかに分類し、両変化傾向の組合せから該入力信号ピッチパターンに対する該目標ピッチパターンへのピッチパターン変化度を決定するピッチパターン変化度算出ステップを含み、
該劣化度算出ステップが、該平均ピッチ変換量、該平均信号差分、及び該ピッチパターン変化度をそれぞれ所定の係数で重み付けした値の和を該劣化度として該ピッチ変換ステップに与えることを特徴としたピッチ変換方法。
(付記9)
所定の処理単位分の入力信号の音声状態及び音素種別を入力して、該入力信号のピッチパターンから該入力信号ピッチパターンに対する目標ピッチパターンへのピッチ変換を行う際に該入力信号の波形が劣化する劣化度と、予測される全ての音声状態及び音素種別の組合せとを対応付けて記録したデータベース中から、該入力した音声状態及び音素種別に対応する劣化度を抽出する劣化度抽出ステップと、
該劣化度に応じて、予め定めたデータ処理量で該ピッチ変換を行うピッチ変換ステップと、
を備えたことを特徴とするピッチ変換方法。
(付記10)
所定の処理単位分の入力信号ピッチパターンと、該入力信号ピッチパターンに対する目標のピッチパターンと、該入力信号の音声状態及び音素種別とを入力して、該入力信号ピッチパターンから該目標ピッチパターンへのピッチ変換を行う際に該入力信号の波形が劣化する劣化度を算出する劣化評価ステップと、
該劣化度に応じて、予め定めたデータ処理量で該ピッチ変換を行うピッチ変換ステップと、
を備えたことを特徴とするピッチ変換方法。
(付記11)付記10において、
該劣化評価ステップが、
該目標ピッチパターンと該入力信号ピッチパターンとの所定周期毎のピッチ差の総和を、該入力信号ピッチパターンの該所定周期毎のピッチの総和で除算することにより平均ピッチ変換量を算出する平均ピッチ変換量算出ステップと、
該劣化度と、予測される全ての音声状態及び音素種別の組合せとを対応付けて記録したデータベース中から、該入力した音声状態及び音素種別に対応する劣化度を抽出する劣化度抽出ステップと、
該平均ピッチ変換量及び該抽出された劣化度をそれぞれ所定の係数で重み付けした値の和を該劣化度として該ピッチ変換ステップに与える劣化度算出ステップと、
を含むことを特徴としたピッチ変換方法。
(付記12)付記10において、
該ピッチ変換ステップが、該劣化度の高低に応じた第1及び第2のピッチ変換ステップを含み、
これに合わせて、該劣化評価ステップも同一の第1及び第2のピッチ変換ステップを含み、
該劣化評価ステップが、さらに、該所定の処理単位分の該入力信号ピッチパターン及び該目標ピッチパターンの内の一部を、該第1のピッチ変換ステップでピッチ変換させて得られた第1ピッチ変換結果と、該第2のピッチ変換ステップでピッチ変換させて得られた第2ピッチ変換結果との所定周期毎のパワー差の総和を該第2ピッチ変換結果の該所定周期毎のパワーの総和で除算することにより平均信号差分を算出する平均信号差分算出ステップと、該劣化度と、予測される全ての音声状態及び音素種別の組合せとを対応付けて記録したデータベース中から、該入力した音声状態及び音素種別に対応する劣化度を抽出する劣化度抽出ステップと、該平均信号差分及び該抽出された劣化度をそれぞれ所定の係数で重み付けした値の和を該劣化度として該ピッチ変換ステップに与える劣化度算出ステップとを含むことを特徴としたピッチ変換方法。
(付記13)付記10において、
該劣化評価ステップが、
該入力信号ピッチパターンの変化傾向と該目標ピッチパターンの変化傾向を、それぞれ、該ピッチパターンの所定時間間隔毎の平均ピッチを算出して各平均ピッチの大きさを順次比較することにより予め定めた複数の変化傾向の内のいずれかに分類し、両変化傾向の組合せから該入力信号ピッチパターンに対する該目標ピッチパターンへのピッチパターン変化度を決定するピッチパターン変化度算出ステップと、
該劣化度と、予測される全ての音声状態及び音素種別の組合せとを対応付けて記録したデータベース中から、該入力した音声状態及び音素種別に対応する劣化度を抽出する劣化度抽出ステップと、
該ピッチパターン変化度及び該抽出された劣化度をそれぞれ所定の係数で重み付けした値の和を該劣化度として該ピッチ変換ステップに与える劣化度算出ステップと、
を含むことを特徴としたピッチ変換方法。
(付記14)付記11において、
該ピッチ変換ステップが、該劣化度の高低に応じた第1及び第2のピッチ変換ステップを含み、
これに合わせて、該劣化評価ステップも同一の第1及び第2のピッチ変換ステップを含み、
該劣化評価ステップが、さらに、該所定の処理単位分の該入力信号ピッチパターン及び該目標ピッチパターンの内の一部を、該第1のピッチ変換ステップでピッチ変換させて得られた第1ピッチ変換結果と、該第2のピッチ変換ステップでピッチ変換させて得られた第2ピッチ変換結果との所定周期毎のパワー差の総和を該第2ピッチ変換結果の該所定周期毎のパワーの総和で除算することにより平均信号差分を算出する平均信号差分算出ステップを含み、
該劣化度算出ステップが、該平均ピッチ変換量、該抽出された劣化度、及び該平均信号差分をそれぞれ所定の係数で重み付けした値の和を該劣化度として該ピッチ変換ステップに与えることを特徴としたピッチ変換方法。
(付記15)付記11において、
該劣化評価ステップが、さらに、該入力信号ピッチパターンの変化傾向と該目標ピッチパターンの変化傾向を、それぞれ、該ピッチパターンの所定時間間隔毎の平均ピッチを算出して各平均ピッチの大きさを順次比較することにより予め定めた複数の変化傾向の内のいずれかに分類し、両変化傾向の組合せから該入力信号ピッチパターンに対する該目標ピッチパターンへのピッチパターン変化度を決定するピッチパターン変化度算出ステップを含み、
該劣化度算出ステップが、該平均ピッチ変換量、該抽出された劣化度、及び該ピッチパターン変化度をそれぞれ所定の係数で重み付けした値の和を該劣化度として該ピッチ変換ステップに与えることを特徴としたピッチ変換方法。
(付記16)付記12において、
該劣化評価ステップが、さらに、該入力信号ピッチパターンの変化傾向と該目標ピッチパターンの変化傾向を、それぞれ、該ピッチパターンの所定時間間隔毎の平均ピッチを算出して各平均ピッチの大きさを順次比較することにより予め定めた複数の変化傾向の内のいずれかに分類し、両変化傾向の組合せから該入力信号ピッチパターンに対する該目標ピッチパターンへのピッチパターン変化度を決定するピッチパターン変化度算出ステップを含み、
該劣化度算出ステップが、該平均信号差分、該抽出された劣化度、及び該ピッチパターン変化度をそれぞれ所定の係数で重み付けした値の和を該劣化度として該ピッチ変換ステップに与えることを特徴としたピッチ変換方法。
(付記17)付記14において、
該劣化評価ステップが、さらに、該入力信号ピッチパターンの変化傾向と該目標ピッチパターンの変化傾向を、それぞれ、該ピッチパターンの所定時間間隔毎の平均ピッチを算出して各平均ピッチの大きさを順次比較することにより予め定めた複数の変化傾向の内のいずれかに分類し、両変化傾向の組合せから該入力信号ピッチパターンに対する該目標ピッチパターンへのピッチパターン変化度を決定するピッチパターン変化度算出ステップを含み、
該劣化度算出ステップが、該平均ピッチ変換量、該抽出された劣化度、該平均信号差分、及び該ピッチパターン変化度をそれぞれ所定の係数で重み付けした値の和を該劣化度として該ピッチ変換ステップに与えることを特徴としたピッチ変換方法。
(付記18)
所定の処理単位分の入力信号ピッチパターンと該入力信号ピッチパターンに対する目標のピッチパターンとを入力して、該入力信号ピッチパターンから該目標ピッチパターンへのピッチ変換を行う際に該入力信号の波形が劣化する劣化度を算出する劣化評価手段と、
該劣化度に応じて、予め定めたデータ処理量で該ピッチ変換を行うピッチ変換手段と、
を備えたことを特徴とするピッチ変換装置。
(付記19)付記18において、
該劣化評価手段が、
該目標ピッチパターンと該入力信号ピッチパターンとの所定周期毎のピッチ差の総和を、該入力信号ピッチパターンの該所定周期毎のピッチの総和で除算することにより平均ピッチ変換量を算出する平均ピッチ変換量算出手段と、
該平均ピッチ変換量を所定の係数で重み付けした値を該劣化度として該ピッチ変換手段に与える劣化度算出手段と、
を含むことを特徴としたピッチ変換装置。
(付記20)付記18において、
該ピッチ変換手段が、該劣化度の高低に応じた第1及び第2のピッチ変換手段を含み、
これに合わせて、該劣化評価手段も同一の第1及び第2のピッチ変換手段を含み、
該劣化評価手段が、さらに、該所定の処理単位分の該入力信号ピッチパターン及び該目標ピッチパターンの内の一部を、該第1のピッチ変換手段でピッチ変換させて得られた第1ピッチ変換結果と、該第2のピッチ変換手段でピッチ変換させて得られた第2ピッチ変換結果との所定周期毎のパワー差の総和を該第2ピッチ変換結果の該所定周期毎のパワーの総和で除算することにより平均信号差分を算出する平均信号差分算出手段と、該平均信号差分を所定の係数で重み付けした値を該劣化度として該ピッチ変換手段に与える劣化度算出手段とを含むことを特徴としたピッチ変換装置。
(付記21)付記18において、
該劣化評価手段が、
該入力信号ピッチパターンの変化傾向と該目標ピッチパターンの変化傾向を、それぞれ、該ピッチパターンの所定時間間隔毎の平均ピッチを算出して各平均ピッチの大きさを順次比較することにより予め定めた複数の変化傾向の内のいずれかに分類し、両変化傾向の組合せから該入力信号ピッチパターンに対する該目標ピッチパターンへのピッチパターン変化度を決定するピッチパターン変化度算出手段と、
該ピッチパターン変化度を所定の係数で重み付けした値を該劣化度として該ピッチ変換手段に与える劣化度算出手段と、
を含むことを特徴としたピッチ変換装置。
(付記22)付記19において、
該ピッチ変換手段が、該劣化度の高低に応じた第1及び第2のピッチ変換手段を含み、
これに合わせて、該劣化評価手段も同一の第1及び第2のピッチ変換手段を含み、
該劣化評価手段が、さらに、該所定の処理単位分の該入力信号ピッチパターン及び該目標ピッチパターンの内の一部を、該第1のピッチ変換手段でピッチ変換させて得られた第1ピッチ変換結果と、該第2のピッチ変換手段でピッチ変換させて得られた第2ピッチ変換結果との所定周期毎のパワー差の総和を該第2ピッチ変換結果の該所定周期毎のパワーの総和で除算することにより平均信号差分を算出する平均信号差分算出手段を含み、
該劣化度算出手段が、該平均ピッチ変換量及び該平均信号差分をそれぞれ所定の係数で重み付けした値の和を該劣化度として該ピッチ変換手段に与えることを特徴としたピッチ変換装置。
(付記23)付記19において、
該劣化評価手段が、さらに、該入力信号ピッチパターンの変化傾向と該目標ピッチパターンの変化傾向を、それぞれ、該ピッチパターンの所定時間間隔毎の平均ピッチを算出して各平均ピッチの大きさを順次比較することにより予め定めた複数の変化傾向の内のいずれかに分類し、両変化傾向の組合せから該入力信号ピッチパターンに対する該目標ピッチパターンへのピッチパターン変化度を決定するピッチパターン変化度算出手段を含み、
該劣化度算出手段が、該平均ピッチ変換量及び該ピッチパターン変化度をそれぞれ所定の係数で重み付けした値の和を該劣化度として該ピッチ変換手段に与えることを特徴としたピッチ変換装置。
(付記24)付記20において、
該劣化評価手段が、さらに、該入力信号ピッチパターンの変化傾向と該目標ピッチパターンの変化傾向を、それぞれ、該ピッチパターンの所定時間間隔毎の平均ピッチを算出して各平均ピッチの大きさを順次比較することにより予め定めた複数の変化傾向の内のいずれかに分類し、両変化傾向の組合せから該入力信号ピッチパターンに対する該目標ピッチパターンへのピッチパターン変化度を決定するピッチパターン変化度算出手段を含み、
該劣化度算出手段が、該平均信号差分及び該ピッチパターン変化度をそれぞれ所定の係数で重み付けした値の和を該劣化度として該ピッチ変換手段に与えることを特徴としたピッチ変換装置。
(付記25)付記22において、
該劣化評価手段が、さらに、該入力信号ピッチパターンの変化傾向と該目標ピッチパターンの変化傾向を、それぞれ、該ピッチパターンの所定時間間隔毎の平均ピッチを算出して各平均ピッチの大きさを順次比較することにより予め定めた複数の変化傾向の内のいずれかに分類し、両変化傾向の組合せから該入力信号ピッチパターンに対する該目標ピッチパターンへのピッチパターン変化度を決定するピッチパターン変化度算出手段を含み、
該劣化度算出手段が、該平均ピッチ変換量、該平均信号差分、及び該ピッチパターン変化度をそれぞれ所定の係数で重み付けした値の和を該劣化度として該ピッチ変換手段に与えることを特徴としたピッチ変換装置。
(付記26)
所定の処理単位分の入力信号の音声状態及び音素種別を入力して、該入力信号のピッチパターンから該入力信号ピッチパターンに対する目標ピッチパターンへのピッチ変換を行う際に該入力信号の波形が劣化する劣化度と、予測される全ての音声状態及び音素種別の組合せとを対応付けて記録したデータベース中から、該入力した音声状態及び音素種別に対応する劣化度を抽出する劣化度抽出手段と、
該劣化度に応じて、予め定めたデータ処理量で該ピッチ変換を行うピッチ変換手段と、
を備えたことを特徴とするピッチ変換装置。
(付記27)
所定の処理単位分の入力信号ピッチパターンと、該入力信号ピッチパターンに対する目標のピッチパターンと、及び該入力信号の音声状態及び音素種別とを入力して、該入力信号ピッチパターンから該目標ピッチパターンへのピッチ変換を行う際に該入力信号の波形が劣化する劣化度を算出する劣化評価手段と、
該劣化度に応じて、予め定めたデータ処理量で該ピッチ変換を行うピッチ変換部と、
を備えたことを特徴とするピッチ変換装置。
(付記28)付記27において、
該劣化評価部が、
該目標ピッチパターンと該入力信号ピッチパターンとの所定周期毎のピッチ差の総和を、該入力信号ピッチパターンの該所定周期毎のピッチの総和で除算することにより平均ピッチ変換量を算出する平均ピッチ変換量算出部と、
該劣化度と、予測される全ての音声状態及び音素種別の組合せとを対応付けて記録したデータベース中から、該入力した音声状態及び音素種別に対応する劣化度を抽出する劣化度抽出手段と、
該平均ピッチ変換量及び該抽出された劣化度をそれぞれ所定の係数で重み付けした値の和を該劣化度として該ピッチ変換手段に与える劣化度算出手段と、
を含むことを特徴としたピッチ変換装置。
(付記29)付記27において、
該ピッチ変換手段が、該劣化度の高低に応じた第1及び第2のピッチ変換手段を含み、
これに合わせて、該劣化評価手段も同一の第1及び第2のピッチ変換手段を含み、
該劣化評価手段が、さらに、該所定の処理単位分の該入力信号ピッチパターン及び該目標ピッチパターンの内の一部を、該第1のピッチ変換手段でピッチ変換させて得られた第1ピッチ変換結果と、該第2のピッチ変換手段でピッチ変換させて得られた第2ピッチ変換結果との所定周期毎のパワー差の総和を該第2ピッチ変換結果の該所定周期毎のパワーの総和で除算することにより平均信号差分を算出する平均信号差分算出手段と、該劣化度と、予測される全ての音声状態及び音素種別の組合せとを対応付けて記録したデータベース中から、該入力した音声状態及び音素種別に対応する劣化度を抽出する劣化度抽出手段と、該平均信号差分及び該抽出された劣化度をそれぞれ所定の係数で重み付けした値の和を該劣化度として該ピッチ変換手段に与える劣化度算出手段とを含むことを特徴としたピッチ変換装置。
(付記30)付記27において、
該劣化評価手段が、
該入力信号ピッチパターンの変化傾向と該目標ピッチパターンの変化傾向を、それぞれ、該ピッチパターンの所定時間間隔毎の平均ピッチを算出して各平均ピッチの大きさを順次比較することにより予め定めた複数の変化傾向の内のいずれかに分類し、両変化傾向の組合せから該入力信号ピッチパターンに対する該目標ピッチパターンへのピッチパターン変化度を決定するピッチパターン変化度算出手段と、
該劣化度と、予測される全ての音声状態及び音素種別の組合せとを対応付けて記録したデータベース中から、該入力した音声状態及び音素種別に対応する劣化度を抽出する劣化度抽出手段と、
該ピッチパターン変化度及び該抽出された劣化度をそれぞれ所定の係数で重み付けした値の和を該劣化度として該ピッチ変換手段に与える劣化度算出手段と、
を含むことを特徴としたピッチ変換装置。
(付記31)付記28において、
該ピッチ変換手段が、該劣化度の高低に応じた第1及び第2のピッチ変換手段を含み、
これに合わせて、該劣化評価手段も同一の第1及び第2のピッチ変換手段を含み、
該劣化評価手段が、さらに、該所定の処理単位分の該入力信号ピッチパターン及び該目標ピッチパターンの内の一部を、該第1のピッチ変換手段でピッチ変換させて得られた第1ピッチ変換結果と、該第2のピッチ変換手段でピッチ変換させて得られた第2ピッチ変換結果との所定周期毎のパワー差の総和を該第2ピッチ変換結果の該所定周期毎のパワーの総和で除算することにより平均信号差分を算出する平均信号差分算出手段を含み、
該劣化度算出手段が、該平均ピッチ変換量、該抽出された劣化度、及び該平均信号差分をそれぞれ所定の係数で重み付けした値の和を該劣化度として該ピッチ変換手段に与えることを特徴としたピッチ変換装置。
(付記32)付記28において、
該劣化評価手段が、さらに、該入力信号ピッチパターンの変化傾向と該目標ピッチパターンの変化傾向を、それぞれ、該ピッチパターンの所定時間間隔毎の平均ピッチを算出して各平均ピッチの大きさを順次比較することにより予め定めた複数の変化傾向の内のいずれかに分類し、両変化傾向の組合せから該入力信号ピッチパターンに対する該目標ピッチパターンへのピッチパターン変化度を決定するピッチパターン変化度算出手段を含み、
該劣化度算出手段が、該平均ピッチ変換量、該抽出された劣化度、及び該ピッチパターン変化度をそれぞれ所定の係数で重み付けした値の和を該劣化度として該ピッチ変換手段に与えることを特徴としたピッチ変換装置。
(付記33)付記29において、
該劣化評価手段が、さらに、該入力信号ピッチパターンの変化傾向と該目標ピッチパターンの変化傾向を、それぞれ、該ピッチパターンの所定時間間隔毎の平均ピッチを算出して各平均ピッチの大きさを順次比較することにより予め定めた複数の変化傾向の内のいずれかに分類し、両変化傾向の組合せから該入力信号ピッチパターンに対する該目標ピッチパターンへのピッチパターン変化度を決定するピッチパターン変化度算出手段を含み、
該劣化度算出手段が、該平均信号差分、該抽出された劣化度、及び該ピッチパターン変化度をそれぞれ所定の係数で重み付けした値の和を該劣化度として該ピッチ変換手段に与えることを特徴としたピッチ変換装置。
(付記34)付記31において、
該劣化評価手段が、さらに、該入力信号ピッチパターンの変化傾向と該目標ピッチパターンの変化傾向を、それぞれ、該ピッチパターンの所定時間間隔毎の平均ピッチを算出して各平均ピッチの大きさを順次比較することにより予め定めた複数の変化傾向の内のいずれかに分類し、両変化傾向の組合せから該入力信号ピッチパターンに対する該目標ピッチパターンへのピッチパターン変化度を決定するピッチパターン変化度算出手段を含み、
該劣化度算出手段が、該平均ピッチ変換量、該抽出された劣化度、該平均信号差分、及び該ピッチパターン変化度をそれぞれ所定の係数で重み付けした値の和を該劣化度として該ピッチ変換手段に与えることを特徴としたピッチ変換装置。
100 劣化評価部
110 平均ピッチ変化量算出部
120 劣化度算出部
130 平均信号差分算出部
131 信号差分算出部
140 ピッチパターン変化度算出部
200, 410, 420 ピッチ変換部
300 切替部
500 劣化度抽出部
In 入力信号
Out, Out1, Out2 出力信号
IP, IP0〜IP10 入力信号ピッチ
IPP 入力信号ピッチパターン
PM, PM0〜PM10 ピッチマーク
T, T1〜T10 ピッチ周期
TP, TP0〜TP10 目標ピッチ
TPP 目標ピッチパターン
DGR 劣化度
PC 平均ピッチ変換量
DIF 平均信号差分
CHG ピッチパターン変化度
TBL ピッチパターン変化度算出テーブル
AP, AP1〜AP3 平均ピッチ
TND, TND1〜TND9 ピッチパターン変化傾向
TND_I 入力信号ピッチパターン変化傾向
TND_T 目標ピッチパターン変化傾向
INFO 付加情報
DB 劣化ルールデータベース
W1, W2 波形
F1, F2 窓関数
図中、同一符号は同一又は相当部分を示す。
Claims (10)
- 所定の処理単位分の入力信号ピッチパターンと該入力信号ピッチパターンに対する目標のピッチパターンとを入力して、該入力信号ピッチパターンから該目標ピッチパターンへのピッチ変換を行う際に該入力信号の波形が劣化する劣化度を算出する劣化評価ステップと、
該劣化度に応じて、予め定めたデータ処理量で該ピッチ変換を行うピッチ変換ステップと、
を備えたことを特徴とするピッチ変換方法。 - 請求項1において、
該劣化評価ステップが、
該目標ピッチパターンと該入力信号ピッチパターンとの所定周期毎のピッチ差の総和を、該入力信号ピッチパターンの該所定周期毎のピッチの総和で除算することにより平均ピッチ変換量を算出する平均ピッチ変換量算出ステップと、
該平均ピッチ変換量を所定の係数で重み付けした値を該劣化度として該ピッチ変換ステップに与える劣化度算出ステップと、
を含むことを特徴としたピッチ変換方法。 - 請求項1において、
該ピッチ変換ステップが、該劣化度の高低に応じた第1及び第2のピッチ変換ステップを含み、
これに合わせて、該劣化評価ステップも同一の第1及び第2のピッチ変換ステップを含み、
該劣化評価ステップが、さらに、該所定の処理単位分の該入力信号ピッチパターン及び該目標ピッチパターンの内の一部を、該第1のピッチ変換ステップでピッチ変換させて得られた第1ピッチ変換結果と、該第2のピッチ変換ステップでピッチ変換させて得られた第2ピッチ変換結果との所定周期毎のパワー差の総和を該第2ピッチ変換結果の該所定周期毎のパワーの総和で除算することにより平均信号差分を算出する平均信号差分算出ステップと、該平均信号差分を所定の係数で重み付けした値を該劣化度として該ピッチ変換ステップに与える劣化度算出ステップとを含むことを特徴としたピッチ変換方法。 - 請求項1において、
該劣化評価ステップが、
該入力信号ピッチパターンの変化傾向と該目標ピッチパターンの変化傾向を、それぞれ、該ピッチパターンの所定時間間隔毎の平均ピッチを算出して各平均ピッチの大きさを順次比較することにより予め定めた複数の変化傾向の内のいずれかに分類し、両変化傾向の組合せから該入力信号ピッチパターンに対する該目標ピッチパターンへのピッチパターン変化度を決定するピッチパターン変化度算出ステップと、
該ピッチパターン変化度を所定の係数で重み付けした値を該劣化度として該ピッチ変換ステップに与える劣化度算出ステップと、
を含むことを特徴としたピッチ変換方法。 - 所定の処理単位分の入力信号の音声状態及び音素種別を入力して、該入力信号のピッチパターンから該入力信号ピッチパターンに対する目標ピッチパターンへのピッチ変換を行う際に該入力信号の波形が劣化する劣化度と、予測される全ての音声状態及び音素種別の組合せとを対応付けて記録したデータベース中から、該入力した音声状態及び音素種別に対応する劣化度を抽出する劣化度抽出ステップと、
該劣化度に応じて、予め定めたデータ処理量で該ピッチ変換を行うピッチ変換ステップと、
を備えたことを特徴とするピッチ変換方法。 - 所定の処理単位分の入力信号ピッチパターンと、該入力信号ピッチパターンに対する目標のピッチパターンと、該入力信号の音声状態及び音素種別とを入力して、該入力信号ピッチパターンから該目標ピッチパターンへのピッチ変換を行う際に該入力信号の波形が劣化する劣化度を算出する劣化評価ステップと、
該劣化度に応じて、予め定めたデータ処理量で該ピッチ変換を行うピッチ変換ステップと、
を備えたことを特徴とするピッチ変換方法。 - 所定の処理単位分の入力信号ピッチパターンと該入力信号ピッチパターンに対する目標のピッチパターンとを入力して、該入力信号ピッチパターンから該目標ピッチパターンへのピッチ変換を行う際に該入力信号の波形が劣化する劣化度を算出する劣化評価手段と、
該劣化度に応じて、予め定めたデータ処理量で該ピッチ変換を行うピッチ変換手段と、
を備えたことを特徴とするピッチ変換装置。 - 請求項7において、
該劣化評価手段が、
該目標ピッチパターンと該入力信号ピッチパターンとの所定周期毎のピッチ差の総和を、該入力信号ピッチパターンの該所定周期毎のピッチの総和で除算することにより平均ピッチ変換量を算出する平均ピッチ変換量算出手段と、
該平均ピッチ変換量を所定の係数で重み付けした値を該劣化度として該ピッチ変換手段に与える劣化度算出手段と、
を含むことを特徴としたピッチ変換装置。 - 所定の処理単位分の入力信号の音声状態及び音素種別を入力して、該入力信号のピッチパターンから該入力信号ピッチパターンに対する目標ピッチパターンへのピッチ変換を行う際に該入力信号の波形が劣化する劣化度と、予測される全ての音声状態及び音素種別の組合せとを対応付けて記録したデータベース中から、該入力した音声状態及び音素種別に対応する劣化度を抽出する劣化度抽出手段と、
該劣化度に応じて、予め定めたデータ処理量で該ピッチ変換を行うピッチ変換手段と、
を備えたことを特徴とするピッチ変換装置。 - 所定の処理単位分の入力信号ピッチパターンと、該入力信号ピッチパターンに対する目標のピッチパターンと、及び該入力信号の音声状態及び音素種別とを入力して、該入力信号ピッチパターンから該目標ピッチパターンへのピッチ変換を行う際に該入力信号の波形が劣化する劣化度を算出する劣化評価手段と、
該劣化度に応じて、予め定めたデータ処理量で該ピッチ変換を行うピッチ変換部と、
を備えたことを特徴とするピッチ変換装置。
Priority Applications (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006198560A JP4757130B2 (ja) | 2006-07-20 | 2006-07-20 | ピッチ変換方法及び装置 |
US11/802,228 US7925500B2 (en) | 2006-07-20 | 2007-05-21 | Pitch conversion method and device for converting a pitch of an input signal into a desired pitch |
EP07108659.9A EP1881483B1 (en) | 2006-07-20 | 2007-05-22 | Pitch conversion method and device |
CNB2007101091652A CN100559469C (zh) | 2006-07-20 | 2007-06-14 | 基音转换方法和设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006198560A JP4757130B2 (ja) | 2006-07-20 | 2006-07-20 | ピッチ変換方法及び装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2008026565A true JP2008026565A (ja) | 2008-02-07 |
JP4757130B2 JP4757130B2 (ja) | 2011-08-24 |
Family
ID=38269034
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006198560A Expired - Fee Related JP4757130B2 (ja) | 2006-07-20 | 2006-07-20 | ピッチ変換方法及び装置 |
Country Status (4)
Country | Link |
---|---|
US (1) | US7925500B2 (ja) |
EP (1) | EP1881483B1 (ja) |
JP (1) | JP4757130B2 (ja) |
CN (1) | CN100559469C (ja) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011215228A (ja) * | 2010-03-31 | 2011-10-27 | Yamaha Corp | ピッチ変換装置 |
JP2013011828A (ja) * | 2011-06-30 | 2013-01-17 | Fujitsu Ltd | 音声合成装置、音質修正方法およびプログラム |
JP2013520698A (ja) * | 2010-02-26 | 2013-06-06 | フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン | エンベロープ形状を使用してオーディオ信号を変更する装置及び方法 |
JP2020079458A (ja) * | 2018-11-13 | 2020-05-28 | 株式会社豊田自動織機 | 紡機のスピンドル制御方法およびスピンドル制御装置 |
WO2024048990A1 (ko) * | 2022-08-31 | 2024-03-07 | 삼성전자주식회사 | 전자 장치 및 이의 제어 방법 |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102272833B (zh) * | 2008-12-30 | 2013-10-30 | 阿塞里克股份有限公司 | 一种音频设备及其信号处理方法 |
EP3399522B1 (en) * | 2013-07-18 | 2019-09-11 | Nippon Telegraph and Telephone Corporation | Linear prediction analysis device, method, program, and storage medium |
US10277581B2 (en) * | 2015-09-08 | 2019-04-30 | Oath, Inc. | Audio verification |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH01304499A (ja) * | 1988-06-02 | 1989-12-08 | Nec Corp | 音声合成方法とその装置 |
JPH02232700A (ja) * | 1989-03-07 | 1990-09-14 | Nippon Telegr & Teleph Corp <Ntt> | 音声合成装置 |
JPH0527792A (ja) * | 1991-07-22 | 1993-02-05 | Nippon Telegr & Teleph Corp <Ntt> | 音声強調装置 |
JPH07219597A (ja) * | 1994-01-31 | 1995-08-18 | Matsushita Electric Ind Co Ltd | ピッチ変換装置 |
JPH1078791A (ja) * | 1996-09-03 | 1998-03-24 | Yamaha Corp | ピッチ変換器 |
JP2004157482A (ja) * | 2002-11-08 | 2004-06-03 | Brother Ind Ltd | ピッチ変更装置、カラオケ装置 |
JP2004279690A (ja) * | 2003-03-14 | 2004-10-07 | Brother Ind Ltd | 情報処理装置 |
WO2005109399A1 (ja) * | 2004-05-11 | 2005-11-17 | Matsushita Electric Industrial Co., Ltd. | 音声合成装置および方法 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0266600A (ja) | 1988-08-31 | 1990-03-06 | Nec Corp | 音声合成方式 |
CN1118493A (zh) * | 1994-08-01 | 1996-03-13 | 中国科学院声学研究所 | 基音同步波形叠加汉语文语转换系统 |
CN2303357Y (zh) * | 1997-04-28 | 1999-01-06 | 吕士楠 | 基音同步波形叠加汉语文语转换装置 |
TW525146B (en) * | 2000-09-22 | 2003-03-21 | Matsushita Electric Ind Co Ltd | Method and apparatus for shifting pitch of acoustic signals |
DE02765393T1 (de) * | 2001-08-31 | 2005-01-13 | Kabushiki Kaisha Kenwood, Hachiouji | Vorrichtung und verfahren zum erzeugen eines tonhöhen-kurvenformsignals und vorrichtung und verfahren zum komprimieren, dekomprimieren und synthetisieren eines sprachsignals damit |
US6950799B2 (en) * | 2002-02-19 | 2005-09-27 | Qualcomm Inc. | Speech converter utilizing preprogrammed voice profiles |
-
2006
- 2006-07-20 JP JP2006198560A patent/JP4757130B2/ja not_active Expired - Fee Related
-
2007
- 2007-05-21 US US11/802,228 patent/US7925500B2/en not_active Expired - Fee Related
- 2007-05-22 EP EP07108659.9A patent/EP1881483B1/en not_active Ceased
- 2007-06-14 CN CNB2007101091652A patent/CN100559469C/zh not_active Expired - Fee Related
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH01304499A (ja) * | 1988-06-02 | 1989-12-08 | Nec Corp | 音声合成方法とその装置 |
JPH02232700A (ja) * | 1989-03-07 | 1990-09-14 | Nippon Telegr & Teleph Corp <Ntt> | 音声合成装置 |
JPH0527792A (ja) * | 1991-07-22 | 1993-02-05 | Nippon Telegr & Teleph Corp <Ntt> | 音声強調装置 |
JPH07219597A (ja) * | 1994-01-31 | 1995-08-18 | Matsushita Electric Ind Co Ltd | ピッチ変換装置 |
JPH1078791A (ja) * | 1996-09-03 | 1998-03-24 | Yamaha Corp | ピッチ変換器 |
JP2004157482A (ja) * | 2002-11-08 | 2004-06-03 | Brother Ind Ltd | ピッチ変更装置、カラオケ装置 |
JP2004279690A (ja) * | 2003-03-14 | 2004-10-07 | Brother Ind Ltd | 情報処理装置 |
WO2005109399A1 (ja) * | 2004-05-11 | 2005-11-17 | Matsushita Electric Industrial Co., Ltd. | 音声合成装置および方法 |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2013520698A (ja) * | 2010-02-26 | 2013-06-06 | フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン | エンベロープ形状を使用してオーディオ信号を変更する装置及び方法 |
KR101494062B1 (ko) * | 2010-02-26 | 2015-03-03 | 프라운호퍼-게젤샤프트 추르 푀르데룽 데어 안제반텐 포르슝 에 파우 | 인벨롭 섀이핑을 사용하는 오디오 신호를 변조하는 방법 및 장치 |
US9203367B2 (en) | 2010-02-26 | 2015-12-01 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for modifying an audio signal using harmonic locking |
US9264003B2 (en) | 2010-02-26 | 2016-02-16 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for modifying an audio signal using envelope shaping |
JP2011215228A (ja) * | 2010-03-31 | 2011-10-27 | Yamaha Corp | ピッチ変換装置 |
JP2013011828A (ja) * | 2011-06-30 | 2013-01-17 | Fujitsu Ltd | 音声合成装置、音質修正方法およびプログラム |
JP2020079458A (ja) * | 2018-11-13 | 2020-05-28 | 株式会社豊田自動織機 | 紡機のスピンドル制御方法およびスピンドル制御装置 |
JP7052683B2 (ja) | 2018-11-13 | 2022-04-12 | 株式会社豊田自動織機 | 紡機のスピンドル制御方法およびスピンドル制御装置 |
WO2024048990A1 (ko) * | 2022-08-31 | 2024-03-07 | 삼성전자주식회사 | 전자 장치 및 이의 제어 방법 |
Also Published As
Publication number | Publication date |
---|---|
EP1881483B1 (en) | 2013-09-11 |
JP4757130B2 (ja) | 2011-08-24 |
EP1881483A1 (en) | 2008-01-23 |
CN100559469C (zh) | 2009-11-11 |
US7925500B2 (en) | 2011-04-12 |
US20080091417A1 (en) | 2008-04-17 |
CN101110216A (zh) | 2008-01-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4757130B2 (ja) | ピッチ変換方法及び装置 | |
US8738381B2 (en) | Prosody generating devise, prosody generating method, and program | |
JP5269668B2 (ja) | 音声合成装置、プログラム、及び方法 | |
KR20180053714A (ko) | 오디오 정보 처리 방법 및 디바이스 | |
US20140148933A1 (en) | Sound Feature Priority Alignment | |
US7870003B2 (en) | Acoustical-signal processing apparatus, acoustical-signal processing method and computer program product for processing acoustical signals | |
US8942977B2 (en) | System and method for speech recognition using pitch-synchronous spectral parameters | |
US20230386498A1 (en) | Pitch emphasis apparatus, method and program for the same | |
JP2011164175A (ja) | 言語モデル生成装置、そのプログラムおよび音声認識システム | |
US9318106B2 (en) | Joint sound model generation techniques | |
US9159334B2 (en) | Voice processing device and method, and program | |
JP5293478B2 (ja) | 音声認識用の閾値管理プログラム、音声認識用の閾値管理方法、音声認識装置 | |
JP5474713B2 (ja) | 音声合成装置、音声合成方法および音声合成プログラム | |
WO2006129814A1 (en) | Speech synthesis method and apparatus | |
US8249874B2 (en) | Synthesizing speech from text | |
Lee et al. | Modeling Japanese F0 contours using the PENTAtrainers and AMtrainer | |
CN104282300A (zh) | 一种非周期成分音节模型建立、及语音合成的方法和设备 | |
Asadi et al. | Speech rhythm measures: Acoustic cues for speaker identification | |
JP2009204795A (ja) | 基本周波数推定装置、基本周波数推定方法、基本周波数推定プログラム、記憶媒体 | |
Yiu | Tone spans of Cantonese English | |
JP2008139573A (ja) | 声質変換方法、声質変換プログラム、声質変換装置 | |
JP2009025328A (ja) | 音声合成装置 | |
JP2008299266A (ja) | 音声合成装置および音声合成方法 | |
JP2009086476A (ja) | 音声処理装置、音声処理方法、およびプログラム | |
JP5093514B2 (ja) | オーディオ符号化装置、オーディオ符号化方法およびそのプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20090409 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20110216 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110301 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110419 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20110531 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20110531 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140610 Year of fee payment: 3 |
|
LAPS | Cancellation because of no payment of annual fees |