JP6371530B2 - 音声信号処理装置及び音声ピッチ変換プログラム - Google Patents
音声信号処理装置及び音声ピッチ変換プログラム Download PDFInfo
- Publication number
- JP6371530B2 JP6371530B2 JP2014010507A JP2014010507A JP6371530B2 JP 6371530 B2 JP6371530 B2 JP 6371530B2 JP 2014010507 A JP2014010507 A JP 2014010507A JP 2014010507 A JP2014010507 A JP 2014010507A JP 6371530 B2 JP6371530 B2 JP 6371530B2
- Authority
- JP
- Japan
- Prior art keywords
- waveform
- pitch
- section
- voice
- speech
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000012545 processing Methods 0.000 title claims description 59
- 230000005236 sound signal Effects 0.000 title claims description 35
- 230000008602 contraction Effects 0.000 claims description 49
- 238000001228 spectrum Methods 0.000 claims description 34
- 238000004904 shortening Methods 0.000 claims description 32
- 238000000605 extraction Methods 0.000 claims description 12
- 239000000284 extract Substances 0.000 claims description 4
- 230000002238 attenuated effect Effects 0.000 claims description 2
- 238000000034 method Methods 0.000 description 33
- 238000011156 evaluation Methods 0.000 description 17
- 238000006243 chemical reaction Methods 0.000 description 16
- 238000010586 diagram Methods 0.000 description 14
- 230000000875 corresponding effect Effects 0.000 description 13
- 230000006837 decompression Effects 0.000 description 7
- 238000012937 correction Methods 0.000 description 6
- 206010038583 Repetitive speech Diseases 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000002194 synthesizing effect Effects 0.000 description 2
- 206010002953 Aphonia Diseases 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Images
Landscapes
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Description
〔音声信号処理装置〕
まず、本発明の実施形態による音声信号処理装置について説明する。図1は、その音声信号処理装置の構成を示すブロック図である。この音声信号処理装置1は、有音/無音判別部10、有声/無声判別部11、ピッチ区間抽出部12、ピッチ周波数制御部13、ピッチ区間波形伸縮部14、ピッチ区間波形接続部15、スペクトル包絡修正部16及び区間接続部17を備えている。
まず、ピッチ区間波形を伸縮する処理のうち、実施例1の伸長処理について説明する。実施例1において、ピッチ区間波形伸縮部14は、第1のピッチ区間波形(ピッチ周波数制御部13から入力するピッチ周期列の音声波形のうち伸長対象のピッチ区間波形)を伸長する場合、第1のピッチ区間波形を繰り返すことで、伸長後のピッチ周期に所定区間を加えた時間長の繰り返し音声波形を保持し、繰り返し音声波形のうち第1のピッチ区間波形における冒頭の波形に、後続の第2のピッチ区間波形における冒頭の波形を重ね合わせることにより、第1のピッチ区間波形の接続を行い、繰り返し接続後の音声波形を生成し、指数関数を用いて、繰り返し接続後の音声波形を減衰させ、伸長後の第1のピッチ区間波形を生成する。
ピッチ区間波形伸縮部14の処理について説明する。図2は、図1に示したピッチ区間波形伸縮部14による実施例1の伸長処理を示すフローチャートであり、図3は、図2の伸長処理を説明する模式図であり、これらはピッチ区間波形x1の伸長処理を示している。
次に、ピッチ区間波形接続部15の処理について説明する。図4は、図1に示したピッチ区間波形接続部15による実施例1の接続処理を示すフローチャートであり、図5は、図4の接続処理を説明する模式図である。
図6は、実施例1における原音声の音声波形及び伸長後の音声波形z1の例を示す図である。図6において、横軸は時間(サンプル)を示し、縦軸は音声波形の振幅を示す。(1)は、入力音声である原音声の音声波形を示し、(2)は、ピッチ区間波形伸縮部14により伸長された伸長後の音声波形z1を示す。
は、ピッチ変換された音声波形におけるm番目のフレーム及びj番目の周波数帯域のフィルターバンクの振幅である。
Tribolet,J., Noll,P., McDermott,B., and Crochiere,R.E. (1978)、“A study of complexity and quality of speech waveform coders.” Proc.IEEE Int.Conf.Acoust., Speech, Signal Processing, 586-590.
次に、ピッチ区間波形を伸縮する処理のうち、実施例2の短縮処理について説明する。実施例2において、ピッチ区間波形伸縮部14は、第1のピッチ区間波形(ピッチ周波数制御部13から入力するピッチ周期列の音声波形のうち短縮対象のピッチ区間波形)を短縮する場合、第1のピッチ区間波形のうち短縮後のピッチ周期における波形aを保持し、第1のピッチ区間波形のうち波形aに後続する所定区間の波形に、第2のピッチ区間波形における冒頭の波形を重ね合わせて波形bを生成し、波形a,bに対してオフセット処理を施し、短縮後の第1のピッチ区間波形を生成する。
ピッチ区間波形伸縮部14の処理について説明する。図9は、図1に示したピッチ区間波形伸縮部14による実施例2の短縮処理を示すフローチャートであり、図10は、図9の短縮処理を説明する模式図であり、これらはピッチ区間波形x1の短縮処理を示している。
次に、ピッチ区間波形接続部15の処理について説明する。図11は、図1に示したピッチ区間波形接続部15による実施例2の接続処理を説明する模式図である。
図8を参照して、ピッチ区間を短縮した変換倍率の部分(ピッチ変換倍率1.2から2.0の部分)の客観評価値から、(1)の女性話者及び(2)の男性話者の双方において、全てのピッチ変換倍率につき実施例2の品質が従来技術よりも高いことがわかる。
10 有音/無音判別部
11 有声/無声判別部
12 ピッチ区間抽出部
13 ピッチ周波数制御部
14 ピッチ区間波形伸縮部
15 ピッチ区間波形接続部
16 スペクトル包絡修正部
17 区間接続部
Claims (6)
- 入力音声の有音区間及び無音区間を判別する有音/無音判別部と、前記有音区間における音声波形の有声音区間及び無声音区間を判別する有声/無声判別部と、前記有声音区間における音声波形のピッチ区間を抽出するピッチ区間抽出部と、前記ピッチ区間の音声波形におけるピッチ周期列に対し所望の変更を加えてピッチ周波数を制御し、新たなピッチ周期列を生成するピッチ周波数制御部と、前記抽出されたピッチ区間のピッチ区間波形を伸縮するピッチ区間波形伸縮部と、前記伸縮後のピッチ区間毎の音声波形を、前記入力音声の発話時間長に変化がないように間引くまたは繰り返すことによって接続するピッチ区間波形接続部と、前記接続後の音声波形に対してスペクトル包絡を求め、これを前記入力音声のスペクトル包絡と同じになるように修正するスペクトル包絡修正部と、前記スペクトル包絡が修正された有声音区間の音声波形、前記無音区間の音声波形及び前記無声音区間の音声波形を接続し、新たな音声波形を出力する区間接続部と、を備えた音声信号処理装置において、
前記ピッチ区間波形伸縮部は、
第1のピッチ区間波形を伸長する際に、前記第1のピッチ区間波形を繰り返すことで、前記新たなピッチ周期列に応じた伸長後のピッチ周期に所定の接続区間を加えた時間長の波形を生成して保持し、
前記保持した波形のうち、繰り返された前記第1のピッチ区間波形における冒頭の所定区間の波形に、前記第1のピッチ区間波形に続く第2のピッチ区間波形における冒頭の前記所定区間の波形を重ね合わせることにより、前記第1のピッチ区間波形の接続を行い、
所定の関数を用いて前記接続した波形を減衰させ、伸長後の第1のピッチ区間波形を生成する、ことを特徴とする音声信号処理装置。 - 請求項1に記載の音声信号処理装置において、
前記接続した波形を減衰させる所定の関数を、指数関数とする、ことを特徴とする音声信号処理装置。 - 請求項1または2に記載の音声信号処理装置において、
前記ピッチ区間波形接続部は、
前記伸長後の第1のピッチ区間波形に第2のピッチ区間波形を接続する際に、
前記伸長後の第1のピッチ区間波形における末尾の所定の接続区間の波形と、前記第2のピッチ区間波形における冒頭の前記所定の接続区間の波形とを重ね合わせる、ことを特徴とする音声信号処理装置。 - 請求項1に記載の音声信号処理装置において、
前記ピッチ区間波形伸縮部は、
第1のピッチ区間波形を短縮する際に、前記第1のピッチ区間波形のうち、前記新たなピッチ周期列に応じた短縮後のピッチ周期における波形を保持し、
前記第1のピッチ区間波形のうち前記保持した波形に後続する所定の接続区間の波形に、前記ピッチ区間波形接続部により前記短縮後の第1のピッチ区間波形に接続される第3のピッチ区間波形における冒頭の前記所定の接続区間の波形を重ね合わせ、
前記保持した波形及び前記重ね合わせた波形を合成波形としてそのオフセットを算出し、前記合成波形から前記オフセットを減算し、短縮後の第1のピッチ区間波形を生成する、ことを特徴とする音声信号処理装置。 - 請求項4に記載の音声信号処理装置において、
前記ピッチ区間波形接続部は、
前記短縮後の第1のピッチ区間波形に前記第3のピッチ区間波形を接続する際に、
前記短縮後の第1のピッチ区間波形における末尾の所定の接続区間の波形と、前記第3のピッチ区間波形における冒頭の前記所定の接続区間の波形とを重ね合わせる、ことを特徴とする音声信号処理装置。 - コンピュータを、請求項1から5までのいずれか一項に記載の音声信号処理装置として機能させるための音声ピッチ変換プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014010507A JP6371530B2 (ja) | 2014-01-23 | 2014-01-23 | 音声信号処理装置及び音声ピッチ変換プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014010507A JP6371530B2 (ja) | 2014-01-23 | 2014-01-23 | 音声信号処理装置及び音声ピッチ変換プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2015138187A JP2015138187A (ja) | 2015-07-30 |
JP6371530B2 true JP6371530B2 (ja) | 2018-08-08 |
Family
ID=53769206
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014010507A Active JP6371530B2 (ja) | 2014-01-23 | 2014-01-23 | 音声信号処理装置及び音声ピッチ変換プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6371530B2 (ja) |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2612867B2 (ja) * | 1987-10-06 | 1997-05-21 | 日本放送協会 | 音声ピッチ変換方法 |
JPH05108092A (ja) * | 1991-10-15 | 1993-04-30 | N T T Data Tsushin Kk | 音声ピツチ変換装置 |
JP2002244693A (ja) * | 2001-02-16 | 2002-08-30 | Matsushita Electric Ind Co Ltd | 音声合成装置および音声合成方法 |
JP4957496B2 (ja) * | 2007-10-04 | 2012-06-20 | ヤマハ株式会社 | ピッチ変換装置およびプログラム |
-
2014
- 2014-01-23 JP JP2014010507A patent/JP6371530B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2015138187A (ja) | 2015-07-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4818335B2 (ja) | 信号帯域拡張装置 | |
JP5127754B2 (ja) | 信号処理装置 | |
JP6423420B2 (ja) | 帯域幅拡張方法および装置 | |
US8370153B2 (en) | Speech analyzer and speech analysis method | |
JP6347536B2 (ja) | 音合成方法及び音合成装置 | |
JP5443547B2 (ja) | 信号処理装置 | |
JP4445460B2 (ja) | 音声処理装置及び音声処理方法 | |
JP4858663B2 (ja) | 音声認識方法及び音声認識装置 | |
JP2009223210A (ja) | 信号帯域拡張装置および信号帯域拡張方法 | |
JP2006126859A5 (ja) | ||
EP3113180B1 (en) | Method for performing audio inpainting on a speech signal and apparatus for performing audio inpainting on a speech signal | |
JP6371530B2 (ja) | 音声信号処理装置及び音声ピッチ変換プログラム | |
JP6321334B2 (ja) | 信号処理装置及びプログラム | |
KR20170080387A (ko) | 인-이어 마이크로폰을 갖는 이어셋의 대역폭 확장 장치 및 방법 | |
JP5830364B2 (ja) | 韻律変換装置およびそのプログラム | |
JP2020190606A (ja) | 音声雑音除去装置及びプログラム | |
VH et al. | A study on speech recognition technology | |
JP4603727B2 (ja) | 音響信号分析方法及び装置 | |
JP6140685B2 (ja) | 帯域パワー算出装置及び帯域パワー算出方法 | |
JP6371531B2 (ja) | 音声信号処理装置及びプログラム | |
WO2016203753A1 (ja) | 雑音検出装置、雑音抑圧装置、雑音検出方法、雑音抑圧方法、および、記録媒体 | |
JP6159570B2 (ja) | 音声強調装置、及びプログラム | |
JP5679451B2 (ja) | 音声処理装置およびそのプログラム | |
van Schijndel et al. | Towards a better balance in sinusoidal plus stochastic representation | |
JP3748081B2 (ja) | 広帯域音声復元方法及び広帯域音声復元装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20161129 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20171114 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20171129 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20180125 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20180620 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20180713 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6371530 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |