JP6371531B2 - 音声信号処理装置及びプログラム - Google Patents
音声信号処理装置及びプログラム Download PDFInfo
- Publication number
- JP6371531B2 JP6371531B2 JP2014010587A JP2014010587A JP6371531B2 JP 6371531 B2 JP6371531 B2 JP 6371531B2 JP 2014010587 A JP2014010587 A JP 2014010587A JP 2014010587 A JP2014010587 A JP 2014010587A JP 6371531 B2 JP6371531 B2 JP 6371531B2
- Authority
- JP
- Japan
- Prior art keywords
- pitch
- pitch frequency
- frequency
- sample
- new
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000005236 sound signal Effects 0.000 title claims description 26
- 238000006243 chemical reaction Methods 0.000 claims description 13
- 238000000605 extraction Methods 0.000 claims description 13
- 230000008859 change Effects 0.000 claims description 10
- 238000012935 Averaging Methods 0.000 claims description 5
- 239000000284 extract Substances 0.000 claims description 4
- 239000011295 pitch Substances 0.000 description 202
- 238000000034 method Methods 0.000 description 9
- 238000010586 diagram Methods 0.000 description 7
- 230000001629 suppression Effects 0.000 description 4
- 230000008602 contraction Effects 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 238000001228 spectrum Methods 0.000 description 3
- 206010002953 Aphonia Diseases 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
Images
Landscapes
- Electrophonic Musical Instruments (AREA)
Description
〔音声信号処理装置〕
まず、本発明の実施形態による音声信号処理装置について説明する。図1は、その音声信号処理装置の構成を示すブロック図である。この音声信号処理装置1は、有音/無音判別部10、有声/無声判別部11、ピッチ区間抽出部12、ピッチ周波数制御部13、ピッチ周波数変換部14及び区間接続部15を備えている。
次に、図1に示したピッチ周波数制御部13の処理について説明する。前述のとおり、ピッチ周波数制御部13は、入力音声のピッチ周期列に対し、所望の変更を加えてピッチ周波数を制御し、抑揚を強調または抑圧した新たなピッチ周期列を生成する。
を算出する(ステップS202)。
、及び、予め設定された抑揚の強調または抑圧度合いを示すパラメータ(ピッチ周波数fjを変化させる度合いを示すパラメータ)rintから、以下の式により、抑揚を強調または抑圧した音声のピッチ周波数f’jを算出する。
10 有音/無音判別部
11 有声/無声判別部
12 ピッチ区間抽出部
13 ピッチ周波数制御部
14 ピッチ周波数変換部
15 区間接続部
Claims (4)
- 入力音声の有音区間及び無音区間を判別する有音/無音判別部と、前記有音区間における音声波形の有声音区間及び無声音区間を判別する有声/無声判別部と、前記有声音区間における音声波形のピッチ区間を抽出するピッチ区間抽出部と、前記ピッチ区間の音声波形におけるピッチ周期列に対し所望の変更を加えてピッチ周波数を制御し、新たなピッチ周期列を生成するピッチ周波数制御部と、前記新たなピッチ周期列に応じて、前記抽出されたピッチ区間の音声波形におけるピッチ周波数を変換するピッチ周波数変換部と、前記ピッチ周波数が変換された有声音区間の音声波形、前記無音区間の音声波形及び前記無声音区間の音声波形を接続し、新たな音声波形を出力する区間接続部と、を備えた音声信号処理装置において、
前記ピッチ周波数制御部は、
前記ピッチ周期列における時間軸上のサンプルのピッチ周波数に対応して、新たなピッチ周波数を算出する際に、
一のサンプルより過去の所定サンプル数のピッチ周波数を平均して平均ピッチ周波数を算出し、前記一のサンプルのピッチ周波数、前記平均ピッチ周波数、及び前記一のサンプルのピッチ周波数を変化させる度合いを示すパラメータに基づいて、新たなピッチ周波数を算出し、各サンプルに対して算出した前記新たなピッチ周波数のそれぞれに基づいて、新たなピッチ周期列を生成する、ことを特徴とする音声信号処理装置。 - 請求項1に記載の音声信号処理装置において、
前記所定サンプル数を1/2倍したサンプル数を1/2倍サンプル数として、
前記ピッチ周波数制御部は、
前記ピッチ周期列における時間軸上のサンプルのピッチ周波数に対応して、新たなピッチ周波数を算出する際に、
一のサンプルより過去の前記1/2倍サンプル数のピッチ周波数と、当該一のサンプルに対して先読みした前記1/2倍サンプル数のピッチ周波数とを平均して平均ピッチ周波数を算出し、前記一のサンプルのピッチ周波数、前記平均ピッチ周波数、及び前記一のサンプルのピッチ周波数を変化させる度合いを示すパラメータに基づいて、新たなピッチ周波数を算出し、各サンプルに対して算出した前記新たなピッチ周波数のそれぞれに基づいて、新たなピッチ周期列を生成する、ことを特徴とする音声信号処理装置。 - 請求項1または2に記載の音声信号処理装置において、
前記所定サンプル数を、前記新たなピッチ周波数が算出される各サンプルについて固定数とする、ことを特徴とする音声信号処理装置。 - コンピュータを、請求項1から3までのいずれか一項に記載の音声信号処理装置として機能させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014010587A JP6371531B2 (ja) | 2014-01-23 | 2014-01-23 | 音声信号処理装置及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014010587A JP6371531B2 (ja) | 2014-01-23 | 2014-01-23 | 音声信号処理装置及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2015138193A JP2015138193A (ja) | 2015-07-30 |
JP6371531B2 true JP6371531B2 (ja) | 2018-08-08 |
Family
ID=53769211
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014010587A Active JP6371531B2 (ja) | 2014-01-23 | 2014-01-23 | 音声信号処理装置及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6371531B2 (ja) |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2612867B2 (ja) * | 1987-10-06 | 1997-05-21 | 日本放送協会 | 音声ピッチ変換方法 |
JP4455701B2 (ja) * | 1999-10-21 | 2010-04-21 | ヤマハ株式会社 | 音声信号処理装置および音声信号処理方法 |
JP4654615B2 (ja) * | 2004-06-24 | 2011-03-23 | ヤマハ株式会社 | 音声効果付与装置及び音声効果付与プログラム |
-
2014
- 2014-01-23 JP JP2014010587A patent/JP6371531B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2015138193A (ja) | 2015-07-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Botinhao et al. | Speech enhancement for a noise-robust text-to-speech synthesis system using deep recurrent neural networks | |
Drugman et al. | A comparative study of glottal source estimation techniques | |
EP2881947A1 (en) | Spectral envelope and group delay inference system and voice signal synthesis system for voice analysis/synthesis | |
JP2010055000A (ja) | 信号帯域拡張装置 | |
KR20130031849A (ko) | 대역폭 확장기 | |
JP2016537662A (ja) | 帯域幅拡張方法および装置 | |
JP6386237B2 (ja) | 音声明瞭化装置及びそのためのコンピュータプログラム | |
JP4516157B2 (ja) | 音声分析装置、音声分析合成装置、補正規則情報生成装置、音声分析システム、音声分析方法、補正規則情報生成方法、およびプログラム | |
JP6347536B2 (ja) | 音合成方法及び音合成装置 | |
GB2603776A (en) | Methods and systems for modifying speech generated by a text-to-speech synthesiser | |
JP2005157363A (ja) | フォルマント帯域を利用したダイアログエンハンシング方法及び装置 | |
JP6520108B2 (ja) | 音声合成装置、方法、およびプログラム | |
JP7040258B2 (ja) | 発音変換装置、その方法、およびプログラム | |
EP3113180B1 (en) | Method for performing audio inpainting on a speech signal and apparatus for performing audio inpainting on a speech signal | |
JP5830364B2 (ja) | 韻律変換装置およびそのプログラム | |
JP6371531B2 (ja) | 音声信号処理装置及びプログラム | |
JP4571871B2 (ja) | 音声信号分析方法およびこの分析方法を実施する装置、この音声信号分析装置を用いた音声認識装置、この分析方法を実行するプログラムおよびその記憶媒体 | |
Airaksinen et al. | Quadratic programming approach to glottal inverse filtering by joint norm-1 and norm-2 optimization | |
JP2013033103A (ja) | 声質変換装置および声質変換方法 | |
Nimbhore et al. | Implementation of english-text to marathi-speech (ETMS) synthesizer | |
CN111862931A (zh) | 一种语音生成方法及装置 | |
JP6930089B2 (ja) | 音響処理方法および音響処理装置 | |
JP2007047422A (ja) | 音声分析合成装置および音声分析合成方法 | |
JP4223416B2 (ja) | F0輪郭を合成する方法及びコンピュータプログラム | |
JP6371530B2 (ja) | 音声信号処理装置及び音声ピッチ変換プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20161129 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20171114 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20171129 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20180125 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20180620 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20180713 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6371531 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |