JP2013101255A - 音声強調装置とその方法とプログラム - Google Patents
音声強調装置とその方法とプログラム Download PDFInfo
- Publication number
- JP2013101255A JP2013101255A JP2011245547A JP2011245547A JP2013101255A JP 2013101255 A JP2013101255 A JP 2013101255A JP 2011245547 A JP2011245547 A JP 2011245547A JP 2011245547 A JP2011245547 A JP 2011245547A JP 2013101255 A JP2013101255 A JP 2013101255A
- Authority
- JP
- Japan
- Prior art keywords
- index
- conversion
- frequency
- speech
- periodicity
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Abstract
【解決手段】音声分析部は、音声信号を入力として、当該音声信号をpサンプル間隔で分析を行い、上記pサンプルごとの基本周波数f0(i)と、非周期性指標A(i,f)と、スペクトルパワーP(i,f)を出力する。そして、非周期性指標変換部は、所定の周波数範囲の非周期性指標の値A(i,f)を、周波数の増加に対して小さくなる変換後非周期性指標A′(i,f)と当該変換後非周期性指標A′(i,f)の最小の変換後非周期性指標A′(i,f)とに変換して出力する。音声合成部は、基本周波数f0(i)とスペクトルパワーP(i,f)と変換後非周期性指標A′(i,f)とを用いて音声合成音を合成する。
【選択図】図2
Description
同じ参照符号を付し、説明は繰り返さない。実施例の説明の前に、この発明の考えについて説明する。
人の声は、声帯の周期的な振動に基づく音と、声帯から口唇、及び鼻孔までの呼気の乱流による周期的な振動を伴わない音との混合音であることが知られている。この人の声を成す2つの音の混合比は、非周期性指標A(i,f)で表すことができる(参考文献:河原英紀、“聴覚の情景分析が生んだ高品質VOCODER:STRAIGHT”日本音響学会誌、54巻、7号、pp.521-526(1998.7))。
Claims (7)
- 音声信号s(t)を入力として、当該音声信号をpサンプル間隔で分析を行い、上記pサンプルごとの基本周波数f0(i)と、非周期性指標A(i,f)と、スペクトルパワーP(i,f)を出力する音声分析部と、
所定の周波数範囲FL〜FHの非周期性指標の値A(i,f)を、周波数の増加に対して小さくなる変換後非周期性指標A′(i,f)と、当該所定の周波数FHよりも大きな周波数では上記小さくなる変換後非周期性指標A′(i,f)の最小の変換後非周期性指標A′(i,f)とに変換して出力する非周期性指標変換部と、
上記基本周波数f0(i)と上記スペクトルパワーP(i,f)と上記変換後非周期性指標A′(i,f)とを入力として音声合成音s′(t)を合成する音声合成部と、
を具備する音声強調装置。 - 請求項1に記載した音声強調装置において、
上記非周期性指標変換部は、
所定の周波数範囲FL〜FHの(N・FL/fs/2)以上、(N・FH/fs/2)(f=0,1,…,N-1、fsはサンプリング周波数)未満の帯域番号fの周波数f′の上記非周期性指標A(i,f′)の値を、上記所定の周波数範囲FL〜FHにおいて、減衰量γとしたときにE=−γ{(f′−FL)/(FH−FL)}の関係で小さくする変換関数E(f)を定義する変換関数定義手段と、
上記周波数分析手段が出力する上記非周期性指標A(i,f)に、上記変換関数E(f)の値を加算する加算手段と、
を備えることを特徴とする音声強調装置。 - 請求項1又2に記載の音声強調装置において、
上記所定の周波数範囲FL〜FHは、FL=1000Hz以上、FH=2000Hz以下の範囲であることを特徴とする音声強調装置。 - 音声信号s(t)を入力として、当該音声信号をpサンプル間隔で分析を行い、上記pサンプルごとの基本周波数f0(i)と、非周期性指標A(i,f)と、スペクトルパワーP(i,f)を出力する音声分析過程と、
所定の周波数範囲FL〜FHの非周期性指標の値A(i,f)を、周波数の増加に対して小さくなる変換後非周期性指標A′(i,f)と、当該所定の周波数FHよりも大きな周波数では上記小さくなる変換後非周期性指標A′(i,f)の最小の変換後非周期性指標A′(i,f)とに変換して出力する非周期性指標変換過程と、
上記基本周波数f0(i)と上記スペクトルパワーP(i,f)と上記変換後非周期性指標A′(i,f)とを入力として音声合成音s′(t)を合成する音声合成過程と、
を備える音声強調方法。 - 請求項4に記載した音声強調方法において、
上記非周期性指標変換過程は、
所定の周波数範囲FL〜FHの(N・FL/fs/2)以上、(N・FH/fs/2)(f=0,1,…,N-1、fsはサンプリング周波数)未満の帯域番号fの周波数f′の上記非周期性指標A(i,f)の値を、上記所定の周波数範囲FL〜FHにおいて、減衰量γとしたときにE=−γ{(f′−FL)/(FH−FL)}の関係で小さくする変換関数E(f)を定義する変換関数定義ステップと、
上記周波数分析手段が出力する上記非周期性指標A(i,f)に、上記変換関数E(f)の値を加算する加算ステップと、
を含むことを特徴とする音声強調方法。 - 請求項4又5に記載の音声強調方法において、
上記所定の周波数範囲FL〜FHは、FL=1000Hz以上、FH=2000[Hz]以下の範囲であることを特徴とする音声強調方法。 - 請求項1乃至3の何れかに記載した音声強調装置としてコンピュータを機能させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011245547A JP5667963B2 (ja) | 2011-11-09 | 2011-11-09 | 音声強調装置とその方法とプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011245547A JP5667963B2 (ja) | 2011-11-09 | 2011-11-09 | 音声強調装置とその方法とプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2013101255A true JP2013101255A (ja) | 2013-05-23 |
JP5667963B2 JP5667963B2 (ja) | 2015-02-12 |
Family
ID=48621918
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011245547A Active JP5667963B2 (ja) | 2011-11-09 | 2011-11-09 | 音声強調装置とその方法とプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5667963B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2013218147A (ja) * | 2012-04-10 | 2013-10-24 | Nippon Telegr & Teleph Corp <Ntt> | 音声明瞭度変換装置、音声明瞭度変換方法及びそのプログラム |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4468804A (en) * | 1982-02-26 | 1984-08-28 | Signatron, Inc. | Speech enhancement techniques |
WO2004040555A1 (ja) * | 2002-10-31 | 2004-05-13 | Fujitsu Limited | 音声強調装置 |
JP2007156337A (ja) * | 2005-12-08 | 2007-06-21 | Nippon Telegr & Teleph Corp <Ntt> | 音声信号分析装置、音声信号分析方法、音声信号分析プログラム、自動音声認識装置、自動音声認識方法及び自動音声認識プログラム |
JP2013218147A (ja) * | 2012-04-10 | 2013-10-24 | Nippon Telegr & Teleph Corp <Ntt> | 音声明瞭度変換装置、音声明瞭度変換方法及びそのプログラム |
-
2011
- 2011-11-09 JP JP2011245547A patent/JP5667963B2/ja active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4468804A (en) * | 1982-02-26 | 1984-08-28 | Signatron, Inc. | Speech enhancement techniques |
WO2004040555A1 (ja) * | 2002-10-31 | 2004-05-13 | Fujitsu Limited | 音声強調装置 |
JP2007156337A (ja) * | 2005-12-08 | 2007-06-21 | Nippon Telegr & Teleph Corp <Ntt> | 音声信号分析装置、音声信号分析方法、音声信号分析プログラム、自動音声認識装置、自動音声認識方法及び自動音声認識プログラム |
JP2013218147A (ja) * | 2012-04-10 | 2013-10-24 | Nippon Telegr & Teleph Corp <Ntt> | 音声明瞭度変換装置、音声明瞭度変換方法及びそのプログラム |
Non-Patent Citations (4)
Title |
---|
CSNG200700861003; 河原英紀: '"Vocoderのもう一つの可能性を探る-音声分析合成システムSTRAIGHTの背景と展開-"' 日本音響学会誌 63巻,8号, 200708, pp.442-449 * |
CSNG201000321014; 河原英紀他: '"高品質分析合成のための有声音の非周期成分の表現と推定について"' 電子情報通信学会技術研究報告 Vol.109,No.451, 201002, pp.99-104 * |
JPN6014044474; 河原英紀: '"Vocoderのもう一つの可能性を探る-音声分析合成システムSTRAIGHTの背景と展開-"' 日本音響学会誌 63巻,8号, 200708, pp.442-449 * |
JPN6014044477; 河原英紀他: '"高品質分析合成のための有声音の非周期成分の表現と推定について"' 電子情報通信学会技術研究報告 Vol.109,No.451, 201002, pp.99-104 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2013218147A (ja) * | 2012-04-10 | 2013-10-24 | Nippon Telegr & Teleph Corp <Ntt> | 音声明瞭度変換装置、音声明瞭度変換方法及びそのプログラム |
Also Published As
Publication number | Publication date |
---|---|
JP5667963B2 (ja) | 2015-02-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
McLoughlin | Applied speech and audio processing: with Matlab examples | |
CN104080024B (zh) | 音量校平器控制器和控制方法以及音频分类器 | |
CN104079247B (zh) | 均衡器控制器和控制方法以及音频再现设备 | |
Alku et al. | Closed phase covariance analysis based on constrained linear prediction for glottal inverse filtering | |
KR20010014352A (ko) | 음성 통신 시스템에서 음성 강화를 위한 방법 및 장치 | |
JP4516157B2 (ja) | 音声分析装置、音声分析合成装置、補正規則情報生成装置、音声分析システム、音声分析方法、補正規則情報生成方法、およびプログラム | |
Raitio et al. | Analysis and synthesis of shouted speech. | |
JP2020507819A (ja) | スペクトル包絡線のフォルマントの周波数シフトによって声の音質を動的に修正するための方法および装置 | |
Nathwani et al. | Speech intelligibility improvement in car noise environment by voice transformation | |
Konno et al. | Whisper to normal speech conversion using pitch estimated from spectrum | |
Matsubara et al. | Investigation of training data size for real-time neural vocoders on CPUs | |
JP4654621B2 (ja) | 音声処理装置およびプログラム | |
Raitio et al. | Phase perception of the glottal excitation and its relevance in statistical parametric speech synthesis | |
Zouhir et al. | A bio-inspired feature extraction for robust speech recognition | |
JP5667963B2 (ja) | 音声強調装置とその方法とプログラム | |
Jokinen et al. | Estimating the spectral tilt of the glottal source from telephone speech using a deep neural network | |
Zorilă et al. | Near and far field speech-in-noise intelligibility improvements based on a time–frequency energy reallocation approach | |
Nakagiri et al. | Improving body transmitted unvoiced speech with statistical voice conversion | |
Ireland et al. | Adaptive multi-rate compression effects on vowel analysis | |
Kąkol et al. | Improving objective speech quality indicators in noise conditions | |
Erro et al. | On combining statistical methods and frequency warping for high-quality voice conversion | |
JP5745453B2 (ja) | 音声明瞭度変換装置、音声明瞭度変換方法及びそのプログラム | |
Mousa | Speech segmentation in synthesized speech morphing using pitch shifting. | |
Bous | A neural voice transformation framework for modification of pitch and intensity | |
Patwardhan et al. | Effect of voice quality on frequency-warped modeling of vowel spectra |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20140108 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20140926 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20141021 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20141117 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20141209 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20141215 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5667963 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20150109 |