JP6333043B2 - 音声信号処理装置 - Google Patents
音声信号処理装置 Download PDFInfo
- Publication number
- JP6333043B2 JP6333043B2 JP2014088752A JP2014088752A JP6333043B2 JP 6333043 B2 JP6333043 B2 JP 6333043B2 JP 2014088752 A JP2014088752 A JP 2014088752A JP 2014088752 A JP2014088752 A JP 2014088752A JP 6333043 B2 JP6333043 B2 JP 6333043B2
- Authority
- JP
- Japan
- Prior art keywords
- signal
- sound
- narrowband
- audio signal
- voiced
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Description
本願発明者は、上述のようなサンプル値H∞制御により設計されたデジタルフィルタを狭帯域音声信号に対する帯域拡張に適用することに想到し、音声品質がより良好になるような工夫を加えることで本願発明に至った。
a)狭帯域音声信号に対し線形予測分析を行うことで狭帯域周波数スペクトル及び狭帯域音源信号を求める線形予測分析部と、
b)前記狭帯域音源信号に対しアップサンプリング及び非線形処理を行うことで、該狭帯域音源信号を広帯域音源信号に変換する音源帯域拡張処理部と、
c)前記狭帯域周波数スペクトルに基づいて、入力された狭帯域音声信号が有声音又は無声音のいずれであるかを判断する有声音/無声音判別部と、
d)前記狭帯域周波数スペクトルによる狭帯域声道伝達特性に対しアップサンプリング及びフィルタリング処理を行うことで、該狭帯域声道伝達特性を広帯域声道伝達特性に変換する伝達特性帯域拡張処理部であって、前記フィルタリング処理のためのフィルタとして、声道の連続時間周波数特性を有するアナログフィルタを通してフィルタリング処理されるアナログ音声信号と、該アナログ音声信号を離散化しアップサンプリングしてフィルタリングしたあとに連続信号に戻した復元音声信号との誤差が小さくなるように、サンプル値制御理論によって設計されたフィルタ係数が設定されたデジタルフィルタを用いる伝達特性帯域拡張処理部と、
e)前記有声音/無声音判別部による判別結果に基づいて、前記デジタルフィルタのフィルタ係数として、有声音用フィルタ係数と無声音用フィルタ係数のいずれかを選択的に前記デジタルフィルタに設定するフィルタ係数選択部と、
f)前記広帯域音源信号に対し前記広帯域伝達特性によるフィルタリング処理を行うことにより広帯域音声信号を求める音声復元部と、
を備えることを特徴としている。
図1は本実施例の音声信号処理装置のブロック構成図である。この音声信号処理装置は、例えば携帯電話の受信系回路において、アンテナを介して受信した伝送信号をデコードして得られる狭帯域音声信号を入力信号とし、これを処理して広帯域音声信号に変換しアナログ音声信号出力のためのD/A変換器へ出力する装置である。なお、以下の説明では、特に記載しない限り、狭帯域音声信号、広帯域音声信号等、ここで扱う信号はデジタルデータである。
本実施例の音声信号処理装置は、所定時間長さの狭帯域音声信号に対して線形予測分析を行って狭帯域周波数スペクトル及び狭帯域音源信号を取得する線形予測分析部1と、狭帯域音源信号に非線形変換などの処理を行うことで狭帯域音源信号を広帯域残差信号である広帯域音源信号に帯域拡張する非線形帯域拡張処理部2と、アップサンプラ31と補間フィルタ32を含み、狭帯域周波数スペクトルである声道伝達特性を帯域拡張する伝達特性帯域拡張処理部3と、狭帯域周波数スペクトルに基づいて入力された狭帯域音声信号が有声音であるか無声音であるかを判別する有声音/無声音判別部4と、いずれも上記補間フィルタ32のフィルタ係数である有声音用フィルタ係数と無声音用フィルタ係数とを記憶するフィルタ係数記憶部5、6と、有声音/無声音判別部4による判別結果に基づいてフィルタ係数を選択する係数選択部7と、非線形帯域拡張処理部2で帯域拡張された広帯域音源信号に対し伝達特性帯域拡張処理部3で帯域拡張された広帯域声道伝達特性によるフィルタリングを行うことで広帯域音声信号を生成する広帯域音声合成処理部8と、を機能ブロックとして備える。
以下、各部の具体的な処理動作について説明する。
線形予測分析部1は、狭帯域音声信号に対して線形予測演算処理を適用することで、音声信号の周波数スペクトル包絡を推定するとともに、そうしたスペクトル中の声道特性がほぼ除去された残差信号を狭帯域音源信号として取得する。具体的には、線形予測分析部1ではまず、連続的な狭帯域音声信号に対し適切な窓関数、例えば対称ハミング窓関数を用いることで所定長さの音声信号をフレームとして切り出す。そして、そのフレームに含まれる音声信号に対し、既知の線形予測分析を行い、狭帯域のスペクトル包絡を表すパラメータ、例えば線形予測係数などを求める。このスペクトル包絡は声道伝達特性であり、音源信号に対して声道伝達特性で表されるフィルタリング処理を行うと音声信号が得られるから、この逆の演算処理により、狭帯域音声信号と声道伝達特性とから予測残差信号としての狭帯域音源信号を算出することができる。
本来のアナログ声帯音源には4kHz以上の倍音が含まれるが、携帯電話音声では帯域の制限によって3.4kHz以上の高次倍音が切り捨てられる。これが携帯電話音声の品質劣化の原因の一つであり、音源信号の帯域拡張では3.4kHz以上の高次倍音を復元する。
上述したように、音声スペクトル包絡に対応したパラメータで表される声道伝達特性は、音声の明瞭度に寄与し個々の話者の発声を特徴付ける最も重要な要素である。そのため、音声品質を高めるには、狭帯域声道伝達特性から広帯域声道伝達特性を適切に復元することが非常に重要である。そこで、本発明に係る音声信号処理装置における帯域拡張法では、この声道伝達特性の帯域拡張に、サンプル値制御理論に基づいて設計された補間フィルタを利用する。即ち、ここでは、狭帯域声道伝達特性の帯域拡張を、離散時間インパルス応答信号の最適補間処理とみなす。これはアップサンプラ31によって生じたエイリアス成分を利用した帯域拡張の手法であり、遅延と計算量の少ない線形フィルタである補間フィルタ32を用いて帯域拡張を実現することができる。
サンプル値制御理論は信号補間に基づくデジタル信号の高サンプル化・高精度化にも応用できるという特徴を持ち、補間値を一種のサンプル点間応答と捉えることでデジタル制御の視点からデジタル信号処理における補間値を決定することができる。サンプル値制御理論によりデジタルオーディオ信号を最適に補間する基本的な方法は、特許文献2−4を初めとする種々の文献に記載されているものであるので、詳細な説明は省略し、ポイントについてのみ述べる。
連続時間信号w(t)は全帯域で一様な分布を持つと仮定したアナログ信号であり、伝達特性がF(s)であるアナログフィルタ11を通すことで、モデル化された周波数特性を有する仮想アナログ信号y(t)となる。この信号y(t)は理想サンプラ13によってサンプリング時間hのデジタル信号yd[k]となる。yd[k]はM倍(ここでは2倍の帯域拡張であるのでM=2)のアップサンプラ14によってサンプリング時間h/Mの信号となり、伝達特性がK(z)であるデジタルフィルタ15でフィルタリングされた信号ud[k]を得る。この信号udは0次ホールド16で連続時間信号u(t)に変換され、伝達特性がP(s)である平滑化アナログフィルタ17を通過した後、最終的な復元信号z(t)が得られる。
e(t)=y(t−mh)−z(t)
仮想アナログ信号y(t)がオリジナル音声信号であると考えれば、狭帯域音声信号を帯域拡張した後の広帯域音声信号の音声品質を改善することは、誤差信号e(t)をできるだけ小さくすることに相当する。したがって、誤差信号e(t)ができるだけ小さくなるように、デジタルフィルタ15の伝達特性K(z)を設計すればよい。
以上のことから、(2)式を求め、ごく一般的な離散時間H∞制御問題を解けば、所望のデジタルフィルタ15の伝達特性K(z)が得られ、これを補間フィルタ32として利用することができる。
上述したように、本発明における声道伝達特性の帯域拡張法では、予め与えられた原信号のアナログ周波数特性F(s)によって補間フィルタ32の最適な特性K(z)が決定される。一般に、このアナログ周波数特性F(s)はアナログ原信号の平均若しくは長時間スペクトル包絡近似、又は、原音源の周波数モデルによって設計される。
F(s)=1/{(T1s+1)(T2s+1)}
T1=1/2000・2π
T2=1/6000・2π
この周波数モデルF(s)のボード線図を図7に示す。一方、無声音に用いられる周波数モデルF(s)は次式で表される。
F(s)=(T1s+1)2/{(T2s+1)(T3s+1)(T4s+1)}
T1=1/2000・2π
T2=1/7000・2π
T3=1/8000・2π
T4=1/16000・2π
この周波数モデルF(s)のボード線図を図8に示す。
また、補間フィルタ32の伝達特性K(z)を設計するに際して、m=8、P(s)=1/(1+1.9894×10-5s)、とした。
以上のような条件の下で上述した離散時間H∞制御問題を解く演算を行うことで、有声音用及び無声音用の補間フィルタをそれぞれ設計し、それにより求めた有声音用フィルタ係数及び無性音用フィルタ係数を記憶部5、6に格納しておく。
入力された狭帯域音声信号が有声音、無声音のいずれかであるのかに応じて補間フィルタ32におけるフィルタ係数を切り替えるために、有声音/無声音判別部4は、入力された音声信号に対しリアルタイムで有声音/無声音の判別を行う。図9はこの判別処理のフローチャートである。
X=V・[diag(1/wj)]・(UT・b) …(5)
ただし、wj=0のときには1/wjを0に置き換える。A=U[diag(wj)]VTはAの特異値分解である。
上述したように、非線形帯域拡張処理部2では狭帯域音源信号が広帯域音源信号に変換され、伝達特性帯域拡張処理部3では声道の狭帯域伝達特性が広帯域伝達特性に変換される。そこで、広帯域音声合成処理部8では、広帯域伝達特性で表されるフィルタリング処理を広帯域音源信号に対して実施することで、声道の広帯域伝達特性が反映された広帯域音声信号を得てこれを出力する。
図11は、音声品質評価用サンプルに対する処理結果である周波数スペクトルの一例であり、(a)はオリジナル広帯域音声、(b)は携帯電話狭帯域音声、(c)は本発明における帯域拡張法で復元した広帯域音声の周波数スペクトルである。(a)と(b)とを比較すると、携帯電話狭帯域音声では3.4kHz以上の高域成分が存在しないことが分かる。これに対し、本発明における帯域拡張法による復元音声では、高域成分が再現されており、オリジナルの広帯域音声信号にかなり近い周波数スペクトルが得られていることが分かる。
国際電気通信連合電気通信標準化部門(ITU−T)によるテスト音声信号及びPASL−DSR音声品質評価文の一部を用い、オリジナル広帯域音声とAMRによる狭帯域携帯電話音声、オリジナル広帯域音声と本発明法による帯域拡張法で有声音/無声音判別に従来法を用いたときの広帯域音声、及び、オリジナル広帯域音声と本発明法による帯域拡張法で有声音/無声音判別に上述した方法を用いたときの広帯域音声、の三つのケースについて行った客観的音質比較実験のPESQ値を図12に示す。
例えば本発明に係る音声信号処理装置は携帯電話の狭帯域音声信号の帯域拡張に利用できるのはもちろんのこと、それ以外の狭帯域音声信号、即ち、狭帯域通信路や狭帯域伝送路、或いは狭帯域記録再生経路などを通して得られる狭帯域音声信号全般の帯域拡張に利用することができる。
2…非線形帯域拡張処理部
3…伝達特性帯域拡張処理部
31…アップサンプラ
32…補間フィルタ
4…有声音/無声音判別部
5、6…フィルタ係数記憶部
7…係数選択部
8…広帯域音声合成処理部
11…アナログフィルタ
12…時間遅れ要素
13…理想サンプラ
14…アップサンプラ
15…デジタルフィルタ
16…0次ホールド
17…平滑化アナログフィルタ
18…差分器
Claims (3)
- 入力された狭帯域音声信号の周波数帯域を高域側に拡張する音声信号処理装置であって、
a)狭帯域音声信号に対し線形予測分析を行うことで狭帯域周波数スペクトル及び狭帯域音源信号を求める線形予測分析部と、
b)前記狭帯域音源信号に対しアップサンプリング及び非線形処理を行うことで、該狭帯域音源信号を広帯域音源信号に変換する音源帯域拡張処理部と、
c)前記狭帯域周波数スペクトルに基づいて、入力された狭帯域音声信号が有声音又は無声音のいずれであるかを判断する有声音/無声音判別部と、
d)前記狭帯域周波数スペクトルによる狭帯域声道伝達関数に対しアップサンプリング及びフィルタリング処理を行うことで、該狭帯域声道伝達関数を広帯域声道伝達関数に変換する伝達関数帯域拡張処理部であって、前記フィルタリング処理のためのフィルタとして、声道の連続時間周波数特性を有するアナログフィルタを通してフィルタリング処理されるアナログ音声信号と、該アナログ音声信号を離散化しアップサンプリングしてフィルタリングしたあとに連続信号に戻した復元音声信号との誤差が小さくなるように、サンプル値制御理論によって設計されたフィルタ係数が設定されたデジタルフィルタを用いる伝達関数帯域拡張処理部と、
e)前記有声音/無声音判別部による判別結果に基づいて、前記デジタルフィルタのフィルタ係数として、有声音用フィルタ係数と無声音用フィルタ係数のいずれかを選択的に前記デジタルフィルタに設定するフィルタ係数選択部と、
f)前記広帯域音源信号に対し前記広帯域伝達関数によるフィルタリング処理を行うことにより広帯域音声信号を求める音声復元部と、
を備えることを特徴とする音声信号処理装置。 - 請求項1に記載の音声信号処理装置であって、
前記サンプル値制御理論は、サンプル値H∞制御理論であることを特徴とする音声信号処理装置。 - 請求項1又は2に記載の音声信号処理装置であって、
前記有声音/無声音判別部は、周波数スペクトルの近似的な傾きに基づいて有声音と無声音とを判別することを特徴とする音声信号処理装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014088752A JP6333043B2 (ja) | 2014-04-23 | 2014-04-23 | 音声信号処理装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014088752A JP6333043B2 (ja) | 2014-04-23 | 2014-04-23 | 音声信号処理装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2015206958A JP2015206958A (ja) | 2015-11-19 |
JP6333043B2 true JP6333043B2 (ja) | 2018-05-30 |
Family
ID=54603781
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014088752A Active JP6333043B2 (ja) | 2014-04-23 | 2014-04-23 | 音声信号処理装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6333043B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114882867B (zh) * | 2022-04-13 | 2024-05-28 | 天津大学 | 基于滤波器组频率区分的深度网络波形合成方法及装置 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2956548B2 (ja) * | 1995-10-05 | 1999-10-04 | 松下電器産業株式会社 | 音声帯域拡大装置 |
JPH10124088A (ja) * | 1996-10-24 | 1998-05-15 | Sony Corp | 音声帯域幅拡張装置及び方法 |
JP3820331B2 (ja) * | 1999-10-25 | 2006-09-13 | 裕 山本 | デジタル/アナログ変換装置及び該装置に用いるデジタルフィルタの設計方法 |
JP2002082685A (ja) * | 2000-06-26 | 2002-03-22 | Matsushita Electric Ind Co Ltd | 音声帯域拡張装置及び音声帯域拡張方法 |
KR101008022B1 (ko) * | 2004-02-10 | 2011-01-14 | 삼성전자주식회사 | 유성음 및 무성음 검출방법 및 장치 |
WO2010070770A1 (ja) * | 2008-12-19 | 2010-06-24 | 富士通株式会社 | 音声帯域拡張装置及び音声帯域拡張方法 |
-
2014
- 2014-04-23 JP JP2014088752A patent/JP6333043B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2015206958A (ja) | 2015-11-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7427752B2 (ja) | 時間領域デコーダにおける量子化雑音を低減するためのデバイスおよび方法 | |
KR101461774B1 (ko) | 대역폭 확장기 | |
JP4294724B2 (ja) | 音声分離装置、音声合成装置および声質変換装置 | |
US7734462B2 (en) | Method and apparatus for extending the bandwidth of a speech signal | |
EP1252621B1 (en) | System and method for modifying speech signals | |
KR101237546B1 (ko) | 통신 시스템에서 프레임들을 연결하는 방법 | |
Tachibana et al. | An investigation of noise shaping with perceptual weighting for WaveNet-based speech generation | |
JP5535241B2 (ja) | 音声信号復元装置および音声信号復元方法 | |
US6694018B1 (en) | Echo canceling apparatus and method, and voice reproducing apparatus | |
TW201214419A (en) | Systems, methods, apparatus, and computer program products for wideband speech coding | |
RU2677453C2 (ru) | Способы, кодер и декодер для линейного прогнозирующего кодирования и декодирования звуковых сигналов после перехода между кадрами, имеющими различные частоты дискретизации | |
JP4302978B2 (ja) | 音声コーデックにおける擬似高帯域信号の推定システム | |
JP2006085176A (ja) | 帯域制限オーディオ信号の帯域拡大 | |
WO2005117517A2 (en) | Neuroevolution-based artificial bandwidth expansion of telephone band speech | |
JP5717097B2 (ja) | 音声合成用の隠れマルコフモデル学習装置及び音声合成装置 | |
BR112016030384B1 (pt) | Ajuste de ganho temporal baseado em característica de sinal de banda alta | |
JP2016540255A (ja) | ブラインド帯域幅拡張のシステムおよび方法 | |
JP5148414B2 (ja) | 信号帯域拡張装置 | |
JP6333043B2 (ja) | 音声信号処理装置 | |
KR20170080387A (ko) | 인-이어 마이크로폰을 갖는 이어셋의 대역폭 확장 장치 및 방법 | |
JP6032832B2 (ja) | 音声合成装置 | |
Gustafsson et al. | Low-complexity feature-mapped speech bandwidth extension | |
Gupta et al. | Artificial bandwidth extension using H∞ sampled-data control theory | |
JP4433668B2 (ja) | 帯域拡張装置及び方法 | |
JP5711645B2 (ja) | オーディオ信号出力装置およびオーディオ信号出力方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20170306 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20180222 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20180327 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20180424 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6333043 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |