JP2011090031A - 音声帯域拡張装置及びプログラム、並びに、拡張用パラメータ学習装置及びプログラム - Google Patents
音声帯域拡張装置及びプログラム、並びに、拡張用パラメータ学習装置及びプログラム Download PDFInfo
- Publication number
- JP2011090031A JP2011090031A JP2009241222A JP2009241222A JP2011090031A JP 2011090031 A JP2011090031 A JP 2011090031A JP 2009241222 A JP2009241222 A JP 2009241222A JP 2009241222 A JP2009241222 A JP 2009241222A JP 2011090031 A JP2011090031 A JP 2011090031A
- Authority
- JP
- Japan
- Prior art keywords
- signal
- narrowband
- band
- wideband
- voice
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Abstract
【解決手段】 音声帯域拡張装置を搭載した通信装置が広帯域音声信号を受信した場合には、発音出力させるだけでなく、符号帳を更新させる。この更新では、受信した広帯域音声信号と、その帯域を狭めた信号とを分析し、2つの信号についてそれぞれ、周波数概形を得る。狭帯域化信号について得られた周波数概形から、符号帳における更新対象を定め、広帯域音声信号について得られた周波数概形を反映させる学習を行う。通信装置が狭帯域音声信号を受信した場合には、学習された符号帳を適用して帯域拡張を行う。
【選択図】 図1
Description
以下、本発明による音声帯域拡張装置及びプログラム、並びに、拡張用パラメータ学習装置及びプログラムの第1の実施形態を、図面を参照しながら詳述する。
図1は、第1の実施形態の音声帯域拡張装置100の機能的構成を示すブロック図である。例えば、ソフトフォンは、コンピュータにソフトフォン用アプリケーションをインストールして構築されるものであるが、そのソフトフォン用アプリケーションの部分的プログラムとして第1の実施形態の音声帯域拡張プログラムを適用し、第1の実施形態の音声帯域拡張装置100を構築しても良い。また、ソフトフォンに適用しない場合であっても、狭帯域音声信号の帯域拡張を行う構成を、CPU(DSPを含む)及びそれが実行する音声帯域拡張プログラムで実現するようにしても良い。音声帯域拡張プログラムを利用する場合であっても、機能的構成を図1で表すことができる。
例えば、概形情報が複数の要素の値でなるものであれば、2つの概形情報の対応要素の差の2乗和を、類似を判断する指標として用いる。なお、要素に軽重がある場合には、差の2乗に対して重み付け係数を掛けた後に和をとるようにしても良い。
次に、第1の実施形態の音声帯域拡張装置100の動作を、学習モードでの動作、拡張モードでの動作の順に説明する。
第1の実施形態によれば、広帯域の音声信号の通信中に、広帯域及び狭帯域の周波数概形の対応を記憶している符号帳を更新しておき、狭帯域の音声信号の通信中には、このように更新された符号帳を利用するようにしたことにより、予め設定された符号帳を固定的に用いるよりも、現実の使用状況により近い符号帳が得られ、その結果、より品質の高い拡張音声信号を得ることができる。
次に、本発明による音声帯域拡張装置及びプログラム、並びに、拡張用パラメータ学習装置及びプログラムの第2の実施形態を、図面を参照しながら詳述する。
次に、本発明による音声帯域拡張装置及びプログラム、並びに、拡張用パラメータ学習装置及びプログラムの第3の実施形態を、図面を参照しながら詳述する。
上記各実施形態の説明においても、種々変形実施形態に言及したが、さらに、以下に例示するような変形実施形態を挙げることができる。
させておく。そして電話端末の利用者の通話相手となり得る者は、このサーバに対して、広帯域音声信号を送信させて学習させ、サーバが、学習後に、更新された符号帳の内容を音声帯域拡張装置にダウンロードさせて、その符号帳を更新させる。
Claims (8)
- 入力された狭帯域音声信号の帯域を拡張し、得られた広帯域音声信号を出力する音声帯域拡張装置において、
狭帯域音声信号を分析して得られる狭帯域の音声パラメータと、その狭帯域音声信号に対応する広帯域音声信号を分析して得られる広帯域の音声パラメータとの対応である広狭対応情報を、複数記憶している拡張用パラメータ格納手段と、
学習用広帯域音声信号における、狭帯域音声信号の帯域と同様な帯域部分を得、上記学習用広帯域音声信号についての音声パラメータと得られた狭帯域部分についての音声パラメータとを得て、得られた2つの音声パラメータに基づいて、上記拡張用パラメータ格納手段に格納されている、少なくともいずれかの広狭対応情報の音声パラメータを更新させる拡張用パラメータ更新手段と、
拡張対象の狭帯域音声信号が入力されたとき、入力された拡張対象の狭帯域音声信号についての音声パラメータを得て、上記拡張用パラメータ格納手段から、得られた音声パラメータに対応する広帯域の音声パラメータを取り出し、この広帯域の音声パラメータに対する、分析の逆処理によって、拡張対象の狭帯域音声信号の帯域を拡張した広帯域音声信号を生成する帯域拡張手段と
を有することを特徴とする音声帯域拡張装置。 - 当該音声帯域拡張装置を搭載した通信装置が対応する装置から受信している広帯域音声信号を上記学習用広帯域音声信号とすると共に、上記通信装置が対応する装置から受信している狭帯域音声信号を上記拡張対象の狭帯域音声信号とすることを特徴とする請求項1に記載の音声帯域拡張装置。
- 上記拡張用パラメータ更新手段には、上記学習用広帯域音声信号が入力され、この入力された学習用広帯域音声信号を処理して、上記拡張用パラメータ格納手段に格納されている、少なくともいずれかの広狭対応情報の音声パラメータを更新させることを特徴とする請求項2に記載の音声帯域拡張装置。
- 上記拡張用パラメータ格納手段として複数種類の拡張用パラメータ格納手段を有すると共に、どの種類の拡張用パラメータ格納手段が有効かを指示する有効種類指示手段を備え、
上記拡張用パラメータ更新手段及び上記帯域拡張手段は、上記有効種類指示手段が指示している種類の上記拡張用パラメータ格納手段を利用することを特徴とする請求項1に記載の音声帯域拡張装置。 - 上記拡張用パラメータ更新手段には、外部装置が上記学習用広帯域音声信号を処理して得た更新内容が与えられ、上記拡張用パラメータ更新手段は、この与えられた更新内容に基づいて、上記拡張用パラメータ格納手段に格納されている、少なくともいずれかの広狭対応情報の音声パラメータを更新させることを特徴とする請求項1に記載の音声帯域拡張装置。
- 入力された狭帯域音声信号の帯域を拡張し、得られた広帯域音声信号を出力する音声帯域拡張プログラムであって、
コンピュータを、
狭帯域音声信号を分析して得られる狭帯域の音声パラメータと、その狭帯域音声信号に対応する広帯域音声信号を分析して得られる広帯域の音声パラメータとの対応である広狭対応情報を、複数記憶している拡張用パラメータ格納手段と、
学習用広帯域音声信号における、狭帯域音声信号の帯域と同様な帯域部分が抽出され、上記学習用広帯域音声信号についての音声パラメータと抽出された狭帯域部分についての音声パラメータとを得て、得られた2つの音声パラメータに基づいて、上記拡張用パラメータ格納手段に格納されている、少なくともいずれかの広狭対応情報の音声パラメータを更新させる拡張用パラメータ更新手段と、
拡張対象の狭帯域音声信号が入力されたとき、入力された拡張対象の狭帯域音声信号についての音声パラメータを得て、上記拡張用パラメータ格納手段から、得られた音声パラメータに対応する広帯域の音声パラメータを取り出し、この広帯域の音声パラメータに対する、分析の逆処理によって、拡張対象の狭帯域音声信号の帯域を拡張した広帯域音声信号を生成する帯域拡張手段と
して機能させることを特徴とする音声帯域拡張プログラム。 - 入力された狭帯域音声信号の帯域を拡張し、得られた広帯域音声信号を出力する音声帯域拡張装置に設けられた拡張用パラメータ格納手段であって、狭帯域音声信号を分析して得られる狭帯域の音声パラメータと、その狭帯域音声信号に対応する広帯域音声信号を分析して得られる広帯域の音声パラメータとの対応である広狭対応情報を、複数記憶している拡張用パラメータ格納手段の格納内容を更新させる拡張用パラメータ学習装置であって、
入力された学習用広帯域音声信号における、狭帯域音声信号の帯域と同様な帯域部分を得る狭帯域化手段と、
上記学習用広帯域音声信号についての音声パラメータを得る広帯域信号分析手段と、
得られた狭帯域部分についての音声パラメータを得る狭帯域信号分析手段と、
上記狭帯域信号分析手段が得た音声パラメータに基づいて、上記拡張用パラメータ格納手段に格納されている広狭対応情報の中から、更新対象の広狭対応情報を定め、上記広帯域信号分析手段が得た音声パラメータを利用して定められた広狭対応情報の少なくとも広帯域の音声パラメータを更新する更新手段と
を有することを特徴とする拡張用パラメータ学習装置。 - 入力された狭帯域音声信号の帯域を拡張し、得られた広帯域音声信号を出力する音声帯域拡張装置に設けられた拡張用パラメータ格納手段であって、狭帯域音声信号を分析して得られる狭帯域の音声パラメータと、その狭帯域音声信号に対応する広帯域音声信号を分析して得られる広帯域の音声パラメータとの対応である広狭対応情報を、複数記憶している拡張用パラメータ格納手段の格納内容を更新させる拡張用パラメータ学習プログラムであって、
コンピュータを、
入力された学習用広帯域音声信号における、狭帯域音声信号の帯域と同様な帯域部分を得る狭帯域化手段と、
上記学習用広帯域音声信号についての音声パラメータを得る広帯域信号分析手段と、
得られた狭帯域部分についての音声パラメータを得る狭帯域信号分析手段と、
上記狭帯域信号分析手段が得た音声パラメータに基づいて、上記拡張用パラメータ格納手段に格納されている広狭対応情報の中から、更新対象の広狭対応情報を定め、上記広帯域信号分析手段が得た音声パラメータを利用して定められた広狭対応情報の少なくとも広帯域の音声パラメータを更新する更新手段と
して機能させることを特徴とする拡張用パラメータ学習プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009241222A JP2011090031A (ja) | 2009-10-20 | 2009-10-20 | 音声帯域拡張装置及びプログラム、並びに、拡張用パラメータ学習装置及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009241222A JP2011090031A (ja) | 2009-10-20 | 2009-10-20 | 音声帯域拡張装置及びプログラム、並びに、拡張用パラメータ学習装置及びプログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2011090031A true JP2011090031A (ja) | 2011-05-06 |
Family
ID=44108371
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009241222A Pending JP2011090031A (ja) | 2009-10-20 | 2009-10-20 | 音声帯域拡張装置及びプログラム、並びに、拡張用パラメータ学習装置及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2011090031A (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2016510133A (ja) * | 2013-02-15 | 2016-04-04 | クゥアルコム・インコーポレイテッドQualcomm Incorporated | パーソナライズされた帯域幅拡張 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH06118995A (ja) * | 1992-10-05 | 1994-04-28 | Nippon Telegr & Teleph Corp <Ntt> | 広帯域音声信号復元方法 |
JPH08147000A (ja) * | 1994-11-18 | 1996-06-07 | Yamaha Corp | ベクトル量子化による符号化復号方式 |
JPH08179796A (ja) * | 1994-12-21 | 1996-07-12 | Sony Corp | 音声符号化方法 |
JPH10124088A (ja) * | 1996-10-24 | 1998-05-15 | Sony Corp | 音声帯域幅拡張装置及び方法 |
-
2009
- 2009-10-20 JP JP2009241222A patent/JP2011090031A/ja active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH06118995A (ja) * | 1992-10-05 | 1994-04-28 | Nippon Telegr & Teleph Corp <Ntt> | 広帯域音声信号復元方法 |
JPH08147000A (ja) * | 1994-11-18 | 1996-06-07 | Yamaha Corp | ベクトル量子化による符号化復号方式 |
JPH08179796A (ja) * | 1994-12-21 | 1996-07-12 | Sony Corp | 音声符号化方法 |
JPH10124088A (ja) * | 1996-10-24 | 1998-05-15 | Sony Corp | 音声帯域幅拡張装置及び方法 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2016510133A (ja) * | 2013-02-15 | 2016-04-04 | クゥアルコム・インコーポレイテッドQualcomm Incorporated | パーソナライズされた帯域幅拡張 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Zhao et al. | Perceptually guided speech enhancement using deep neural networks | |
RU2648604C2 (ru) | Способ и аппаратура для генерации сигнала речи | |
KR20230043250A (ko) | 뉴럴 네트워크들을 사용하여 대상 화자의 음성으로 텍스트로부터의 스피치의 합성 | |
JP4818335B2 (ja) | 信号帯域拡張装置 | |
US8655656B2 (en) | Method and system for assessing intelligibility of speech represented by a speech signal | |
JP5375400B2 (ja) | 音声処理装置、音声処理方法およびプログラム | |
CN104781879B (zh) | 用于对音频信号进行编码的方法和装置 | |
US20090018826A1 (en) | Methods, Systems and Devices for Speech Transduction | |
CN105981102B (zh) | 音频信号的谐波带宽扩展 | |
EP3182409A2 (en) | Determining the inter-channel time difference of a multi-channel audio signal | |
WO2005117517A2 (en) | Neuroevolution-based artificial bandwidth expansion of telephone band speech | |
JP2000187496A (ja) | デジタル無線チャネル上の自動音声/話者認識 | |
JP3955179B2 (ja) | 音声符号化装置、音声復号化装置、およびこれらの方法 | |
Wang et al. | Phoneme-specific speech separation | |
JPWO2013027360A1 (ja) | 音声認識システム、認識辞書登録システム及び音響モデル識別子系列生成装置 | |
CN112562681B (zh) | 语音识别方法和装置、存储介质 | |
CN113724683B (zh) | 音频生成方法、计算机设备及计算机可读存储介质 | |
CN113498536A (zh) | 电子装置及其控制方法 | |
CN105719640B (zh) | 声音合成装置及声音合成方法 | |
Mandel et al. | Audio super-resolution using concatenative resynthesis | |
Ding et al. | UltraSpeech: Speech Enhancement by Interaction between Ultrasound and Speech | |
JP4006770B2 (ja) | ノイズ推定装置、ノイズ削減装置、ノイズ推定方法、及びノイズ削減方法 | |
JP2014199445A (ja) | サウンドマスキング装置、方法及びプログラム | |
JP2011090031A (ja) | 音声帯域拡張装置及びプログラム、並びに、拡張用パラメータ学習装置及びプログラム | |
JP2007240654A (ja) | 体内伝導通常音声変換学習装置、体内伝導通常音声変換装置、携帯電話機、体内伝導通常音声変換学習方法、体内伝導通常音声変換方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20120815 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20130521 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130528 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130724 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20130903 |