JP2008089651A - 音声符号化装置、音声復号装置、音声符号化方法、音声復号方法、及び、プログラム - Google Patents
音声符号化装置、音声復号装置、音声符号化方法、音声復号方法、及び、プログラム Download PDFInfo
- Publication number
- JP2008089651A JP2008089651A JP2006267244A JP2006267244A JP2008089651A JP 2008089651 A JP2008089651 A JP 2008089651A JP 2006267244 A JP2006267244 A JP 2006267244A JP 2006267244 A JP2006267244 A JP 2006267244A JP 2008089651 A JP2008089651 A JP 2008089651A
- Authority
- JP
- Japan
- Prior art keywords
- signal
- gain
- voiced
- residual signal
- speech
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
【解決手段】入力音声信号を予測分析部125により予測係数と残差信号とに分解し、前記残差信号の特徴量を取り出した後、符号化部133にて前記予測係数と前記特徴量とをまとめてエントロピ符号化する。生成された符号長が所定の符号長を超える場合には、予測分析次数調整部137により予測分析の次数を1つずつ減らしながら、生成された符号長が所定の符号長以内になるまで符号化の試行を繰り返す。
【選択図】図1
Description
今井聖、住田一男、古市千枝子著「音声合成のためのメル対数スペクトル近似(MLSA)フィルタ」、電子通信学会論文誌、第J66−A巻、第2号、p.122−129、1983年
音声信号を所定の次数の予測分析により予測係数と残差信号とに分解する予測分析部と、
前記残差信号のゲインを求めるゲイン抽出部と、
前記残差信号が有声音か無声音かを判別するとともに該残差信号が有声音であると判別された場合には該残差信号からピッチ周波数を抽出する有声無声判別及びピッチ抽出部と、
前記予測係数と前記ゲインと前記判別の結果と該判別の結果前記ピッチ周波数が抽出された場合には該ピッチ周波数とを符号に変換する符号化部と、
前記符号の長さが許容長を超えるか否かを判別し、符号の長さが許容長を超えると判別された場合には、前記予測分析部における予測分析の次数を減らして前記一連の符号化動作を繰り返し実行させる制御部と、
を備えたことを特徴とする。
音声信号に予測分析と符号化が施された結果生成された、符号化予測係数と符号化残差信号ゲインと該音声信号が無声音であるか又はあるピッチ周波数を有する有声音であるかという符号化有声無声情報とを受信する受信部と、
前記符号化予測係数と前記符号化残差信号ゲインと前記符号化有声無声情報とから予測係数と残差信号ゲインと有声無声情報とを復号する復号部と、
前記音声信号が無声音である場合には前記残差信号ゲインと等しいゲインを有する雑音を励起用信号として生成し、前記音声信号が有声音である場合には前記残差信号ゲインと等しいゲインを有し前記ピッチ周波数と等しい周波数を有するパルス列を励起用信号として生成する信号発生部と、
前記予測係数と前記励起用信号とを合成することにより音声を復元する合成フィルタと、
を備える。
音声信号を予測分析により予測係数と残差信号とに分解する予測分析ステップと、
前記残差信号のゲインを求めるゲイン抽出ステップと、
前記残差信号が有声音か無声音かを判別するとともに該残差信号が有声音であると判別された場合には該残差信号からピッチ周波数を抽出する有声無声判別及びピッチ抽出ステップと、
前記予測係数と前記ゲインと前記判別の結果と該判別の結果前記ピッチ周波数が抽出された場合には該ピッチ周波数とを符号に変換する符号化ステップと、
前記符号の長さを算出し該長さが許容長を超えるか否かを判別する符号長検討ステップと、
から構成され、
前記符号長検討ステップにおいて前記符号の長さが前記許容長を超えると判別された場合には、前記予測分析ステップにおける予測分析の次数を減らして、前記予測分析ステップと、前記ゲイン抽出ステップと、前記有声無声判別及びピッチ抽出ステップと、前記符号化ステップと、前記符号長検討ステップと、が繰り返される、
ことを特徴とする。
音声信号に予測分析と符号化が施された結果生成された、符号化予測係数と符号化残差信号ゲインと該音声信号が無声音であるか又はあるピッチ周波数を有する有声音であるかという符号化有声無声情報とを受信する受信ステップと、
前記符号化予測係数と前記符号化残差信号ゲインと前記符号化有声無声情報とから予測係数と残差信号ゲインと有声無声情報とを復号する復号ステップと、
前記音声信号が無声音である場合には前記残差信号ゲインと等しいゲインを有する雑音を励起用信号として生成し、前記音声信号が有声音である場合には前記残差信号ゲインと等しいゲインを有し前記ピッチ周波数と等しい周波数を有するパルス列を励起用信号として生成する信号発生ステップと、
前記予測係数と前記励起用信号とを合成することにより音声を復元する合成ステップと、
から構成される。
コンピュータに、
音声信号を予測分析により予測係数と残差信号とに分解する予測分析ステップと、
前記残差信号のゲインを求めるゲイン抽出ステップと、
前記残差信号が有声音か無声音かを判別するとともに該残差信号が有声音であると判別された場合には該残差信号からピッチ周波数を抽出する有声無声判別及びピッチ抽出ステップと、
前記予測係数と前記ゲインと前記判別の結果と該判別の結果前記ピッチ周波数が抽出された場合には該ピッチ周波数とを符号に変換する符号化ステップと、
前記符号の長さを算出し該長さが許容長を超えるか否かを判別する符号長検討ステップと、
前記符号長検討ステップにおいて前記符号の長さが前記許容長を超えると判別された場合には、前記予測分析ステップにおける予測分析の次数を減らして、前記予測分析ステップと、前記ゲイン算出ステップと、前記有声無声判別及びピッチ抽出ステップと、前記符号化ステップと、前記符号長検討ステップと、を繰り返す再符号化ステップと、
を実行させる。
コンピュータに、
音声信号に予測分析と符号化が施された結果生成された、符号化予測係数と符号化残差信号ゲインと該音声信号が無声音であるか又はあるピッチ周波数を有する有声音であるかという符号化有声無声情報とを受信する受信ステップと、
前記符号化予測係数と前記符号化残差信号ゲインと前記符号化有声無声情報とから予測係数と残差信号ゲインと有声無声情報とを復号する復号ステップと、
前記音声信号が無声音である場合には前記残差信号ゲインと等しいゲインを有する雑音を励起用信号として生成し、前記音声信号が有声音である場合には前記残差信号ゲインと等しいゲインを有し前記ピッチ周波数と等しい周波数を有するパルス列を励起用信号として生成する信号発生ステップと、
前記予測係数と前記励起用信号とを合成することにより音声を復元する合成ステップと、
を実行させる。
Gi=10×log10{(di、0 2+・・・+di、l−1 2)/l}
以下では、図1の予測分析部125が行う予測分析について、図4に示すフローチャートを参照しつつ説明する。予測分析としては、例えば、線型予測分析やMLSA(Mel Log Spectrum Approximation)分析が知られている。図4では、後者を括弧書きにして、両分析が併記されている。
以下では、図1の予測分析次数調整部137の制御下で行われる、予測分析、ゲイン抽出、有声無声判別及びピッチ抽出、エントロピ符号化の試行、及び、実際に送信されるエントロピ符号の生成、の手順について、図5に示すフローチャートを参照しつつ説明する。ここでは予測分析として線型予測分析を採用した場合について説明するが、MLSA分析を採用した場合も同様である。
Gi=10×log10{(di、0 2+・・・+di、l−1 2)/l}
のように計算される。
C(t)=di、0×di、t
+di、1×di、t+1
+・・・
+di、l-1-t×di、l-1
である。この式から分かるように、tは、残差信号Diに含まれる要素の個数を単位とした間隔である。よって、厳密には、残差信号Diに含まれる各要素がサンプリングされた時間間隔をtに乗じたものがここで検討すべき時間間隔である。したがって、この点では、ピッチ周波数を求めるにあたっては注意が必要である。もっとも、通常、残差信号Diに含まれる各要素がサンプリングされた時間間隔は一定であるから、ここで検討すべき時間間隔はtに比例する。よって、以下では、混同のおそれがない場合には、ここで検討すべき時間間隔を単にtと記す。
REG(t)={(di、0 2+・・・+di、l-1-t 2)
×(di、t 2+・・・+di、l-1 2)}0.5
のように定義し、規格化自己相関関数CREG(t)を
CREG(t)=C(t)/REG(t)
と定義するのが好適である。
以下では、図2の残差信号復元部235が行う処理について、図6に示すフローチャートを参照しつつ説明する。
以下では、図2の合成用フィルタ算出部237及び合成用フィルタ部239による音声信号復元の手順について、図7に示すフローチャートを参照しつつ説明する。予測分析として線型予測分析を採用した場合について説明するが、他の場合、例えばMLSA分析を採用した場合も、手順は同様である。
図8は、ケプストラムCi={ci、0、・・・、ci、(l/2)-1}からMLSAフィルタ係数Mi={mi、0、・・・、mi、p-1}を求める具体的な手順の一例をフローチャートにしたものである。ステップS811〜S835に示した計算を行うことにより、MLSAフィルタ係数が求まる。αは近似用の数値であり、音声信号が10kHzでサンプリングされている場合にはα=0.35とするのが好適である。また、β=1−α2である。mi(0≦i≦p−1)は0に初期化しておく。
Claims (10)
- 音声信号を所定の次数の予測分析により予測係数と残差信号とに分解する予測分析部と、
前記残差信号のゲインを求めるゲイン抽出部と、
前記残差信号が有声音か無声音かを判別するとともに該残差信号が有声音であると判別された場合には該残差信号からピッチ周波数を抽出する有声無声判別及びピッチ抽出部と、
前記予測係数と前記ゲインと前記判別の結果と該判別の結果前記ピッチ周波数が抽出された場合には該ピッチ周波数とを符号に変換する符号化部と、
前記符号の長さが許容長を超えるか否かを判別し、符号の長さが許容長を超えると判別された場合には、前記予測分析部における予測分析の次数を減らして前記一連の符号化動作を繰り返し実行させる制御部と、
を備えたことを特徴とする音声符号化装置。 - 前記有声無声判別及びピッチ抽出部は、
前記残差信号からあらかじめ低域部を抽出するローパスフィルタを備え、
前記低域部が有声音か無声音かを判別するとともに該低域部が有声音であると判別された場合には該低域部からピッチ周波数を抽出する、
ことを特徴とする請求項1に記載の音声符号化装置。 - 前記符号化部は、
エントロピ符号化を行う、
ことを特徴とする請求項1又は2に記載の音声符号化装置。 - 前記予測分析部は、
音声信号を線型予測分析により予測係数と残差信号とに分解する、
ことを特徴とする請求項1乃至3の何れか1項に記載の音声符号化装置。 - 前記予測分析部は、
音声信号をMLSA(Mel Log Spectrum Approximation)分析により予測係数と残差信号とに分解する、
ことを特徴とする請求項1乃至3の何れか1項に記載の音声符号化装置。 - 音声信号に予測分析と符号化が施された結果生成された、符号化予測係数と符号化残差信号ゲインと該音声信号が無声音であるか又はあるピッチ周波数を有する有声音であるかという符号化有声無声情報とを受信する受信部と、
前記符号化予測係数と前記符号化残差信号ゲインと前記符号化有声無声情報とから予測係数と残差信号ゲインと有声無声情報とを復号する復号部と、
前記音声信号が無声音である場合には前記残差信号ゲインと等しいゲインを有する雑音を励起用信号として生成し、前記音声信号が有声音である場合には前記残差信号ゲインと等しいゲインを有し前記ピッチ周波数と等しい周波数を有するパルス列を励起用信号として生成する信号発生部と、
前記予測係数と前記励起用信号とを合成することにより音声を復元する合成フィルタと、
を備える音声復号装置。 - 音声信号を予測分析により予測係数と残差信号とに分解する予測分析ステップと、
前記残差信号のゲインを求めるゲイン抽出ステップと、
前記残差信号が有声音か無声音かを判別するとともに該残差信号が有声音であると判別された場合には該残差信号からピッチ周波数を抽出する有声無声判別及びピッチ抽出ステップと、
前記予測係数と前記ゲインと前記判別の結果と該判別の結果前記ピッチ周波数が抽出された場合には該ピッチ周波数とを符号に変換する符号化ステップと、
前記符号の長さを算出し該長さが許容長を超えるか否かを判別する符号長検討ステップと、
から構成され、
前記符号長検討ステップにおいて前記符号の長さが前記許容長を超えると判別された場合には、前記予測分析ステップにおける予測分析の次数を減らして、前記予測分析ステップと、前記ゲイン抽出ステップと、前記有声無声判別及びピッチ抽出ステップと、前記符号化ステップと、前記符号長検討ステップと、が繰り返される、
ことを特徴とする音声符号化方法。 - 音声信号に予測分析と符号化が施された結果生成された、符号化予測係数と符号化残差信号ゲインと該音声信号が無声音であるか又はあるピッチ周波数を有する有声音であるかという符号化有声無声情報とを受信する受信ステップと、
前記符号化予測係数と前記符号化残差信号ゲインと前記符号化有声無声情報とから予測係数と残差信号ゲインと有声無声情報とを復号する復号ステップと、
前記音声信号が無声音である場合には前記残差信号ゲインと等しいゲインを有する雑音を励起用信号として生成し、前記音声信号が有声音である場合には前記残差信号ゲインと等しいゲインを有し前記ピッチ周波数と等しい周波数を有するパルス列を励起用信号として生成する信号発生ステップと、
前記予測係数と前記励起用信号とを合成することにより音声を復元する合成ステップと、
から構成される音声復号方法。 - コンピュータに、
音声信号を予測分析により予測係数と残差信号とに分解する予測分析ステップと、
前記残差信号のゲインを求めるゲイン抽出ステップと、
前記残差信号が有声音か無声音かを判別するとともに該残差信号が有声音であると判別された場合には該残差信号からピッチ周波数を抽出する有声無声判別及びピッチ抽出ステップと、
前記予測係数と前記ゲインと前記判別の結果と該判別の結果前記ピッチ周波数が抽出された場合には該ピッチ周波数とを符号に変換する符号化ステップと、
前記符号の長さを算出し該長さが許容長を超えるか否かを判別する符号長検討ステップと、
前記符号長検討ステップにおいて前記符号の長さが前記許容長を超えると判別された場合には、前記予測分析ステップにおける予測分析の次数を減らして、前記予測分析ステップと、前記ゲイン算出ステップと、前記有声無声判別及びピッチ抽出ステップと、前記符号化ステップと、前記符号長検討ステップと、を繰り返す再符号化ステップと、
を実行させるコンピュータプログラム。 - コンピュータに、
音声信号に予測分析と符号化が施された結果生成された、符号化予測係数と符号化残差信号ゲインと該音声信号が無声音であるか又はあるピッチ周波数を有する有声音であるかという符号化有声無声情報とを受信する受信ステップと、
前記符号化予測係数と前記符号化残差信号ゲインと前記符号化有声無声情報とから予測係数と残差信号ゲインと有声無声情報とを復号する復号ステップと、
前記音声信号が無声音である場合には前記残差信号ゲインと等しいゲインを有する雑音を励起用信号として生成し、前記音声信号が有声音である場合には前記残差信号ゲインと等しいゲインを有し前記ピッチ周波数と等しい周波数を有するパルス列を励起用信号として生成する信号発生ステップと、
前記予測係数と前記励起用信号とを合成することにより音声を復元する合成ステップと、
を実行させるコンピュータプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006267244A JP4935280B2 (ja) | 2006-09-29 | 2006-09-29 | 音声符号化装置、音声復号装置、音声符号化方法、音声復号方法、及び、プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006267244A JP4935280B2 (ja) | 2006-09-29 | 2006-09-29 | 音声符号化装置、音声復号装置、音声符号化方法、音声復号方法、及び、プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2008089651A true JP2008089651A (ja) | 2008-04-17 |
JP4935280B2 JP4935280B2 (ja) | 2012-05-23 |
Family
ID=39373921
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006267244A Expired - Fee Related JP4935280B2 (ja) | 2006-09-29 | 2006-09-29 | 音声符号化装置、音声復号装置、音声符号化方法、音声復号方法、及び、プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4935280B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2018072566A (ja) * | 2016-10-28 | 2018-05-10 | 富士通株式会社 | ピッチ抽出装置及びピッチ抽出方法 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS5226107A (en) * | 1975-08-22 | 1977-02-26 | Nippon Telegr & Teleph Corp <Ntt> | Basic period sampler of voice |
JPS6155700A (ja) * | 1984-08-27 | 1986-03-20 | 富士通株式会社 | ピッチ抽出処理方式 |
JPS63143598A (ja) * | 1986-12-06 | 1988-06-15 | 日本電気株式会社 | 音声特徴パラメ−タ抽出回路 |
JPH0830295A (ja) * | 1994-07-20 | 1996-02-02 | Sony Corp | ディジタル・オーディオ信号記録・再生方法と装置 |
JPH08160997A (ja) * | 1983-04-13 | 1996-06-21 | Texas Instr Inc <Ti> | 音声のピッチを決定する方法と音声伝達システム |
JPH0944198A (ja) * | 1995-07-25 | 1997-02-14 | Victor Co Of Japan Ltd | 音声の準可逆符号化装置 |
JP2000020099A (ja) * | 1998-06-26 | 2000-01-21 | Oki Electric Ind Co Ltd | 線形予測分析器,コード励振線形予測符号器及びコード励振線形予測復号器 |
JP2004212734A (ja) * | 2003-01-06 | 2004-07-29 | Yamaha Corp | 波形データ圧縮方法 |
-
2006
- 2006-09-29 JP JP2006267244A patent/JP4935280B2/ja not_active Expired - Fee Related
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS5226107A (en) * | 1975-08-22 | 1977-02-26 | Nippon Telegr & Teleph Corp <Ntt> | Basic period sampler of voice |
JPH08160997A (ja) * | 1983-04-13 | 1996-06-21 | Texas Instr Inc <Ti> | 音声のピッチを決定する方法と音声伝達システム |
JPS6155700A (ja) * | 1984-08-27 | 1986-03-20 | 富士通株式会社 | ピッチ抽出処理方式 |
JPS63143598A (ja) * | 1986-12-06 | 1988-06-15 | 日本電気株式会社 | 音声特徴パラメ−タ抽出回路 |
JPH0830295A (ja) * | 1994-07-20 | 1996-02-02 | Sony Corp | ディジタル・オーディオ信号記録・再生方法と装置 |
JPH0944198A (ja) * | 1995-07-25 | 1997-02-14 | Victor Co Of Japan Ltd | 音声の準可逆符号化装置 |
JP2000020099A (ja) * | 1998-06-26 | 2000-01-21 | Oki Electric Ind Co Ltd | 線形予測分析器,コード励振線形予測符号器及びコード励振線形予測復号器 |
JP2004212734A (ja) * | 2003-01-06 | 2004-07-29 | Yamaha Corp | 波形データ圧縮方法 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2018072566A (ja) * | 2016-10-28 | 2018-05-10 | 富士通株式会社 | ピッチ抽出装置及びピッチ抽出方法 |
Also Published As
Publication number | Publication date |
---|---|
JP4935280B2 (ja) | 2012-05-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102248252B1 (ko) | 대역폭 확장을 위한 고주파수 부호화/복호화 방법 및 장치 | |
US10586547B2 (en) | Classification between time-domain coding and frequency domain coding | |
EP2450884B1 (en) | Frame error concealment method and apparatus and decoding method and apparatus using the same | |
JP4380669B2 (ja) | 音声符号化装置、音声復号装置、音声符号化方法、音声復号方法、及び、プログラム | |
US20020016161A1 (en) | Method and apparatus for compression of speech encoded parameters | |
JP2021012398A (ja) | 音声符号化装置および方法 | |
RU2617926C1 (ru) | Способ, устройство и система для обработки аудиоданных | |
JP2004310088A (ja) | 半レート・ボコーダ | |
WO2002065457A2 (en) | Speech coding system with a music classifier | |
EP3352167A1 (en) | Audio encoder and decoder | |
CN101611550B (zh) | 一种用于音频量化的方法、设备和系统 | |
EP3614384B1 (en) | Method for estimating noise in an audio signal, noise estimator, audio encoder, audio decoder, and system for transmitting audio signals | |
JP2006171751A (ja) | 音声符号化装置及び方法 | |
JP4935280B2 (ja) | 音声符号化装置、音声復号装置、音声符号化方法、音声復号方法、及び、プログラム | |
US20190348055A1 (en) | Audio paramenter quantization | |
JP5451603B2 (ja) | デジタルオーディオ信号の符号化 | |
JP5119716B2 (ja) | 音声符号化装置、音声符号化方法、及び、プログラム | |
JP4935329B2 (ja) | 音声符号化装置、音声復号装置、音声符号化方法、音声復号方法、及び、プログラム | |
JP4872748B2 (ja) | 音声符号化装置、音声復号装置、音声符号化方法、音声復号方法、及び、プログラム | |
JP5724338B2 (ja) | 符号化装置および符号化方法、復号装置および復号方法、並びにプログラム | |
CN105632504A (zh) | Adpcm编解码器及adpcm解码器丢包隐藏的方法 | |
KR101449432B1 (ko) | 신호 부호화 및 복호화 방법 및 장치 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20090810 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20110428 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110517 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110705 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120124 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120206 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150302 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4935280 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |