JP6481271B2 - 音声復号化装置、音声復号化方法、音声復号化プログラム及び通信機器 - Google Patents
音声復号化装置、音声復号化方法、音声復号化プログラム及び通信機器 Download PDFInfo
- Publication number
- JP6481271B2 JP6481271B2 JP2014139817A JP2014139817A JP6481271B2 JP 6481271 B2 JP6481271 B2 JP 6481271B2 JP 2014139817 A JP2014139817 A JP 2014139817A JP 2014139817 A JP2014139817 A JP 2014139817A JP 6481271 B2 JP6481271 B2 JP 6481271B2
- Authority
- JP
- Japan
- Prior art keywords
- burst
- sound
- speech
- rupture
- plosive
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Description
各実施形態の音声符号化装置の説明に先立ち、各実施形態の音声符号化装置によって、MBE系の音声符号化方式の復号音声の明瞭性を改善できる理由を説明する。
次に、本発明に係る音声復号化装置、音声復号化方法、音声復号化プログラム及び通信機器の第1の実施形態を、図面を参照しながら詳細に説明する。
図1は、第1の実施形態に係る音声復号化装置の構成を示す機能ブロック図である。
次に、第1の実施形態の音声復号化装置1Aの動作を説明する。
第1の実施形態によれば、MBE系の音声符号化方式の復号音声において、特徴的な音響現象が損なわれた破裂音を破裂化させるので、当該復号音声の明瞭性を改善して聴き心地を向上させた音声を利用者に提供できる。
次に、本発明に係る音声復号化装置、音声復号化方法、音声復号化プログラム及び通信機器の第2の実施形態を、図面を参照しながら説明する。
図3は、第2の実施形態の復号音声の音質改善装置1Bの構成を示す機能ブロック図であり、第1の実施形態に係る図1との同一、対応の構成要素には同一符号を付して示している。
次に、第2の実施形態に係る音声復号化装置1Bの動作を説明する。音声復号化装置1Bの全体動作は、第1の実施形態の場合と同様であるので、その説明は省略し、以下では、破裂音検出手段21の動作を説明する。
第2の実施形態によれば、MBE系の音声符号化方式の復号音声において、特徴的な音響現象が損なわれた破裂音をより確実に破裂化させるので、当該復号音声の明瞭性を改善して聴き心地を向上させた音声を利用者に提供できる。
次に、本発明に係る音声復号化装置、音声復号化方法、音声復号化プログラム及び通信機器の第3の実施形態を、図面を参照しながら説明する。
図4は、第3の実施形態に係る音声復号化装置1Cの構成を示す機能ブロック図である。図4において、第1の実施形態に係る図1および第2の実施形態に係る図3と同一、対応する構成要素には、同一符号を付して示している。
次に、第3の実施形態に係る音声復号化装置1Cの動作を説明する。音声復号化装置1Cの全体動作は、第1および第2の実施形態の場合と同様であるので、その説明は省略し、以下では、破裂化処理手段31の動作を説明する。
第3の実施形態によれば、MBE系の音声符号化方式の複号音声において、特徴的な音響現象が損なわれた破裂音を破裂化させ、かつ誤って連続して破裂化させることがないので、当該複号音声の明瞭性を改善して聴き心地を向上させた音声を利用者に提供できる。
次に、本発明に係る音声復号化装置、音声復号化方法、音声復号化プログラム及び通信機器の第4の実施形態を、図面を参照しながら説明する。
図5は、第4の実施形態の音声復号化装置の構成を示す機能ブロック図である。図5において、第1の実施形態に係る図1および第2の実施形態に係る図3との同一、対応の構成要素には同一符号を付して示している。
次に、第4の実施形態に係る音声復号化装置1Dの動作を説明する。音声復号化装置1Dの全体動作は、第1および第2の実施形態の場合と同様であるので、その説明は省略し、以下では、破裂化処理手段41の動作を説明する。
第4の実施形態によれば、MBE系の音声符号化方式の復号音声において、特徴的な音響現象が損なわれた破裂音をより確実に破裂化させるので、当該復号音声の明瞭性を改善して聴き心地を向上させた音声を利用者に提供できる。
次に、本発明に係る音声復号化装置、音声復号化方法、音声復号化プログラム及び通信機器の第5の実施形態を、図面を参照しながら説明する。
図6は、第5の実施形態の音声復号化装置1Eの構成を示す機能ブロック図である。図6において、第1の実施形態に係る図1、第2の実施形態に係る図3、および第3の実施形態に係る図5との同一、対応の構成要素には同一符号を付して示している。
次に、第5の実施形態に係る音声復号化装置1Eの動作を説明する。音声復号化装置1Eの全体動作は、第1〜第4の実施形態の場合と同様であるので、その説明は省略し、以下では、破裂化処理手段51の動作を説明する。
第5の実施形態によれば、MBE系の音声符号化方式の復号音声において、特徴的な音響現象が損なわれた破裂音をより確実に破裂化させ、かつ誤って連続して破裂化させることがないので、当該復号音声の明瞭性を改善して聴き心地を向上させた音声を利用者に提供できる。
次に、本発明に係る音声復号化装置、音声復号化方法、音声復号化プログラム及び通信機器の第6の実施形態を、図面を参照しながら説明する。
図7は、第6の実施形態に係る音声復号化装置1Fの構成を示す機能ブロック図である。図7において、第1〜5の実施形態に係る図1、図3〜6との同一、対応の構成要素には同一符号を付して示している。
次に、第6の実施形態に係る音声復号化装置1Fの動作を説明する。音声復号化装置1Fの全体動作は、第1〜第5の実施形態の場合と同様であるので、その説明は省略し、以下では、破裂化処理手段61の動作を説明する。
以上のように、第6の実施形態によれば、MBE系の音声符号化方式の復号音声において、特徴的な音響現象が損なわれた破裂音をより確実に破裂化させ、かつ誤って連続して破裂化させることがないので、当該復号音声の明瞭性を改善して聴き心地を向上させた音声を利用者に提供できる。
次に、本発明に係る音声復号化装置、音声復号化方法、音声復号化プログラム及び通信機器の第7の実施形態を、図面を参照しながら説明する。
図8は、第7の実施形態に係る音声復号化装置の構成を示す機能ブロック図である。図8において、第1〜6の実施形態に係る図1、図3〜7との同一、対応の構成要素には同一符号を付して示している。
次に、第7の実施形態に係る音声復号化装置1Gの動作を説明する。
以上のように、第7の実施形態によれば、MBE系の音声符号化方式の復号音声において、特徴的な音響現象が損なわれた破裂音をより適切に破裂化させることができるので、当該復号音声の明瞭性を改善して聴き心地を向上させた音声を利用者に提供できる。
上記各実施形態においても種々の変形実施形態に言及したが、さらに、以下に例示するような変形実施形態を挙げることができる。
Claims (20)
- MBE系の音声符号化方式に従って符号化されているデジタル符号化情報を復号する音声復号化装置において、
上記デジタル音声符号化情報を復号化して復号音声を生成するMBE系復号手段と、
上記復号音声の破裂音を検出する破裂音検出手段と、
検出された上記破裂音を破裂化させる破裂化処理手段と
を備え、
上記破裂化処理手段は、
上記破裂音検出手段において当該処理フレームが破裂音であると判定された場合には、上記復号音声に所定の重み係数を乗じて出力し、
上記破裂音検出手段において当該処理フレームが破裂音でないと判定された場合には、上記復号音声をそのまま出力し、
上記重み係数は、
無音部と破裂部始端と破裂部後半の3状態で構成され、
無音部は0dBより小さな値を持ち、
破裂部始端で前記無音部の値から0dBよりも大きな値へ増大し、
破裂部後半で前記破裂部始端の0dBより大きな値から0dBへ減少する
ことを特徴とする音声復号化装置。 - 上記破裂音検出手段は、
上記MBE系復号手段の処理周期よりも短い周期でパワーを算出し、
得られた短周期パワーを所定のルールで定めた基準パワーで除して、
得られたパワー比が所定の閾値以上であれば破裂音であると判定する
ことを特徴とする請求項1に記載の音声復号化装置。 - 上記所定のルールは、
パワー比を算出する対象時刻に対して、
当該対象時刻が当該処理フレーム内の始端であれば当該対象時刻の短周期パワーを前記基準パワーとし、
当該対象時刻が当該処理フレーム内の始端より後であれば当該処理フレーム内の始端から当該対象時刻の直前までの短周期パワーの最小値を前記基準パワーとする
ことを特徴とする請求項2に記載の音声復号化装置。 - 上記所定のルールは、
パワー比を算出する対象時刻に対して、当該対象時刻より所定時間前から当該対象時刻の直前までの短周期パワーの最小値を前記基準パワーとする
ことを特徴とする請求項2に記載の音声復号化装置。 - 上記破裂音検出手段は、
上記MBE系復号手段からの復号音声を周波数解析し、
得られたパワースペクトルに対してパターン認識を行って破裂音か否かを判定する
ことを特徴とする請求項1に記載の音声復号化装置。 - 上記破裂化処理手段は、
上記破裂音検出手段において2フレーム以上連続して破裂音を検出した場合に、最初に検出したフレームのみを基準に1回だけ上記重み係数を乗じる
ことを特徴とする請求項5に記載の音声復号化装置。 - 上記破裂化処理手段は、
上記復号音声をサンプルごとに非負値に変換し、
得られた非負値化信号の和に関するフレーム内の重心を算出し、
得られた重心時刻に基づいて上記重み係数を時間方向に平行移動してから復号音声に乗じる
ことを特徴とする請求項5に記載の音声復号化装置。 - 上記破裂化処理手段は、
上記破裂音検出手段において連続して破裂音を検出した回数に基づいて、上記重み係数を時間方向に平行移動してから復号音声に乗じる
ことを特徴とする請求項6に記載の音声復号化装置。 - 上記破裂化処理手段は、
上記復号音声をサンプルごとに非負値に変換し、
上記破裂音検出手段が連続して破裂音を検出した回数と同数のフレーム内の当該非負値化信号の和に関する重心を算出して得られる重心時刻とに基づいて、上記重み係数を時間方向に平行移動してから復号音声に乗じる
ことを特徴とする請求項6に記載の音声復号化装置。 - MBE系の音声符号化方式に従って符号化されているデジタル符号化情報を復号する音声復号化装置において、
上記デジタル音声符号化情報を復号化して復号音声を生成するMBE系復号手段と、
上記復号音声の破裂音を周波数領域で検出する周波数領域破裂音検出手段と、
上記周波数領域破裂音検出手段において連続して破裂音を検出した回数と同数のフレーム内の上記復号音声を、サンプルごとに非負値に変換して得られた非負値化信号の和に関する重心を算出して重心時刻を算出する重心時刻算出手段と、
上記復号音声の破裂音を時間領域で検出する時間領域破裂音検出手段と、
上記重心時刻と上記時間領域破裂音検出手段から得られた破裂情報とを、当該破裂情報に基づいて選択する破裂情報選択手段と、
上記周波数領域破裂音検出手段の判定結果と上記破裂情報とに基づいて、破裂音か否かを再判定する破裂検定手段と、
上記破裂検定手段において破裂音であると判定したフレームを基準として、上記破裂情報選択手段から得られた重み係数設計情報に基づいて予め設計された所定の重み係数を再設計して、上記復号音声に当該重み係数を乗じる破裂化処理手段と
を備えることを特徴とする音声復号化装置。 - 上記予め設計される所定の重み係数は、
無音部と破裂部始端と破裂部後半の3状態で構成され、
無音部は0dBより小さな値を持ち、
破裂部始端で前記無音部の値から0dBよりも大きな値へ増大し、
破裂部後半で前記破裂部始端の0dBより大きな値から0dBへ減少する
ことを特徴とする請求項10に記載の音声復号化装置。 - 上記周波数領域破裂音検出手段は、
上記MBE系復号手段を周波数解析し、
得られたパワースペクトルに対してパターン認識を行って破裂音か否かを判定する
ことを特徴とする請求項10又は11に記載の音声復号化装置。 - 上記時間領域破裂音検出手段は、
上記MBE系復号手段の処理周期よりも短い周期でパワーを算出し、
得られた短周期パワーを所定のルールで定めた基準パワーで除して、
得られたパワー比が所定の閉値以上であれば破裂音であると判定する
ことを特徴とする請求項10〜12のいずれかに記載の音声復号化装置。 - 上記所定のルールは、
パワー比を算出する対象時刻に対して、
当該対象時刻が当該処理フレーム内の始端であれば当該対象時刻の短周期パワーを前記基準パワーとし、
当該対象時刻が当該処理フレーム内の姶端より後であれば当該処理フレーム内の始端から当該対象時刻の直前までの短周期パワーの最小値を上記基準パワーとする
ことを特徴とする請求項13に記載の音声復号化装置。 - 上記所定のルールは、
パワー比を算出する対象時刻に対して、当該対象時刻より所定時間前から当該対象時刻の直前までの短周期パワーの最小値を前記基準パワーとする
ことを特徴とする請求項13に記載の音声復号化装置。 - MBE系の音声符号化方式に従って符号化されているデジタル符号化情報を復号する音声復号化方法において、
MBE系復号手段が、上記デジタル音声符号化情報を復号化して復号音声を生成し、
破裂音検出手段が、上記復号音声の破裂音を検出し、
破裂化処理手段が、検出された上記破裂音を破裂化させ、
上記破裂化処理手段は、
上記破裂音検出手段において当該処理フレームが破裂音であると判定された場合には、上記復号音声に所定の重み係数を乗じて出力し、
上記破裂音検出手段において当該処理フレームが破裂音でないと判定された場合には、上記復号音声をそのまま出力し、
上記重み係数は、
無音部と破裂部始端と破裂部後半の3状態で構成され、
無音部は0dBより小さな値を持ち、
破裂部始端で前記無音部の値から0dBよりも大きな値へ増大し、
破裂部後半で前記破裂部始端の0dBより大きな値から0dBへ減少する
ことを特徴とする音声復号化方法。 - MBE系の音声符号化方式に従って符号化されているデジタル符号化情報を復号する音声復号化方法において、
MBE系復号手段が、上記デジタル音声符号化情報を復号化して復号音声を生成し、
周波数領域破裂音検出手段が、上記復号音声の破裂音を周波数領域で検出し、
重心時刻算出手段が、上記周波数領域破裂音検出手段において連続して破裂音を検出した回数と同数のフレーム内の上記復号音声を、サンプルごとに非負値に変換して得られた非負値化信号の和に関する重心を算出して重心時刻を算出し、
時間領域破裂音検出手段が上記復号音声の破裂音を時間領域で検出し、
破裂情報選択手段が、上記重心時刻と上記時間領域破裂音検出手段から得られた破裂情報とを、当該破裂情報に基づいて選択し、
破裂検定手段が、上記周波数領域破裂音検出手段の判定結果と上記破裂情報とに基づいて、破裂音か否かを再判定し、
破裂化処理手段が、上記破裂検定手段において破裂音であると判定したフレームを基準として、上記破裂情報選択手段から得られた重み係数設計情報に基づいて予め設計された所定の重み係数を再設計して、上記復号音声に当該重み係数を乗じる
ことを特徴とする音声復号化方法。 - MBE系の音声符号化方式に従って符号化されているデジタル符号化情報を復号する音声復号化プログラムにおいて、
コンピュータを、
上記デジタル音声符号化情報を復号化して復号音声を生成するMBE系復号手段と、
上記復号音声の破裂音を検出する破裂音検出手段と、
検出された上記破裂音を破裂化させる破裂化処理手段と
して機能させ、
上記破裂化処理手段は、
上記破裂音検出手段において当該処理フレームが破裂音であると判定された場合には、上記復号音声に所定の重み係数を乗じて出力し、
上記破裂音検出手段において当該処理フレームが破裂音でないと判定された場合には、上記復号音声をそのまま出力し、
上記重み係数は、
無音部と破裂部始端と破裂部後半の3状態で構成され、
無音部は0dBより小さな値を持ち、
破裂部始端で前記無音部の値から0dBよりも大きな値へ増大し、
破裂部後半で前記破裂部始端の0dBより大きな値から0dBへ減少する
ことを特徴とする音声復号化プログラム。 - MBE系の音声符号化方式に従って符号化されているデジタル符号化情報を復号する音声復号化プログラムにおいて、
コンピュータを、
上記デジタル音声符号化情報を復号化して復号音声を生成するMBE系復号手段と、
上記復号音声の破裂音を周波数領域で検出する周波数領域破裂音検出手段と、
上記周波数領域破裂音検出手段において連続して破裂音を検出した回数と同数のフレーム内の上記復号音声を、サンプルごとに非負値に変換して得られた非負値化信号の和に関する重心を算出して重心時刻を算出する重心時刻算出手段と、
上記復号音声の破裂音を時間領域で検出する時間領域破裂音検出手段と、
上記重心時刻と上記時間領域破裂音検出手段から得られた破裂情報とを、当該破裂情報に基づいて選択する破裂情報選択手段と、
上記周波数領域破裂音検出手段の判定結果と上記破裂情報とに基づいて、破裂音か否かを再判定する破裂検定手段と、
上記破裂検定手段において破裂音であると判定したフレームを基準として、上記破裂情報選択手段から得られた重み係数設計情報に基づいて予め設計された所定の重み係数を再設計して、上記復号音声に当該重み係数を乗じる破裂化処理手段と
して機能させることを特徴とする音声復号化プログラム。 - 請求項1〜15のいずれかに記載の音声復号化装置を備えることを特徴とする通信機器。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014139817A JP6481271B2 (ja) | 2014-07-07 | 2014-07-07 | 音声復号化装置、音声復号化方法、音声復号化プログラム及び通信機器 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014139817A JP6481271B2 (ja) | 2014-07-07 | 2014-07-07 | 音声復号化装置、音声復号化方法、音声復号化プログラム及び通信機器 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2016018042A JP2016018042A (ja) | 2016-02-01 |
JP6481271B2 true JP6481271B2 (ja) | 2019-03-13 |
Family
ID=55233308
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014139817A Active JP6481271B2 (ja) | 2014-07-07 | 2014-07-07 | 音声復号化装置、音声復号化方法、音声復号化プログラム及び通信機器 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6481271B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113053364A (zh) * | 2019-12-27 | 2021-06-29 | 北京搜狗科技发展有限公司 | 一种语音识别方法、装置和用于语音识别的装置 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3321971B2 (ja) * | 1994-03-10 | 2002-09-09 | ソニー株式会社 | 音声信号処理方法 |
US6889186B1 (en) * | 2000-06-01 | 2005-05-03 | Avaya Technology Corp. | Method and apparatus for improving the intelligibility of digitally compressed speech |
JP4644876B2 (ja) * | 2005-01-28 | 2011-03-09 | 株式会社国際電気通信基礎技術研究所 | 音声処理装置 |
JP4946293B2 (ja) * | 2006-09-13 | 2012-06-06 | 富士通株式会社 | 音声強調装置、音声強調プログラムおよび音声強調方法 |
-
2014
- 2014-07-07 JP JP2014139817A patent/JP6481271B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2016018042A (ja) | 2016-02-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9734835B2 (en) | Voice decoding apparatus of adding component having complicated relationship with or component unrelated with encoding information to decoded voice signal | |
EP3118849B1 (en) | Encoding device, decoding device, and method thereof | |
EP1775717B1 (en) | Speech decoding apparatus and compensation frame generation method | |
JP3881943B2 (ja) | 音響符号化装置及び音響符号化方法 | |
US8063809B2 (en) | Transient signal encoding method and device, decoding method and device, and processing system | |
EP2382622B1 (en) | Method and apparatus for generating an enhancement layer within a multiple-channel audio coding system | |
EP2382626B1 (en) | Selective scaling mask computation based on peak detection | |
EP2382621B1 (en) | Method and appratus for generating an enhancement layer within a multiple-channel audio coding system | |
EP2382627B1 (en) | Selective scaling mask computation based on peak detection | |
JP3881946B2 (ja) | 音響符号化装置及び音響符号化方法 | |
EP1785984A1 (en) | Audio encoding apparatus, audio decoding apparatus, communication apparatus and audio encoding method | |
EP3182412B1 (en) | Sound quality improving method and device, sound decoding method and device, and multimedia device employing same | |
US20080069016A1 (en) | Packet based echo cancellation and suppression | |
JP5773124B2 (ja) | 信号分析制御及び信号制御のシステム、装置、方法及びプログラム | |
WO2014051964A1 (en) | Apparatus and method for audio frame loss recovery | |
JP5668923B2 (ja) | 信号分析制御システム及びその方法と、信号制御装置及びその方法と、プログラム | |
EP4376304A2 (en) | Encoder, decoder, encoding method, decoding method, and program | |
JP4365653B2 (ja) | 音声信号送信装置、音声信号伝送システム及び音声信号送信方法 | |
JP6481271B2 (ja) | 音声復号化装置、音声復号化方法、音声復号化プログラム及び通信機器 | |
JP2005091749A (ja) | 音源信号符号化装置、及び音源信号符号化方法 | |
JP4287840B2 (ja) | 符号化装置 | |
JP2000134162A (ja) | 帯域幅拡張方法及び装置 | |
JP2004301954A (ja) | 音響信号の階層符号化方法および階層復号化方法 | |
GB2365297A (en) | Data modem compatible with speech codecs | |
JPWO2009038115A1 (ja) | 音声符号化装置、音声符号化方法及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20170515 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20180529 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20180612 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20180810 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20190115 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20190128 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6481271 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |