JP2016004234A - 音声再生装置および音声再生方法 - Google Patents
音声再生装置および音声再生方法 Download PDFInfo
- Publication number
- JP2016004234A JP2016004234A JP2014126321A JP2014126321A JP2016004234A JP 2016004234 A JP2016004234 A JP 2016004234A JP 2014126321 A JP2014126321 A JP 2014126321A JP 2014126321 A JP2014126321 A JP 2014126321A JP 2016004234 A JP2016004234 A JP 2016004234A
- Authority
- JP
- Japan
- Prior art keywords
- speech
- signal
- decoding
- speed conversion
- speech speed
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims description 69
- 238000006243 chemical reaction Methods 0.000 claims abstract description 274
- 230000005236 sound signal Effects 0.000 claims description 46
- 238000009825 accumulation Methods 0.000 abstract description 3
- 230000006835 compression Effects 0.000 abstract 1
- 238000007906 compression Methods 0.000 abstract 1
- 230000008569 process Effects 0.000 description 50
- 238000010586 diagram Methods 0.000 description 12
- 238000005562 fading Methods 0.000 description 6
- 230000008859 change Effects 0.000 description 5
- 230000009471 action Effects 0.000 description 2
- 230000004913 activation Effects 0.000 description 2
- NAWXUBYGYWOOIX-SFHVURJKSA-N (2s)-2-[[4-[2-(2,4-diaminoquinazolin-6-yl)ethyl]benzoyl]amino]-4-methylidenepentanedioic acid Chemical compound C1=CC2=NC(N)=NC(N)=C2C=C1CCC1=CC=C(C(=O)N[C@@H](CC(=C)C(O)=O)C(O)=O)C=C1 NAWXUBYGYWOOIX-SFHVURJKSA-N 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
Images
Landscapes
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
【解決手段】符号化音声信号をあらかじめ設定された復号条件に基づいて復号する音声復号部1と、復号した音声信号を蓄積する蓄積部2と、蓄積された音声信号の音声信号波形の基本周期を算出し、算出した基本周期およびあらかじめ設定された話速に基づき音声信号波形の伸長または圧縮を行い、音声信号の再生速度を変換して出力音声信号を生成する話速変換部3と、話速変換部3が算出した音声信号波形の基本周期、およびあらかじめ設定された話速に基づき音声復号部1の復号条件を決定する復号動作制御部4とを備える。
【選択図】図1
Description
話速変換前信号に対して、まず位置(X1)からの信号の基本周期Tp1を算出する。次に、位置(X1)から基本周期Tp1後(位置(X2))までの信号をフェードアウトさせた信号と、位置(X1)の基本周期Tp1後(位置(X2))から2×Tp1後(位置(X3))までの信号をフェードインさせた信号とを生成する。さらに生成したフェードアウトさせた信号とフェードインさせた信号を合算した長さTp1の信号を生成し、話速変換後信号として出力する。
y(t)={(t1+Tp1−t)/Tp1}x(t)
+{(t−t1)/Tp1}x(t+Tp1)・・・(1)
図7で示した話速変換後信号において、上述した話速変換後の部分の出力信号を太線 で表している。
まず、位置(Y1)の前後の信号の基本周期Tp1を算出する。次に、位置(Y1)の基本周期Tp1前から位置(Y1)までの信号をフェードインさせた信号と、位置(Y1)から位置(Y1)の基本周期Tp1後までの信号をフェードアウトさせた信号を生成する。さらに生成したフェードインさせた信号とフェードアウトさせた信号を合算した長さTp1の信号を生成し、話速変換後信号として出力する。図8で示した話速変換後信号において、上述した話速変換後の部分の出力信号を太線で表している。
図10における話速変換前後の音声信号波形は上述した図8と同様であり、話速変換前の信号の基本周期Tp1,Tp2、および話速調整用時間T1も図8と同様である。また、符号化フレーム境界、話速変換処理のタイミング、当該タイミングにおいて必要となる話速変換前の信号に対応する符号化フレーム番号を図9と同様に示している。
図1は、実施の形態1による音声再生装置の構成を示すブロック図である。
音声再生装置10は、音声復号部1、蓄積部2、話速変換部3および復号動作制御部4で構成されている。
音声復号部1は、高能率符号化された符号化音声の復号処理を行う。より詳細には、後述する話速変換処理に先立ち、話速変換処理タイミング毎に、後述する復号動作制御部4から指定される復号すべきフレーム数に基づいて復号処理を行う。蓄積部2は、例えばFIFO(First In Fast Out)バッファなどで構成され、音声復号部1が復号した音声信号を一時蓄積する。話速変換部3は、蓄積部2に蓄積された音声信号の再生速度を変換することにより話速変換を行って出力音声信号を生成し、出力する。復号動作制御部4は、音声復号部1の復号動作を制御する制御情報として、音声復号部1が復号すべきフレーム数(以下、動作フレーム数と称する)を算出する。
図2は、この発明の実施の形態1による音声再生装置の動作を示すフローチャートである。
高能率符号化された符号化音声が入力されると(ステップST1)、音声復号部1は当該高能率符号化された符号化音声に対して、あらかじめ復号動作制御部4から指定された動作フレーム数の復号処理を話速変換処理タイミング毎に行う(ステップST2)。ステップST2で復号された音声信号は蓄積部2に出力され、蓄積部2は入力された音声信号を一時蓄積する(ステップST3)。
図3は、実施の形態1による音声再生装置において音声信号の再生速度を上げる場合の話速変換処理を示す説明図である。
図3では、音声復号部1の出力である話速変換前の信号(以下、話速変換前信号と称する)、話速変換前信号の符号化フレーム境界、話速変換部3の出力である話速変換後の信号(以下、話速変換後信号と称する)および話速変換処理タイミングを示している。また、話速変換前信号の上部には基本周期Tp1、基本周期Tp2、基本周期Tp1算出後の話速調整用時間T1、想定される基本周期の最大値である最大基本周期Tmaxを示している。また、符号化フレーム境界は、音声符号の符号化フレーム長Tcを用いて示している。
まず、復号動作制御部4は話速変換処理タイミング(b)において、次に基本周期を算出する話速変換処理タイミング(g)までの話速変換処理タイミング回数noAを以下の式(2)に基づいて算出する。
noA=floor{(Ta+T1)/To}・・・(2)
式(2)において、floor{x}はx以下の最大の整数である。また、T1は話速変換処理タイミング(a)において話速変換部3が算出した基本周期Tp1および話速設定sから、T1=Tp1/(s−1)により求められる。図3の例では、式(2)により求めた話速変換処理タイミング回数noA=6となる。
nfA=ceil{(Ta+Tp1+T1+2・Tmax−Tb)/Tc}・・・(3)
式(3)において、ceil{x}はx以上の最小の整数を表す。図3の例では、式(3)により求めた符号化フレーム数nfA=8となる。
npA=ceil(nfA/noA)・・・(4)
nfA=nfA−npA
noA=noA−1 ・・・(5)
noA=ceil{(T1_ini)/To}
nfA=ceil{(T1_ini+2・Tmax−Tb)/Tc}・・・(6)
Ta=0
初期値T1_iniを十分大きい値に設定することにより、話速変換が実質的に開始されるまでに時間を要するが、音声復号部1の演算量増大を防止することができる。
図4では、図3と同様に話速変換前信号、符号化フレーム境界、話速変換後信号および話速変換処理タイミングを示している。話速変換前信号の上部には基本周期Tp1、基本周期Tp2、基本周期Tp1算出後の話速調整用時間T1、想定される基本周期の最大値である最大基本周期Tmaxを示している。また、符号化フレーム境界は、音声符号の符号化フレーム長Tcを用いて示している。
まず、復号動作制御部4は話速変換処理タイミング(b)において、次に基本周期を算出する話速変換処理タイミング(i)までの話速変換処理タイミング回数noBを以下の式(7)に基づいて算出する。
noB=floor{(Ta+Tp1+T1)/To}・・・(7)
式(7)において、T1は話速変換処理タイミング(a)において話速変換部3が算出した基本周期Tp1および話速設定sから、T1=Tp1×s/(1−s)により求められる。図4の例では、式(7)により求めた話速変換処理タイミング回数noB=8となる。
nfB=ceil{(Ta+T1+Tmax−Tb)/Tc}・・・(8)
式(8)において、ceil{x}はx以上の最小の整数を表す。図4の例では、式(8)により求めた符号化フレーム数nfB=7となる。
npB=ceil(nfB/noB)
nfB=nfB−npB・・・(9)
noB=noB−1
noB=ceil{(T1_ini2)/To}
nfB=ceil{(T1_ini2+Tmax−Tb)/Tc}・・・(10)
Ta=0
初期値T1_ini2を十分大きい値に設定することにより、話速変換が実質的に開始されるまでに時間を要するが、音声復号部1の演算量増大を防止することができる。
上述した実施の形態1とは異なる方法を適用して音声復号部1の動作フレーム数npA,npBを算出しても良い。具体的には、音声復号部1の動作フレーム数npA,npBは、次の基本周期算出を行う話速変換処理タイミングまでの話速変換処理タイミング回数noA,noB、および話速変換処理タイミングまでに復号されるべき符号化フレーム数nfA,nfBを算出した後、話速変換処理タイミング回数noA,noBの処理により符号化フレーム数nfA,nfBのフレームの符号が行われるように決定すればよい。
このように、実施の形態2による話速変換処理による音声復号部1の最大の処理フレーム数は「2」であり、演算量のピーク値は実施の形態1で示した話速変換処理と変わらない。
上述した実施の形態1および実施の形態2では復号動作制御部4が制御情報として音声復号部1の動作フレーム数を決定する構成を示したが、この実施の形態3では復号動作制御部4aが制御情報として音声復号部1aの復号処理時間を決定する構成を示す。
図5は、実施の形態3の音声再生装置の構成を示すブロック図である。
実施の形態3の音声再生装置10aは、図1で示した音声再生装置10の音声復号部1および復号動作制御部4に替えて、音声復号部1aおよび復号動作制御部4aを設けている。以下では、実施の形態1による音声再生装置10の構成要素と同一または相当する部分には、図1で使用した符号と同一の符号を付して説明を省略または簡略化する。
図6は、この発明の実施の形態2による音声再生装置の動作を示すフローチャートである。なお以下では、実施の形態1による音声再生装置10と同一のステップには図2で使用した符号と同一の符号を付し、説明を省略または簡略化する。
まず、復号動作制御部4aは、実施の形態1で示した復号動作制御部4と同様に話速変換処理タイミング(b)において、次に基本周期を算出する話速変換処理タイミング(g)までの話速変換処理タイミング回数noA、および話速変換処理タイミング(g)までに復号されるべき符号化フレーム数nfAを求める。
TdecA=Tdmax×nfA/noA・・・(11)
式(10)において、Tdmaxは音声復号部1aが1符号化フレーム分の処理を行う際の処理時間の最大値であり、あらかじめ求めておくものとする。
まず、復号動作制御部4aは、実施の形態1で示した復号動作制御部4と同様に話速変換処理タイミング(b)において、次に基本周期を算出する話速変換処理タイミング(i)までの話速変換処理タイミング回数noB、および話速変換処理タイミング(i)までに復号されるべき符号化フレーム数nfBを求める。
TdecB=Tdmax×nfB/noB・・・(12)
Claims (6)
- 入力された符号化音声信号を復号し、復号した音声信号の再生速度を変換して出力音声信号を生成する音声再生装置において、
前記符号化音声信号をあらかじめ設定された復号条件に基づいて復号する音声復号部と、
前記音声復号部が復号した音声信号を蓄積する蓄積部と、
前記蓄積部に蓄積された音声信号の音声信号波形の基本周期を算出し、算出した基本周期およびあらかじめ設定された話速に基づき前記音声信号波形の伸長または圧縮を行い、前記音声信号の再生速度を変換して前記出力音声信号を生成する話速変換部と、
前記話速変換部が算出した前記音声信号波形の基本周期、および前記あらかじめ設定された話速に基づき前記音声復号部の復号条件を決定する復号動作制御部とを備えたことを特徴とする音声再生装置。 - 前記復号動作制御部は、前記復号条件として、前記話速変換部が算出した前記音声信号波形の基本周期、および前記あらかじめ設定された話速に基づき、前記話速変換部が次に前記音声信号波形の基本周期を算出する位置に到達するまでの前記話速変換部の動作回数および復号すべき符号化フレーム数を算出し、算出した前記話速変換部の動作回数および前記復号すべき符号化フレーム数に基づき前記音声復号部の動作フレーム数を決定することを特徴とする請求項1記載の音声再生装置。
- 前記復号動作制御部は、前記復号条件として、前記話速変換部が算出した前記音声信号波形の基本周期、および前記あらかじめ設定された話速に基づき、前記話速変換部が次に前記音声信号波形の基本周期を算出する位置に到達するまでの前記話速変換部の動作回数および復号すべき符号化フレーム数を算出し、算出した前記話速変換部の動作回数および前記復号すべき符号化フレーム数に基づき前記音声復号部の動作時間を決定することを特徴とする請求項1記載の音声再生装置。
- 入力された符号化音声信号を復号し、復号した音声信号の再生速度を変換して出力音声信号を生成する音声再生方法において、
音声復号部が、前記符号化音声信号をあらかじめ設定された復号条件に基づいて復号する復号ステップと、
蓄積部が、前記復号された音声信号を蓄積する蓄積ステップと、
話速変換部が、前記蓄積された音声信号の音声信号波形の基本周期を算出し、算出した基本周期およびあらかじめ設定された話速に基づき前記音声信号波形の伸長または圧縮を行い、前記音声信号の再生速度を変換して前記出力音声信号を生成する出力音声信号生成ステップと、
復号動作制御部が、前記音声信号波形の基本周期、および前記あらかじめ設定された話速に基づき前記復号条件を決定する復号条件決定ステップとを備えたことを特徴とする音声再生方法。 - 前記復号条件決定ステップは、前記復号条件として、前記話速変換部が算出した前記音声信号波形の基本周期、および前記あらかじめ設定された話速に基づき、前記話速変換部が次に前記音声信号波形の基本周期を算出する位置に到達するまでの前記話速変換部の動作回数および復号すべき符号化フレーム数を算出し、前記算出した前記話速変換部の動作回数および前記復号すべき符号化フレーム数に基づき前記音声復号部の動作フレーム数を決定することを特徴とする請求項4記載の音声再生方法。
- 前記復号条件決定ステップは、前記復号条件として、前記話速変換部が算出した前記音声信号波形の基本周期、および前記あらかじめ設定された話速に基づき、前記話速変換部が次に前記音声信号波形の基本周期を算出する位置に到達するまでの前記話速変換部の動作回数および復号すべき符号化フレーム数を算出し、前記算出した前記話速変換部の動作回数および前記復号すべき符号化フレーム数に基づき前記音声復号部の動作時間を決定することを特徴とする請求項4記載の音声再生方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014126321A JP6385153B2 (ja) | 2014-06-19 | 2014-06-19 | 音声再生装置および音声再生方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014126321A JP6385153B2 (ja) | 2014-06-19 | 2014-06-19 | 音声再生装置および音声再生方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2016004234A true JP2016004234A (ja) | 2016-01-12 |
JP6385153B2 JP6385153B2 (ja) | 2018-09-05 |
Family
ID=55223523
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014126321A Active JP6385153B2 (ja) | 2014-06-19 | 2014-06-19 | 音声再生装置および音声再生方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6385153B2 (ja) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0219899A (ja) * | 1988-07-08 | 1990-01-23 | Hitachi Ltd | 音声蓄積再生装置 |
JPH11194796A (ja) * | 1997-10-31 | 1999-07-21 | Matsushita Electric Ind Co Ltd | 音声再生装置 |
JP2013005423A (ja) * | 2011-06-22 | 2013-01-07 | Nec Casio Mobile Communications Ltd | 映像再生装置、映像再生方法およびプログラム |
-
2014
- 2014-06-19 JP JP2014126321A patent/JP6385153B2/ja active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0219899A (ja) * | 1988-07-08 | 1990-01-23 | Hitachi Ltd | 音声蓄積再生装置 |
JPH11194796A (ja) * | 1997-10-31 | 1999-07-21 | Matsushita Electric Ind Co Ltd | 音声再生装置 |
JP2013005423A (ja) * | 2011-06-22 | 2013-01-07 | Nec Casio Mobile Communications Ltd | 映像再生装置、映像再生方法およびプログラム |
Also Published As
Publication number | Publication date |
---|---|
JP6385153B2 (ja) | 2018-09-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101596183B1 (ko) | 오디오 디코더, 오디오 인코더, 오디오 신호를 디코딩하는 방법, 오디오 신호를 인코딩하는 방법, 컴퓨터 프로그램 및 오디오 신호 | |
JP5743137B2 (ja) | 信号処理装置および方法、並びにプログラム | |
EP3175567B1 (en) | System and method of redundancy based packet transmission error recovery | |
US8670990B2 (en) | Dynamic time scale modification for reduced bit rate audio coding | |
KR101953613B1 (ko) | 지터 버퍼 제어부, 오디오 디코더, 방법 및 컴퓨터 프로그램 | |
JP6849619B2 (ja) | 低ビットレートで背景ノイズをモデル化するためのコンフォートノイズ付加 | |
JP2009524846A (ja) | 適応的時間/周波数ベース符号化モード決定装置およびこのための符号化モード決定方法 | |
JP2008529074A (ja) | 通信システムにおけるフレームの連結方法 | |
KR101952192B1 (ko) | 품질 제어를 이용하는 오디오 디코더, 방법 및 컴퓨터 프로그램 | |
JPWO2015041070A1 (ja) | 符号化装置および方法、復号化装置および方法、並びにプログラム | |
KR20140005277A (ko) | 저-지연 통합 스피치 및 오디오 코딩에서 에러 은닉을 위한 장치 및 방법 | |
WO2005117366A1 (ja) | 音声パケット再生方法、音声パケット再生装置、音声パケット再生プログラム、記録媒体 | |
JPWO2013061584A1 (ja) | 音信号ハイブリッドデコーダ、音信号ハイブリッドエンコーダ、音信号復号方法、及び音信号符号化方法 | |
JP2019164367A (ja) | 低複雑度の調性適応音声信号量子化 | |
US20080086654A1 (en) | Device and method for supplying master clock to stream processing apparatus for processing stream data frame by frame in synchronization with master clock | |
JP6385153B2 (ja) | 音声再生装置および音声再生方法 | |
JP6149775B2 (ja) | 情報処理装置、情報処理方法、およびプログラム | |
JP2020520478A (ja) | ステレオ信号処理方法及び装置 | |
JP5320508B2 (ja) | 符号化装置、復号装置、これらの方法、プログラム及び記録媒体 | |
JP5874341B2 (ja) | 音声信号処理装置及びプログラム | |
JP2008185615A (ja) | 可変長フレームの符号化方法、可変長フレームの復号化方法、及びコンピュータプログラム | |
CA2955757C (en) | Apparatus and method for comfort noise generation mode selection | |
JP4511860B2 (ja) | Adtsフレーム音声fs回路、aac再エンコーダ回路及び音声fs回路 | |
JP2006262292A (ja) | 符号化装置、復号装置、符号化方法及び復号方法 | |
JP2009260638A (ja) | 符号化装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20170126 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20171207 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20171219 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20180209 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20180710 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20180807 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6385153 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |