JP4928366B2 - ピッチ探索装置、パケット消失補償装置、それらの方法、プログラム及びその記録媒体 - Google Patents
ピッチ探索装置、パケット消失補償装置、それらの方法、プログラム及びその記録媒体 Download PDFInfo
- Publication number
- JP4928366B2 JP4928366B2 JP2007166882A JP2007166882A JP4928366B2 JP 4928366 B2 JP4928366 B2 JP 4928366B2 JP 2007166882 A JP2007166882 A JP 2007166882A JP 2007166882 A JP2007166882 A JP 2007166882A JP 4928366 B2 JP4928366 B2 JP 4928366B2
- Authority
- JP
- Japan
- Prior art keywords
- section
- candidate
- pitch
- candidate section
- subframe
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Data Exchanges In Wide-Area Networks (AREA)
Description
出力音声バッファ66に蓄積された音声信号は、ピッチ探索部67に送られる。
ピッチ探索部67は、後述する方法によりピッチを計算して、音響波形補完処理部68に送る。
音響波形補完処理部68は、出力音声バッファ66に蓄えられた直前フレームの再生音声から、ピッチ長の波形又は予め規則によって決められたピッチ長に対応する長さの波形(以下、ピッチ長の波形)を切り出し、切り出したピッチ長の波形をピッチ長の間隔で並べることによって、ロスしたフレーム部分の音声信号を生成する。
ITU-T G.711 Appendix I、[online]、[平成19年6月8日検索]、インターネット<http://www.itu.int/rec/T-REC-G.711-199909-I!AppI/en>
しかし、音声信号の時系列には比較的定常とみなせる部分と、非定常に変動している部分がある。パケットロスが発生したフレームの直前フレームが、たまたま非定常的に変動している部分であったり、たまたま背景雑音と重なったりした場合に、予め定めた探索範囲で、サンプル位置をずらしながら基準区間との相関値を順次計算しても、十分に高い相関値を得ることができないことがあった。ここでいう十分に高い相関値とは、全く同じ形の波形がピッチ長周期で繰り返している場合の相関値を1と定義すると、少なくとも0.6以上、好ましくは0.8以上であることをいう。
また、この発明の一態様によるパケット補償装置によれば、計算された音響信号のピッチの長さの音響信号をパケットが消失したフレームの直前のフレームから切り出して、そのパケットが消失したフレームの部分に繰り返し並べる。
図1〜5を参照して、本発明の第一実施形態によるピッチ探索装置100について説明をする。図1は、ピッチ探索装置100の機能構成を例示する図である。図1に例示するように、ピッチ探索装置100は、候補区間ごとの候補区間比較尺度を計算する候補区間比較尺度計算部1、複数の候補区間の中から1つの基準区間を決定する基準区間決定部2、基準区間に基づいてピッチを計算するピッチ計算部3を備える。
候補区間比較尺度計算部1(図1)は、入力された音声信号に2つ以上の候補区間を割り当てて、割り当てた各候補区間の音声信号から、各候補区間ごとに候補区間比較尺度を計算して、基準区間決定部2に送る(ステップS1)。ここで、候補区間とは、基準区間の候補である区間のことである。ステップS1は、例えば次のステップS11〜S13から構成される。また、候補区間比較尺度は、音声信号がどの程度定常的であるかを表す指標である。
入力された音声信号は、候補区間比較尺度計算部1の分割部10(図2)に送られる。分割部10は、音声信号を複数のサブフレームに分割する(ステップS11)。分割された各サブフレームの音声信号は、サブフレーム比較尺度計算部11に送られる。
サブフレーム比較尺度計算部11は、各サブフレームごとにサブフレーム比較尺度を計算して、結合部12に送る(ステップS12)。サブフレームの数が3つである場合には、サブフレーム比較尺度計算部11は、サブフレームX1,X2,X3のサブフレーム比較尺度P1,P2,P3をそれぞれ計算して、結合部12に送る。
結合部12は、各候補区間を構成する各サブフレームのサブフレーム比較尺度を用いて、各候補区間の候補区間比較尺度を計算して、基準区間決定部2(図1、図3)に出力する(ステップS13)。例えば、各候補区間を構成する各サブフレームのサブフレーム比較尺度を加算することにより、各候補区間の候補区間比較尺度を計算する。音声信号がどの程度定常的であるかを表す指標であるサブフレーム比較尺度から計算されるため、候補区間比較尺度も、音声信号がどの程度定常的であるかを表す指標となる。
基準区間決定部2(図1、図3)は、各候補区間の候補区間比較尺度を比較することにより、各候補区間の中から定常的な1つの候補区間を決定して、その候補区間を基準区間とする(ステップS2)。決定された基準区間に関する情報(基準区間情報)は、ピッチ計算部3(図1、図4)に出力される。
ピッチ計算部3(図1、図4)は、基準区間決定部2が決定した基準区間に基づいて、入力音声信号のピッチを計算して出力する。ステップ3は、下記のステップS31〜S33から構成される。
まず、ピッチ計算部3の相関値計算部31(図4)は、予め定められた探索範囲で、決定された基準区間を順次ずらした区間のそれぞれについて、そのずらした区間の信号と、上記決定された基準区間の信号との相関値を順次計算する(ステップS31)。計算された計算値は相関最大区間決定部32に送られる。探索範囲とは、基準区間に対するずれjの範囲のことである。
相関最大区間決定部32は、相関値を最大にする区間を決定して、その区間を相関最大区間とする。相関最大区間についての情報(相関最大区間情報)は、差計算部33に送られる(ステップS32)。
差計算部33は、相関最大区間と、基準区間とのサンプル位置の差を計算してピッチ長を求める。このピッチ長をピッチとして出力する(ステップS33)。相関最大区間SBは相関最大区間情報からを特定され、基準区間は基準区間情報によって特定される。
なお、図3に破線で示すように、加重計算部21を基準区間決定部2に設けてもよい。本発明の第二実施形態によるピッチ探索装置は、加重計算部21を備えている点で、第一実施形態によるピッチ探索装置と異なる。他の機能構成・処理については、第一実施形態によるピッチ探索装置100と同様である。
なお、上記実施形態では、音声信号をサブフレームに分割して、サブフレームごとのサブフレーム比較尺度から各候補区間の候補区間比較尺度を求めたが、このサブフレーム分割は必ずしも必要ではない。すなわち、ピッチ探索装置100は、サブフレームの分割を行わずに、複数の異なる候補区間を音声信号に直接割り当てて、それらの割り当てた候補区間から、パワー、ピーク値の絶対値等である候補区間比較尺度を直接計算してもよい。
−R(Recordable)/RW(ReWritable)等を、光磁気記録媒体として、MO(Magneto-Optical disc)等を、半導体メモリとしてEEP−ROM(Electronically Erasable and Programmable-Read Only Memory)等を用いることができる。
2 基準区間決定部
3 ピッチ計算部
4 パケット送信部
5 パケット通信網
6 パケット受信部
7 音声通信システム
10 分割部
11 サブフレーム比較尺度計算部
12 結合部
21 加重計算部
22 決定部
31 相関値計算部
32 相関最大区間決定部
33 差計算部
61 受信バッファ
62 音声復号部
63 パケットロス検出部
64 スイッチ
65 パケットロスコンシールメント部
66 出力音声バッファ
67 ピッチ探索部
68 音響波形補完処理部
100 ピッチ探索装置
221 加重計算部
331 変換部
Claims (12)
- 音響信号に同じ時間長の2つ以上の候補区間が割り当てられており、
各候補区間ごとに、その各候補区間の音響信号のパワー、その各候補区間の音響信号のピーク値の絶対値、又は、その各候補区間の音響信号の絶対値の和をその各候補区間の候補区間比較尺度として計算する候補区間比較尺度計算手段と、
上記計算された各候補区間ごとの候補区間比較尺度について、ピッチを探索しようとする部分から遠い候補区間の候補区間比較尺度ほど小さな重みを付ける加重手段と、
上記重みを付けられた候補区間比較尺度が最大である候補区間を選択して、その候補区間を基準区間とする決定手段と、
上記決定された基準区間に基づいて、上記音響信号のピッチを計算するピッチ計算手段と、
を備えるピッチ探索装置。 - 請求項1に記載のピッチ探索装置において、
上記各候補区間は時間的に連続した同じ数のサブフレームで構成されており、
上記候補区間比較尺度計算手段は、
各サブフレームごとに、その各サブフレームの音響信号のパワー、その各サブフレームの音響信号のピーク値の絶対値、又は、その各サブフレームの音響信号の絶対値の和をサブフレーム比較尺度として計算するサブフレーム比較尺度計算手段と、
各候補区間ごとに、その各候補区間を構成するサブフレームのサブフレーム比較尺度の和を計算して、その各候補区間の候補区間比較尺度とする結合手段と、
で構成されることを特徴とするピッチ探索装置。 - 請求項2に記載のピッチ探索装置において、
上記結合手段は、全候補区間に同じ時間区間が含まれる場合には、各候補区間を構成するサブフレームから上記同じ時間区間のサブフレームを除いたサブフレームのサブフレーム比較尺度の和を計算して、その各候補区間の候補区間比較尺度とする、
ものであることを特徴とするピッチ探索装置。 - 請求項1から3の何れかに記載のピッチ探索装置において、
上記ピッチ計算手段は、
上記決定手段により決定された基準区間の音響信号の最初のサンプル番号をN 1 、最後のサンプル番号をN 2 とし、上記音響信号の第nサンプル時刻におけるサンプル値をx(n)としたとき、上記基準区間の上記音響信号系列{x(N 1 ),・・・,x(N 2 )}と、上記基準区間とjサンプルずれた区間の上記音響信号系列{x(N 1 −j),・・・,x(N 2 −j)}と、の相互相関値をJ 11 ≦j≦J 12 の各jについて計算する相関値計算手段と、
上記計算された上記相互相関値のうちの最大値を与えるjをピッチの長さとし、上記ピッチの長さをピッチとするサンプル差計算手段と、
を含む、
ことを特徴とするピッチ探索装置。 - 音響信号に同じ時間長の2つ以上の候補区間が割り当てられており、
候補区間比較尺度計算手段が、各候補区間ごとに、その各候補区間の音響信号のパワー、その各候補区間の音響信号のピーク値の絶対値、又は、その各候補区間の音響信号の絶対値の和をその各候補区間の候補区間比較尺度として計算する候補区間比較尺度計算ステップ、
加重手段が、上記計算された各候補区間ごとの候補区間比較尺度について、ピッチを探索しようとする部分から遠い候補区間の候補区間比較尺度ほど小さな重みを付ける加重ステップと、
決定手段が、上記重みを付けられた候補区間比較尺度が最大である候補区間を選択して、その候補区間を基準区間とする決定ステップと、
ピッチ計算手段が、上記決定された基準区間に基づいて、上記音響信号のピッチを計算するピッチ計算ステップと、
を有するピッチ探索方法。 - 請求項5に記載のピッチ探索方法において、
上記各候補区間は時間的に連続した同じ数のサブフレームで構成されており、
上記候補区間比較尺度計算ステップは、
サブフレーム比較尺度計算手段が、各サブフレームごとに、その各サブフレームの音響信号のパワー、その各サブフレームの音響信号のピーク値の絶対値、又は、その各サブフレームの音響信号の絶対値の和をサブフレーム比較尺度として計算するサブフレーム比較尺度計算ステップと、
結合手段が、各候補区間ごとに、その各候補区間を構成するサブフレームのサブフレーム比較尺度の和を計算して、その各候補区間の候補区間比較尺度とする結合ステップと、
で構成されることを特徴とするピッチ探索方法。 - 請求項1から4の何れかに記載のピッチ探索装置の各手段としてコンピュータを機能させるためのピッチ探索プログラム。
- 請求項7に記載のピッチ探索プログラムを記録したコンピュータ読み取り可能な記録媒体。
- 請求項1から4の何れかに記載のピッチ探索装置を備え、
さらに、上記計算されたピッチの長さの音響信号をパケットが消失したフレームの直前のフレームから切り出して、そのパケットが消失したフレームの部分に繰り返し並べる音響波形補完処理手段を備える、
ことを特徴とするパケット消失補償装置。 - 請求項5又は6に記載のピッチ探索方法の各ステップを有し、
さらに、音響波形補完処理手段が、上記計算されたピッチの長さの音響信号をパケットが消失したフレームの直前のフレームから切り出して、そのパケットが消失したフレームの部分に繰り返し並べる音響波形補完処理ステップを有する、
ことを特徴とするパケット消失補償方法。 - 請求項9に記載のパケット消失補償装置の各手段としてコンピュータを機能させるためのパケット消失補償プログラム。
- 請求項11に記載のパケット消失補償プログラムを記録したコンピュータ読み取り可能な記録媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007166882A JP4928366B2 (ja) | 2007-06-25 | 2007-06-25 | ピッチ探索装置、パケット消失補償装置、それらの方法、プログラム及びその記録媒体 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007166882A JP4928366B2 (ja) | 2007-06-25 | 2007-06-25 | ピッチ探索装置、パケット消失補償装置、それらの方法、プログラム及びその記録媒体 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2009003387A JP2009003387A (ja) | 2009-01-08 |
JP4928366B2 true JP4928366B2 (ja) | 2012-05-09 |
Family
ID=40319785
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007166882A Active JP4928366B2 (ja) | 2007-06-25 | 2007-06-25 | ピッチ探索装置、パケット消失補償装置、それらの方法、プログラム及びその記録媒体 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4928366B2 (ja) |
Families Citing this family (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101666521B1 (ko) * | 2010-01-08 | 2016-10-14 | 삼성전자 주식회사 | 입력 신호의 피치 주기 검출 방법 및 그 장치 |
JP5637379B2 (ja) * | 2010-11-26 | 2014-12-10 | ソニー株式会社 | 復号装置、復号方法、およびプログラム |
AU2014283393A1 (en) * | 2013-06-21 | 2016-02-04 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for improved concealment of the adaptive codebook in ACELP-like concealment employing improved pitch lag estimation |
AU2014283389B2 (en) | 2013-06-21 | 2017-10-05 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for improved concealment of the adaptive codebook in ACELP-like concealment employing improved pulse resynchronization |
CN104240715B (zh) * | 2013-06-21 | 2017-08-25 | 华为技术有限公司 | 用于恢复丢失数据的方法和设备 |
EP3483880A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Temporal noise shaping |
EP3483882A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Controlling bandwidth in encoders and/or decoders |
EP3483878A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio decoder supporting a set of different loss concealment tools |
EP3483886A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Selecting pitch lag |
EP3483879A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Analysis/synthesis windowing function for modulated lapped transformation |
EP3483884A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Signal filtering |
EP3483883A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio coding and decoding with selective postfiltering |
WO2019091576A1 (en) | 2017-11-10 | 2019-05-16 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoders, audio decoders, methods and computer programs adapting an encoding and decoding of least significant bits |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0351900A (ja) * | 1989-07-20 | 1991-03-06 | Fujitsu Ltd | エラー処理方式 |
JP4134961B2 (ja) * | 1996-11-20 | 2008-08-20 | ヤマハ株式会社 | 音信号分析装置及び方法 |
JP3435310B2 (ja) * | 1997-06-12 | 2003-08-11 | 株式会社東芝 | 音声符号化方法および装置 |
-
2007
- 2007-06-25 JP JP2007166882A patent/JP4928366B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2009003387A (ja) | 2009-01-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4928366B2 (ja) | ピッチ探索装置、パケット消失補償装置、それらの方法、プログラム及びその記録媒体 | |
US6704702B2 (en) | Speech encoding method, apparatus and program | |
JP2776050B2 (ja) | 音声符号化方式 | |
RU2713605C1 (ru) | Устройство кодирования аудио, способ кодирования аудио, программа кодирования аудио, устройство декодирования аудио, способ декодирования аудио и программа декодирования аудио | |
JP6151411B2 (ja) | 音声符号化装置および方法、並びに、音声復号装置および方法 | |
JPH08263099A (ja) | 符号化装置 | |
KR20090083070A (ko) | 적응적 lpc 계수 보간을 이용한 오디오 신호의 부호화,복호화 방법 및 장치 | |
JP2007279444A (ja) | 特徴量補正装置、特徴量補正方法および特徴量補正プログラム | |
JPH04270398A (ja) | 音声符号化方式 | |
JP3478209B2 (ja) | 音声信号復号方法及び装置と音声信号符号化復号方法及び装置と記録媒体 | |
JP4658852B2 (ja) | 適応ブロック長符号化装置、その方法、プログラム及び記録媒体 | |
JP4108317B2 (ja) | 符号変換方法及び装置とプログラム並びに記憶媒体 | |
JPH08179795A (ja) | 音声のピッチラグ符号化方法および装置 | |
JP4658853B2 (ja) | 適応ブロック長符号化装置、その方法、プログラム及び記録媒体 | |
JP3435310B2 (ja) | 音声符号化方法および装置 | |
JP2800599B2 (ja) | 基本周期符号化装置 | |
JP4928367B2 (ja) | パケット受信装置及び方法 | |
JP4691079B2 (ja) | 音声信号区間推定装置、方法、プログラムおよびこれを記録した記録媒体 | |
JP4580622B2 (ja) | 広帯域音声符号化方法及び広帯域音声符号化装置 | |
EP4372739A1 (en) | Sound signal downmixing method, sound signal encoding method, sound signal downmixing device, sound signal encoding device, and program | |
JP2019039946A (ja) | モデル学習装置、音声区間検出装置、それらの方法およびプログラム | |
JPH0844398A (ja) | 音声符号化装置 | |
JP3315956B2 (ja) | 音声符号化装置及び音声符号化方法 | |
JP3068689B2 (ja) | 音声符号化方法 | |
JP5768450B2 (ja) | 騒音推定装置及び騒音推定プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20100520 |
|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20110810 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20110922 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20111025 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20111222 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120124 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120210 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150217 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4928366 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |