JP5233986B2 - 音声波形補間装置および方法 - Google Patents
音声波形補間装置および方法 Download PDFInfo
- Publication number
- JP5233986B2 JP5233986B2 JP2009503800A JP2009503800A JP5233986B2 JP 5233986 B2 JP5233986 B2 JP 5233986B2 JP 2009503800 A JP2009503800 A JP 2009503800A JP 2009503800 A JP2009503800 A JP 2009503800A JP 5233986 B2 JP5233986 B2 JP 5233986B2
- Authority
- JP
- Japan
- Prior art keywords
- audio data
- interpolated
- waveform
- amplitude
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims description 27
- 238000004891 communication Methods 0.000 claims description 12
- 238000012545 processing Methods 0.000 claims description 7
- 230000003252 repetitive effect Effects 0.000 claims 1
- 238000010586 diagram Methods 0.000 description 21
- 230000008878 coupling Effects 0.000 description 7
- 238000010168 coupling process Methods 0.000 description 7
- 238000005859 coupling reaction Methods 0.000 description 7
- 230000008859 change Effects 0.000 description 6
- 230000005540 biological transmission Effects 0.000 description 3
- 230000015572 biosynthetic process Effects 0.000 description 2
- 230000008034 disappearance Effects 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 238000003786 synthesis reaction Methods 0.000 description 2
- 230000002238 attenuated effect Effects 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 230000006866 deterioration Effects 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 230000001172 regenerating effect Effects 0.000 description 1
- 230000005236 sound signal Effects 0.000 description 1
- 230000007480 spreading Effects 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/097—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters using prototype waveform decomposition or prototype waveform interpolative [PWI] coders
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Signal Processing (AREA)
- Computational Linguistics (AREA)
- Acoustics & Sound (AREA)
- Telephonic Communication Services (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
- Telephone Function (AREA)
- Noise Elimination (AREA)
- Analogue/Digital Conversion (AREA)
- Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
- Electrophonic Musical Instruments (AREA)
Description
(i)音声データを記憶する音声格納部と、
(ii)前記音声データの一部を、該音声データの他の一部で補間した音声データを生成する補間波形生成部と、
(iii)前記音声格納部からの音声データと、その一部を代替する前記補間波形生成部からの補間音声データとを結合する波形結合部と、
(iv)前記音声データの一部が、前記補間波形生成部にて補間すべき補間音声データとして適切か否かを判定し、適切と判定された音声データを選択して、これを前記補間音声データとして設定する補間波形設定機能部と、
から構成する。このうち、本発明を最も特徴づけるのは、上記(iv)の補間波形設定機能部である。
2 音声格納部
3 補間波形生成部
4 波形結合部
5 補間波形設定機能部
6 振幅情報分析部
7 音声波形判定部
8 振幅値算出部
9 振幅情報格納部
11 有声/無声判定部
12 判定閾値判定部
13 振幅使用範囲設定部
14 話者識別部
15 判定閾値格納部
16 振幅使用範囲格納部
多数の音声素片を蓄積して保持する音声格納部2と、一連の音声データDinの一部を、その音声素片の繰り返し使用により補間した音声データDcを生成する補間波形生成部3と、音声格納部2に格納された音声データと、その一部を代替する補間波形生成部4からの補間音声データとを結合する波形結合部4と、音声データの一部が、補間波形生成部3にて補間すべき補間音声データとして適切か否かを判定し、適切と判定された音声データを選択して、これを補間音声データとして設定する補間波形設定機能部5と、から構成する。この音声波形補間装置を用いれば、例えば音声合成波形のラベリングにおける子音の音素境界の決定処理を行うときに、また音声合成時における音声素片の配置処理を行うときに、あるいは、話速変換処理を行う際、音声素片長が伸ばされる音声素片を決定するときに、該当の音素片が適切か否かを判定することができる。
逐次受信する各パケットのうち、正常に受信した各パケットが有する音声データを順次記憶する音声格納部2と、パケットの消失(破棄又は遅延)により音声データDinの一部に欠落を生じたとき、その欠落部を音声データDinの他の一部で補間した音声データDcを生成する補間波形生成部3と、音声格納部2に格納された音声データDinと、その一部を代替する補間波形生成部3からの補間音声データDcとを結合する波形結合部4と、音声データDinの一部が、補間波形生成部3にて補間すべき補間音声データDcとして適切か否かを判定し、適切と判定された音声データを選択して、これをその補間音声データとして設定する補間波形設定機能部5と、から構成する。
ステップS11:パケットを正常受信したか否か判定する。
ステップS12:上記の正常受信が行われると(YES)、その1パケットデータ(音声データ)を取り込み、
ステップS13:その入力音声データDinを音声格納部2に格納する。
ステップS15:その分別結果による判定を行う。
ステップS17:一方、上記の判定により無声であると判定されると、その無声音声の振幅の平均値(すなわち、有声音声の振幅の最小値)が算出されて、
ステップS18:これらの算出データが振幅情報格納部9に保持される。
ステップS20:上述したとおりの、補間波形生成部3による補間音声データDcの生成を行う。
ステップS22:出力音声データDoutを得る。ここで、上記のステップS19についてさらに詳しく説明する。
ステップS31:音声波形判定部7は、補間音声波形の候補としようとしている、振幅包絡EV(図3)上における位置での振幅変化率を調べる。この振幅変化率の小さいところには、補間波形としては不適切な箇所が含まれている。
ステップS34:その不等式が成立すると(YES)、さらに(振幅最大値−振幅値)<極小値判定閾値2の不等式が成立するか調べて、
ステップS35:この不等式が成立すると(YES)、最終的に当該音声データの補間波形としての使用は不可とされる(判定フラグ=OFF)。要するに、前述の図3を参照すると、例えば本図中の振幅範囲“TH”内に入ったときは、使用不可とする。
図11は音声波形補間装置の第4例を示す図である。
話者識別部14をさらに備え、上記の振幅判定閾値T1を、識別された話者ごとに設定するようにした音声波形補間装置(図11)を示し、また
振幅使用範囲設定部13をさらに備え、この振幅使用範囲設定部13は、音声波形判定部7において使用する振幅情報のうちのどの範囲を使用すべきかを設定するようにした音声波形補間装置(図10、図11)を示す。
・極小値判定閾値1=(有声音声区間)振幅最小値×1.2(図9のS33参照)
・極小値判定閾値2=(有声音声区間)振幅最大値×0.8(図9のS34参照)
(i)例えばパケットロス消失前の3秒間といった時間を指定し、
(ii)有声/無声判定部11の判定結果より、無声と無声とで挟まれた区間を振幅使用範囲に設定するが、無声は、背景雑音だけの区間だけでなく、摩擦音(例えば「サ行」の音の子音部分)や、破裂音(例えば「タ行」の音の子音部分)も含むものとし、
(iii)有声/無声判定部11の判定結果より、一呼気段落すなわち一息でしゃべる範囲を振幅使用範囲に設定する。
ステップS41:補間波形設定機能部5において、判定の対象となる入力音声信号(Din)を得る。
ステップS43:前方パケットであれば、その波形(図12のU区間参照)について判定する。
ステップS45:さらに1つ前方のパケット(図12のV区間)を判定の対象として、同様の操作を繰り返し、
ステップS46:ステップS44にて、補間区間での繰り返し使用として適切と判定されると(YES)、その適切とされた前方波形によりその補間区間での波形が生成される。また別の補間の仕方は次のとおりである。
ステップS49:さらに1つ後方のパケットを判定の対象として、同様の操作を繰り返し、
ステップS50:ステップS48にて、補間区間での繰り返し使用として適切と判定されると(YES)、その適切とされた後方波形によりその補間区間での波形が生成される。
Claims (6)
- 音声データを記憶する音声格納部と、
前記音声データの一部を、該音声データの他の一部で補間した音声データを生成する補間波形生成部と、
前記音声格納部からの音声データと、その一部を代替する前記補間波形生成部からの補間音声データとを結合する波形結合部と、
前記音声データの一部が、前記補間波形生成部にて補間すべき補間音声データとして適切か否かを判定し、適切と判定された音声データを選択して、これを前記補間音声データとして設定する補間波形設定機能部と、を有し、
前記補間波形設定機能部は、
前記音声格納部からの前記音声データについてその振幅情報を分析する振幅情報分析手段と、
その分析結果に基づいて前記補間音声データとして適切か否かを判定する音声波形判定部とを含み、
前記振幅情報分析手段は、前記音声データの振幅値を計算して時間方向の振幅値を得る振幅値算出部と、その算出した振幅値を振幅情報として一旦記憶する振幅情報格納部とを有し、
前記音声波形判定部は、前記時間方向の振幅情報から特定される振幅包絡上の位置から前記補間音声データとして適切か否かを判定するものであって、代替の候補としての前記補間音声データの前記振幅包絡上における位置が、少なくとも、振幅極小値をとる位置かあるいは無声音区間の直前位置であると判定したときに、当該部分の音声データを前記補間音声データとして採用せず、当該部分の音声データ以外の位置での別の音声データか、あるいは背景雑音区間を探索することを特徴とする音声波形補間装置。 - 前記音声格納部に記憶された前記音声データを有声部分と無声部分とに分類して判定する有声/無声判定部をさらに備え、判定された有声部分についてはその振幅最大値と振幅変動率を前記振幅値算出部にて算出してその結果を前記振幅情報格納部に保持し、判定された無声部分についてはその振幅平均値を前記振幅値算出部にて算出してその結果を前記振幅情報格納部に保持することを特徴とする請求項1に記載の音声波形補間装置。
- パケット通信システムに使用される音声波形補間装置であって、
逐次受信する各パケットのうち、正常に受信した各パケットが有する音声データを順次記憶する音声格納部と、
パケットの消失により前記音声データの一部に欠落を生じたとき、該欠落部を前記音声データの他の一部で補間した音声データを生成する補間波形生成部と、
前記音声格納部に格納された音声データと、その一部を代替する前記補間波形生成部からの補間音声データとを結合する波形結合部と、
前記音声データの一部が、前記補間波形生成部にて補間すべき補間音声データとして適切か否かを判定し、適切と判定された音声データを選択して、これを前記補間音声データとして設定する補間波形設定機能部と、を有し、
前記補間波形設定機能部は、
前記音声格納部からの前記音声データについてその振幅情報を分析する振幅情報分析手段と、
その分析結果に基づいて前記補間音声データとして適切か否かを判定する音声波形判定部とを含み、
前記振幅情報分析手段は、前記音声データの振幅値を計算して時間方向の振幅値を得る振幅値算出部と、その算出した振幅値を振幅情報として一旦記憶する振幅情報格納部とを有し、
前記音声波形判定部は、前記時間方向の振幅情報から特定される振幅包絡上の位置から前記補間音声データとして適切か否かを判定するものであって、代替の候補としての前記補間音声データの前記振幅包絡上における位置が、少なくとも、振幅極小値をとる位置かあるいは無声音区間の直前位置であると判定したときに、当該部分の音声データを前記補間音声データとして採用せず、当該部分の音声データ以外の位置での別の音声データか、あるいは背景雑音区間を探索することを特徴とする音声波形補間装置。 - 音声編集/加工処理システムに使用される音声波形補間装置であって、
一連の音声データを構成する多数の音声素片を蓄積して保持する音声格納部と、
前記一連の音声データの一部を、前記音声素片の繰り返し使用により補間した音声データを生成する補間波形生成部と、
前記音声格納部に格納された音声データと、その一部を代替する前記補間波形生成部からの補間音声データとを結合する波形結合部と、
前記音声データの一部が、前記補間波形生成部にて補間すべき補間音声データとして適切か否かを判定し、適切と判定された音声データを選択して、これを前記補間音声データとして設定する補間波形設定機能部と、を有し、
前記補間波形設定機能部は、
前記音声格納部からの前記音声データについてその振幅情報を分析する振幅情報分析手段と、
その分析結果に基づいて前記補間音声データとして適切か否かを判定する音声波形判定部とを含み、
前記振幅情報分析手段は、前記音声データの振幅値を計算して時間方向の振幅値を得る振幅値算出部と、その算出した振幅値を振幅情報として一旦記憶する振幅情報格納部とを有し、
前記音声波形判定部は、前記時間方向の振幅情報から特定される振幅包絡上の位置から前記補間音声データとして適切か否かを判定するものであって、代替の候補としての前記補間音声データの前記振幅包絡上における位置が、少なくとも、振幅極小値をとる位置かあるいは無声音区間の直前位置であると判定したときに、当該部分の音声データを前記補間音声データとして採用せず、当該部分の音声データ以外の位置での別の音声データか、あるいは背景雑音区間を探索することを特徴とする音声波形補間装置。 - 記憶した音声データの一部を、該音声データの他の一部で補間した音声データを生成する音声波形補間方法において、
前記音声データを記憶する第1ステップと、
前記音声データの一部が、前記の補間すべき補間音声データとして適切か否かを判定し、適切と判定された音声データを選択して、これを前記補間音声データとして設定する第2ステップと、
前記第1ステップで記憶した音声データと、前記第2ステップで設定された前記補間音声データとを結合する第3ステップと、を有し、
前記第2ステップは、
前記第1ステップで記憶された前記音声データについてその時間方向の振幅情報を分析する分析ステップと、
その分析結果に基づいて前記時間方向の振幅情報から特定される振幅包絡上の位置から前記補間音声データとして適切か否かを判定する音声波形判定ステップを含み、該音声波形判定ステップにおいて、代替の候補としての前記補間音声データの前記振幅包絡上における位置が、少なくとも、振幅極小値をとる位置かあるいは無声音区間の直前位置であると判定したときに、当該部分の音声データを前記補間音声データとして採用せず、当該部分の音声データ以外の位置での別の音声データか、あるいは背景雑音区間を探索することを特徴とする音声波形補間方法。 - コンピュータに、記憶した音声データの一部を、該音声データの他の一部で補間した音声データを生成させるようにした音声波形補間プログラムであって、
前記音声データを記憶する第1ステップと、
前記音声データの一部が、前記の補間すべき補間音声データとして適切か否かを判定し、適切と判定された音声データを選択して、これを前記補間音声データとして設定する第2ステップと、
前記第1ステップで記憶した音声データと、前記第2ステップで設定された前記補間音声データとを結合する第3ステップと、を実行させ、かつ
前記第2ステップは、
前記第1ステップで記憶された前記音声データについてその時間方向の振幅情報を分析する分析ステップと、
その分析結果に基づいて前記時間方向の振幅情報から特定される振幅包絡上の位置から前記補間音声データとして適切か否かを判定する音声波形判定ステップであって、代替の候補としての前記補間音声データの前記振幅包絡上における位置が、少なくとも、振幅極小値をとる位置かあるいは無声音区間の直前位置であると判定したときに、当該部分の音声データを前記補間音声データとして採用せず、当該部分の音声データ以外の位置での別の音声データか、あるいは背景雑音区間を探索するステップ
を実行させることを特徴とする音声波形補間プログラム。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2007/054849 WO2008111158A1 (ja) | 2007-03-12 | 2007-03-12 | 音声波形補間装置および方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2008111158A1 JPWO2008111158A1 (ja) | 2010-06-24 |
JP5233986B2 true JP5233986B2 (ja) | 2013-07-10 |
Family
ID=39759109
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009503800A Expired - Fee Related JP5233986B2 (ja) | 2007-03-12 | 2007-03-12 | 音声波形補間装置および方法 |
Country Status (4)
Country | Link |
---|---|
US (1) | US20090326950A1 (ja) |
JP (1) | JP5233986B2 (ja) |
CN (1) | CN101542593B (ja) |
WO (1) | WO2008111158A1 (ja) |
Families Citing this family (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2004109659A1 (ja) * | 2003-06-05 | 2004-12-16 | Kabushiki Kaisha Kenwood | 音声合成装置、音声合成方法及びプログラム |
JP2010245657A (ja) * | 2009-04-02 | 2010-10-28 | Sony Corp | 信号処理装置及び方法、並びにプログラム |
KR20120056661A (ko) * | 2010-11-25 | 2012-06-04 | 한국전자통신연구원 | 음성 신호 전처리 장치 및 방법 |
JP5694745B2 (ja) * | 2010-11-26 | 2015-04-01 | 株式会社Nttドコモ | 隠蔽信号生成装置、隠蔽信号生成方法および隠蔽信号生成プログラム |
JP6024191B2 (ja) * | 2011-05-30 | 2016-11-09 | ヤマハ株式会社 | 音声合成装置および音声合成方法 |
JP5671630B2 (ja) * | 2011-11-22 | 2015-02-18 | パイオニア株式会社 | 音声信号補正装置及び音声信号補正方法 |
US20150249693A1 (en) * | 2012-10-12 | 2015-09-03 | Ankush Gupta | Method and system for enabling communication between at least two communication devices using an animated character in real-time. |
KR20140067512A (ko) * | 2012-11-26 | 2014-06-05 | 삼성전자주식회사 | 신호 처리 장치 및 그 신호 처리 방법 |
JP6171711B2 (ja) * | 2013-08-09 | 2017-08-02 | ヤマハ株式会社 | 音声解析装置および音声解析方法 |
JP5981408B2 (ja) * | 2013-10-29 | 2016-08-31 | 株式会社Nttドコモ | 音声信号処理装置、音声信号処理方法、及び音声信号処理プログラム |
US11287310B2 (en) | 2019-04-23 | 2022-03-29 | Computational Systems, Inc. | Waveform gap filling |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002271397A (ja) * | 2001-03-13 | 2002-09-20 | Nec Corp | パケット損失復旧器、及び、パケット損失復旧方法 |
WO2004068098A1 (ja) * | 2003-01-30 | 2004-08-12 | Fujitsu Limited | 音声パケット消失隠蔽装置,音声パケット消失隠蔽方法,受信端末および音声通信システム |
JP2005027051A (ja) * | 2003-07-02 | 2005-01-27 | Alps Electric Co Ltd | リアルタイムデータの補正方法及びブルートゥースモジュール |
JP2005233993A (ja) * | 2004-02-17 | 2005-09-02 | Matsushita Electric Ind Co Ltd | 音声伝送システム |
JP2005274917A (ja) * | 2004-03-24 | 2005-10-06 | Mitsubishi Electric Corp | 音声復号装置 |
Family Cites Families (35)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4214125A (en) * | 1977-01-21 | 1980-07-22 | Forrest S. Mozer | Method and apparatus for speech synthesizing |
US4246617A (en) * | 1979-07-30 | 1981-01-20 | Massachusetts Institute Of Technology | Digital system for changing the rate of recorded speech |
JPS5650398A (en) * | 1979-10-01 | 1981-05-07 | Hitachi Ltd | Sound synthesizer |
US4771465A (en) * | 1986-09-11 | 1988-09-13 | American Telephone And Telegraph Company, At&T Bell Laboratories | Digital speech sinusoidal vocoder with transmission of only subset of harmonics |
JP2746033B2 (ja) * | 1992-12-24 | 1998-04-28 | 日本電気株式会社 | 音声復号化装置 |
JP2795151B2 (ja) * | 1993-12-28 | 1998-09-10 | 日本電気株式会社 | 簡易型携帯電話システムのシステム情報と音声の多重方式 |
US6330023B1 (en) * | 1994-03-18 | 2001-12-11 | American Telephone And Telegraph Corporation | Video signal processing systems and methods utilizing automated speech analysis |
US5864812A (en) * | 1994-12-06 | 1999-01-26 | Matsushita Electric Industrial Co., Ltd. | Speech synthesizing method and apparatus for combining natural speech segments and synthesized speech segments |
US6278974B1 (en) * | 1995-05-05 | 2001-08-21 | Winbond Electronics Corporation | High resolution speech synthesizer without interpolation circuit |
US5699485A (en) * | 1995-06-07 | 1997-12-16 | Lucent Technologies Inc. | Pitch delay modification during frame erasures |
JP4132109B2 (ja) * | 1995-10-26 | 2008-08-13 | ソニー株式会社 | 音声信号の再生方法及び装置、並びに音声復号化方法及び装置、並びに音声合成方法及び装置 |
US5729694A (en) * | 1996-02-06 | 1998-03-17 | The Regents Of The University Of California | Speech coding, reconstruction and recognition using acoustics and electromagnetic waves |
JP3157116B2 (ja) * | 1996-03-29 | 2001-04-16 | 三菱電機株式会社 | 音声符号化伝送システム |
US5907822A (en) * | 1997-04-04 | 1999-05-25 | Lincom Corporation | Loss tolerant speech decoder for telecommunications |
US6490562B1 (en) * | 1997-04-09 | 2002-12-03 | Matsushita Electric Industrial Co., Ltd. | Method and system for analyzing voices |
US6064955A (en) * | 1998-04-13 | 2000-05-16 | Motorola | Low complexity MBE synthesizer for very low bit rate voice messaging |
TW430778B (en) * | 1998-06-15 | 2001-04-21 | Yamaha Corp | Voice converter with extraction and modification of attribute data |
US6138092A (en) * | 1998-07-13 | 2000-10-24 | Lockheed Martin Corporation | CELP speech synthesizer with epoch-adaptive harmonic generator for pitch harmonics below voicing cutoff frequency |
US6188980B1 (en) * | 1998-08-24 | 2001-02-13 | Conexant Systems, Inc. | Synchronized encoder-decoder frame concealment using speech coding parameters including line spectral frequencies and filter coefficients |
AUPP829899A0 (en) * | 1999-01-27 | 1999-02-18 | Motorola Australia Pty Ltd | Method and apparatus for time-warping a digitised waveform to have an approximately fixed period |
US6725190B1 (en) * | 1999-11-02 | 2004-04-20 | International Business Machines Corporation | Method and system for speech reconstruction from speech recognition features, pitch and voicing with resampled basis functions providing reconstruction of the spectral envelope |
US7110947B2 (en) * | 1999-12-10 | 2006-09-19 | At&T Corp. | Frame erasure concealment technique for a bitstream-based feature extractor |
US6480827B1 (en) * | 2000-03-07 | 2002-11-12 | Motorola, Inc. | Method and apparatus for voice communication |
JP3838039B2 (ja) * | 2001-03-09 | 2006-10-25 | ヤマハ株式会社 | 音声合成装置 |
DE10124421C1 (de) * | 2001-05-18 | 2002-10-17 | Siemens Ag | Verfahren zur Schätzung eines Codecparameters |
JP4170217B2 (ja) * | 2001-08-31 | 2008-10-22 | 株式会社ケンウッド | ピッチ波形信号生成装置、ピッチ波形信号生成方法及びプログラム |
CA2359771A1 (en) * | 2001-10-22 | 2003-04-22 | Dspfactory Ltd. | Low-resource real-time audio synthesis system and method |
US7523032B2 (en) * | 2003-12-19 | 2009-04-21 | Nokia Corporation | Speech coding method, device, coding module, system and software program product for pre-processing the phase structure of a to be encoded speech signal to match the phase structure of the decoded signal |
JP4419748B2 (ja) * | 2004-08-12 | 2010-02-24 | 沖電気工業株式会社 | 消失補償装置、消失補償方法、および消失補償プログラム |
US7672835B2 (en) * | 2004-12-24 | 2010-03-02 | Casio Computer Co., Ltd. | Voice analysis/synthesis apparatus and program |
JP4516863B2 (ja) * | 2005-03-11 | 2010-08-04 | 株式会社ケンウッド | 音声合成装置、音声合成方法及びプログラム |
US7707034B2 (en) * | 2005-05-31 | 2010-04-27 | Microsoft Corporation | Audio codec post-filter |
KR100724736B1 (ko) * | 2006-01-26 | 2007-06-04 | 삼성전자주식회사 | 스펙트럴 자기상관치를 이용한 피치 검출 방법 및 피치검출 장치 |
JP4744338B2 (ja) * | 2006-03-31 | 2011-08-10 | 富士通株式会社 | 合成音声生成装置 |
JP5157852B2 (ja) * | 2008-11-28 | 2013-03-06 | 富士通株式会社 | 音声信号処理評価プログラム、音声信号処理評価装置 |
-
2007
- 2007-03-12 CN CN2007800433010A patent/CN101542593B/zh not_active Expired - Fee Related
- 2007-03-12 JP JP2009503800A patent/JP5233986B2/ja not_active Expired - Fee Related
- 2007-03-12 WO PCT/JP2007/054849 patent/WO2008111158A1/ja active Application Filing
-
2009
- 2009-08-31 US US12/585,005 patent/US20090326950A1/en not_active Abandoned
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002271397A (ja) * | 2001-03-13 | 2002-09-20 | Nec Corp | パケット損失復旧器、及び、パケット損失復旧方法 |
WO2004068098A1 (ja) * | 2003-01-30 | 2004-08-12 | Fujitsu Limited | 音声パケット消失隠蔽装置,音声パケット消失隠蔽方法,受信端末および音声通信システム |
JP2005027051A (ja) * | 2003-07-02 | 2005-01-27 | Alps Electric Co Ltd | リアルタイムデータの補正方法及びブルートゥースモジュール |
JP2005233993A (ja) * | 2004-02-17 | 2005-09-02 | Matsushita Electric Ind Co Ltd | 音声伝送システム |
JP2005274917A (ja) * | 2004-03-24 | 2005-10-06 | Mitsubishi Electric Corp | 音声復号装置 |
Also Published As
Publication number | Publication date |
---|---|
CN101542593A (zh) | 2009-09-23 |
JPWO2008111158A1 (ja) | 2010-06-24 |
US20090326950A1 (en) | 2009-12-31 |
CN101542593B (zh) | 2013-04-17 |
WO2008111158A1 (ja) | 2008-09-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5233986B2 (ja) | 音声波形補間装置および方法 | |
US7321851B2 (en) | Method and arrangement in a communication system | |
JP5299436B2 (ja) | 音声検出装置、音声検出プログラムおよびパラメータ調整方法 | |
US6389006B1 (en) | Systems and methods for encoding and decoding speech for lossy transmission networks | |
JP4658596B2 (ja) | 線形予測に基づく音声コーデックにおける効率的なフレーム消失の隠蔽のための方法、及び装置 | |
JP4320033B2 (ja) | 音声パケット送信方法、音声パケット送信装置、および音声パケット送信プログラムとそれを記録した記録媒体 | |
TW201113873A (en) | Reparation of corrupted audio signals | |
EP1426926B1 (en) | Apparatus and method for changing the playback rate of recorded speech | |
US20040184443A1 (en) | Low-complexity packet loss concealment method for voice-over-IP speech transmission | |
TWI354267B (en) | Apparatus and method for expanding/compressing aud | |
JP3331297B2 (ja) | 背景音/音声分類方法及び装置並びに音声符号化方法及び装置 | |
JP2001228896A (ja) | 欠落音声パケットの代替置換方式 | |
JP6071944B2 (ja) | 話者速度変換システムおよびその方法ならびに速度変換装置 | |
JP3159930B2 (ja) | 音声処理装置のピッチ抽出方法 | |
CN104934040B (zh) | 音频信号的时长调整方法和装置 | |
JP2007178686A (ja) | 音声変換装置 | |
JPH0229232B2 (ja) | ||
KR100594599B1 (ko) | 수신단 기반의 패킷 손실 복구 장치 및 그 방법 | |
Jelassi et al. | Voicing-aware parametric speech quality models over VoIP networks | |
JPWO2003042648A1 (ja) | 音声符号化装置、音声復号化装置、音声符号化方法および音声復号化方法 | |
Becvar et al. | Comparison of Common PLC Methods Used in VoIP Networks | |
JP3937688B2 (ja) | 話速変換方法および話速変換装置 | |
JPS62220996A (ja) | 音声認識方法及び装置 | |
Gokhale | Packet loss concealment in voice over internet | |
JP2015040931A (ja) | 信号処理装置、音声処理装置、信号処理方法および音声処理方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20111004 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20111205 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20120911 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20121211 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20121219 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130226 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130311 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20160405 Year of fee payment: 3 |
|
LAPS | Cancellation because of no payment of annual fees |