KR20050107763A - 음성 신호 압축 장치, 음성 신호 압축 방법 및 프로그램 - Google Patents
음성 신호 압축 장치, 음성 신호 압축 방법 및 프로그램 Download PDFInfo
- Publication number
- KR20050107763A KR20050107763A KR1020057015569A KR20057015569A KR20050107763A KR 20050107763 A KR20050107763 A KR 20050107763A KR 1020057015569 A KR1020057015569 A KR 1020057015569A KR 20057015569 A KR20057015569 A KR 20057015569A KR 20050107763 A KR20050107763 A KR 20050107763A
- Authority
- KR
- South Korea
- Prior art keywords
- data
- signal
- compression
- phoneme
- pitch
- Prior art date
Links
- 238000007906 compression Methods 0.000 title claims description 115
- 230000006835 compression Effects 0.000 title claims description 115
- 238000000034 method Methods 0.000 title claims description 32
- 230000003595 spectral effect Effects 0.000 claims description 43
- 230000005236 sound signal Effects 0.000 claims description 23
- 238000005070 sampling Methods 0.000 claims description 20
- 238000013144 data compression Methods 0.000 claims description 19
- 238000001914 filtration Methods 0.000 claims description 7
- 238000001514 detection method Methods 0.000 abstract description 4
- 230000002238 attenuated effect Effects 0.000 abstract 1
- 239000000284 extract Substances 0.000 abstract 1
- 239000011295 pitch Substances 0.000 description 125
- 238000013139 quantization Methods 0.000 description 27
- 238000004891 communication Methods 0.000 description 18
- 238000002372 labelling Methods 0.000 description 18
- 238000005311 autocorrelation function Methods 0.000 description 9
- 238000004364 calculation method Methods 0.000 description 9
- 230000008569 process Effects 0.000 description 8
- 230000002159 abnormal effect Effects 0.000 description 7
- 230000006870 function Effects 0.000 description 7
- 238000010586 diagram Methods 0.000 description 6
- 230000005856 abnormality Effects 0.000 description 4
- 238000001228 spectrum Methods 0.000 description 4
- 238000000605 extraction Methods 0.000 description 3
- 230000004044 response Effects 0.000 description 3
- 230000002123 temporal effect Effects 0.000 description 3
- 238000012952 Resampling Methods 0.000 description 2
- 230000015572 biosynthetic process Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000002156 mixing Methods 0.000 description 2
- 238000005192 partition Methods 0.000 description 2
- 238000003786 synthesis reaction Methods 0.000 description 2
- 230000001131 transforming effect Effects 0.000 description 2
- 241000282412 Homo Species 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 230000008451 emotion Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000009131 signaling function Effects 0.000 description 1
- 238000000638 solvent extraction Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000001308 synthesis method Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/90—Pitch determination of speech signals
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Quality & Reliability (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
Description
Claims (9)
- 압축하는 대상인 음성의 파형을 나타내는 음성 신호를 취득하고,개개의 음소의 파형을 나타내는 부분으로 분할하는 음소별 분할 수단과,분할된 상기 음성 신호를 필터링하여 피치 신호를 추출하는 필터와,상기 필터에 의해 추출된 피치 신호에 의거하여 상기 음성 신호를 구간으로 구획하고, 각 해당 구간에 관해 해당 피치 신호와의 상관 관계에 의거하여 위상을 조정하는 위상 조정 수단과,상기 위상 조정 수단에 의해 위상이 조정된 각 구간에 관해, 해당 위상에 의거하여 샘플링 길이를 정하고, 해당 샘플링 길이에 따라 샘플링을 행함에 의해 샘플링 신호를 생성하는 샘플링 수단과,상기 위상 조정 수단에 의한 상기 조정의 결과와 상기 샘플링 길이의 값에 의거하여, 상기 샘플링 신호를 피치 파형 신호로 가공하는 음성 신호 가공 수단과,상기 피치 파형 신호에 의거하여, 각 상기 음소의 스펙트럼 분포의 시간 변화를 나타내는 서브밴드 데이터를 생성하는 서브밴드 데이터 생성 수단과,상기 서브밴드 데이터에, 해당 서브밴드 데이터가 나타내는 음소에 관해 정해진 소정의 조건에 따라 데이터 압축을 시행하는 음소별 압축 수단을 구비하는 것을 특징으로 하는 음성 신호 압축 장치.
- 제 1항에 있어서,상기 음소별 압축 수단은,각각의 음소를 나타내는 서브밴드 데이터에 시행하는 데이터 압축의 조건을 지정하는 테이블을 재기록 가능하게 기억하는 수단과,각각의 음소를 나타내는 서브밴드 데이터에, 상기 테이블이 지정하는 조건에 따라 데이터 압축을 시행하는 수단에 의해 구성되어 있는 것을 특징으로 하는 음성 신호 압축 장치.
- 제 1항 또는 제 2항에 있어서,상기 음소별 압축 수단은, 각각의 음소를 나타내는 서브밴드 데이터를, 해당 음소에 관해 정해진 조건을 충족시키는 압축률에 달하도록 비선형 양자화함에 의해, 이들의 데이터에 데이터 압축을 시행하는 것을 특징으로 하는 음성 신호 압축 장치.
- 제 1항 내지 제 3항중 어느 한 항에 있어서,서브밴드 데이터의 각각의 스펙트럼 성분에는 우선도가 정하여져 있고,상기 음소별 압축 수단은, 서브밴드 데이터의 각각의 스펙트럼 성분을, 우선도가 높은 것일 수록 고분해능으로 양자화함에 의해, 이들의 데이터에 데이터 압축을 시행하는 것을 특징으로 하는 음성 신호 압축 장치.
- 제 1항 내지 제 4항중 어느 한 항에 있어서,상기 음소별 압축 수단은, 서브밴드 데이터를 소정의 스펙트럼 성분이 삭제된 후의 스펙트럼 분포를 나타내도록 변경함에 의해, 이들의 데이터에 데이터 압축을 시행하는 것을 특징으로 하는 음성 신호 압축 장치.
- 음성의 파형을 나타내는 음성 신호를 취득하고, 해당 음성 신호를 해당 음성의 단위 피치분의 복수의 구간으로 구획한 경우에 있어서의 이들의 구간의 위상을 실질적으로 동일하게 정돈함에 의해, 해당 음성 신호를 피치 파형 신호로 가공하는 음성 신호 가공 수단과,상기 피치 파형 신호에 의거하여, 각 상기 음소의 스펙트럼 분포의 시간 변화를 나타내는 서브밴드 데이터를 생성하는 서브밴드 데이터 생성 수단과,상기 서브밴드 데이터의 개개의 음소를 나타내는 부분에, 해당 부분이 나타내는 음소에 관해 정해진 소정의 조건에 따라 데이터 압축을 시행하는 음소별 압축 수단을 구비하는 것을 특징으로 하는 음성 신호 압축 장치.
- 음성의 파형 또는 음성의 스펙트럼 분포의 시간 변화를 나타내는 신호를 취득하는 수단과,취득된 신호에 대해, 개개의 음소를 나타내는 부분마다, 해당 부분이 나타내는 음소에 관해 정해진 소정의 조건에 따라 데이터 압축을 시행하는 수단을 구비하는 것을 특징으로 하는 음성 신호 압축 장치.
- 음성의 파형 또는 음성의 스펙트럼 분포의 시간 변화를 나타내는 신호를 취득하고,취득된 신호에 대해, 개개의 음소를 나타내는 부분마다, 해당 부분이 나타내는 음소에 관해 정해진 소정의 조건에 따라 데이터 압축을 시행하는 것을 특징으로 하는 음성 신호 압축 방법.
- 컴퓨터를,음성의 파형 또는 음성의 스펙트럼 분포의 시간 변화를 나타내는 신호를 취득하는 수단과,취득된 신호에 대해, 개개의 음소를 나타내는 부분마다, 해당 부분이 나타내는 음소에 관해 정해진 소정의 조건에 따라 데이터 압축을 시행하는 수단으로서 기능시키기 위한 프로그램.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003090045A JP4256189B2 (ja) | 2003-03-28 | 2003-03-28 | 音声信号圧縮装置、音声信号圧縮方法及びプログラム |
JPJP-P-2003-00090045 | 2003-03-28 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20050107763A true KR20050107763A (ko) | 2005-11-15 |
KR101009799B1 KR101009799B1 (ko) | 2011-01-19 |
Family
ID=33127254
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020057015569A KR101009799B1 (ko) | 2003-03-28 | 2004-03-26 | 음성 신호 압축 장치, 음성 신호 압축 방법 및 프로그램 |
Country Status (7)
Country | Link |
---|---|
US (1) | US7653540B2 (ko) |
EP (1) | EP1610300B1 (ko) |
JP (1) | JP4256189B2 (ko) |
KR (1) | KR101009799B1 (ko) |
CN (1) | CN100570709C (ko) |
DE (2) | DE04723803T1 (ko) |
WO (1) | WO2004088634A1 (ko) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5032314B2 (ja) * | 2005-06-23 | 2012-09-26 | パナソニック株式会社 | オーディオ符号化装置、オーディオ復号化装置およびオーディオ符号化情報伝送装置 |
US20070011009A1 (en) * | 2005-07-08 | 2007-01-11 | Nokia Corporation | Supporting a concatenative text-to-speech synthesis |
JP4736699B2 (ja) * | 2005-10-13 | 2011-07-27 | 株式会社ケンウッド | 音声信号圧縮装置、音声信号復元装置、音声信号圧縮方法、音声信号復元方法及びプログラム |
US8694318B2 (en) * | 2006-09-19 | 2014-04-08 | At&T Intellectual Property I, L. P. | Methods, systems, and products for indexing content |
CN108369804A (zh) * | 2015-12-07 | 2018-08-03 | 雅马哈株式会社 | 语音交互设备和语音交互方法 |
CN109817196B (zh) * | 2019-01-11 | 2021-06-08 | 安克创新科技股份有限公司 | 一种噪音消除方法、装置、系统、设备及存储介质 |
Family Cites Families (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US3946167A (en) * | 1973-11-20 | 1976-03-23 | Ted Bildplatten Aktiengesellschaft Aeg-Telefunken-Teldec | High density recording playback element construction |
GR58359B (en) | 1977-08-09 | 1977-10-03 | Of Scient And Applied Res Ltd | Voice codification system |
JPS5667899A (en) | 1979-11-09 | 1981-06-08 | Canon Kk | Voice storage system |
US4661915A (en) * | 1981-08-03 | 1987-04-28 | Texas Instruments Incorporated | Allophone vocoder |
JPH01244499A (ja) | 1988-03-25 | 1989-09-28 | Toshiba Corp | 音声素片ファイル作成装置 |
JPH03136100A (ja) * | 1989-10-20 | 1991-06-10 | Canon Inc | 音声処理方法及び装置 |
JP2931059B2 (ja) | 1989-12-22 | 1999-08-09 | 沖電気工業株式会社 | 音声合成方式およびこれに用いる装置 |
KR940002854B1 (ko) * | 1991-11-06 | 1994-04-04 | 한국전기통신공사 | 음성 합성시스팀의 음성단편 코딩 및 그의 피치조절 방법과 그의 유성음 합성장치 |
JP3233500B2 (ja) * | 1993-07-21 | 2001-11-26 | 富士重工業株式会社 | 自動車エンジンの燃料ポンプ制御装置 |
BE1010336A3 (fr) * | 1996-06-10 | 1998-06-02 | Faculte Polytechnique De Mons | Procede de synthese de son. |
FR2815457B1 (fr) * | 2000-10-18 | 2003-02-14 | Thomson Csf | Procede de codage de la prosodie pour un codeur de parole a tres bas debit |
JP2002244688A (ja) * | 2001-02-15 | 2002-08-30 | Sony Computer Entertainment Inc | 情報処理方法及び装置、情報伝送システム、情報処理プログラムを情報処理装置に実行させる媒体、情報処理プログラム |
JP2002251196A (ja) | 2001-02-26 | 2002-09-06 | Kenwood Corp | 音素データ処理装置、音素データ処理方法及びプログラム |
US7089184B2 (en) * | 2001-03-22 | 2006-08-08 | Nurv Center Technologies, Inc. | Speech recognition for recognizing speaker-independent, continuous speech |
JP4867076B2 (ja) | 2001-03-28 | 2012-02-01 | 日本電気株式会社 | 音声合成用圧縮素片作成装置、音声規則合成装置及びそれらに用いる方法 |
US20040220801A1 (en) * | 2001-08-31 | 2004-11-04 | Yasushi Sato | Pitch waveform signal generating apparatus, pitch waveform signal generation method and program |
CA2359771A1 (en) * | 2001-10-22 | 2003-04-22 | Dspfactory Ltd. | Low-resource real-time audio synthesis system and method |
-
2003
- 2003-03-28 JP JP2003090045A patent/JP4256189B2/ja not_active Expired - Lifetime
-
2004
- 2004-03-26 DE DE04723803T patent/DE04723803T1/de active Pending
- 2004-03-26 WO PCT/JP2004/004304 patent/WO2004088634A1/ja active IP Right Grant
- 2004-03-26 DE DE602004015753T patent/DE602004015753D1/de not_active Expired - Lifetime
- 2004-03-26 KR KR1020057015569A patent/KR101009799B1/ko active IP Right Grant
- 2004-03-26 US US10/545,427 patent/US7653540B2/en active Active
- 2004-03-26 EP EP04723803A patent/EP1610300B1/en not_active Expired - Lifetime
- 2004-03-26 CN CNB2004800086632A patent/CN100570709C/zh not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
DE04723803T1 (de) | 2006-07-13 |
CN100570709C (zh) | 2009-12-16 |
DE602004015753D1 (de) | 2008-09-25 |
EP1610300A4 (en) | 2007-02-21 |
KR101009799B1 (ko) | 2011-01-19 |
WO2004088634A1 (ja) | 2004-10-14 |
JP2004294969A (ja) | 2004-10-21 |
CN1768375A (zh) | 2006-05-03 |
US20060167690A1 (en) | 2006-07-27 |
US7653540B2 (en) | 2010-01-26 |
JP4256189B2 (ja) | 2009-04-22 |
EP1610300A1 (en) | 2005-12-28 |
EP1610300B1 (en) | 2008-08-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7647226B2 (en) | Apparatus and method for creating pitch wave signals, apparatus and method for compressing, expanding, and synthesizing speech signals using these pitch wave signals and text-to-speech conversion using unit pitch wave signals | |
US7957958B2 (en) | Pitch period equalizing apparatus and pitch period equalizing method, and speech coding apparatus, speech decoding apparatus, and speech coding method | |
RU2144261C1 (ru) | Передающая система на принципах различного кодирования | |
JP4444296B2 (ja) | オーディオ符号化 | |
JP4170217B2 (ja) | ピッチ波形信号生成装置、ピッチ波形信号生成方法及びプログラム | |
KR101009799B1 (ko) | 음성 신호 압축 장치, 음성 신호 압축 방법 및 프로그램 | |
EP1512952B1 (en) | Speech signal interpolation device, speech signal interpolation method, and program | |
Robinson | Speech analysis | |
JP4736699B2 (ja) | 音声信号圧縮装置、音声信号復元装置、音声信号圧縮方法、音声信号復元方法及びプログラム | |
JP4407305B2 (ja) | ピッチ波形信号分割装置、音声信号圧縮装置、音声合成装置、ピッチ波形信号分割方法、音声信号圧縮方法、音声合成方法、記録媒体及びプログラム | |
JP2000132193A (ja) | 信号符号化装置及び方法、並びに信号復号装置及び方法 | |
JP2003216172A (ja) | 音声信号加工装置、音声信号加工方法及びプログラム | |
JP3994332B2 (ja) | 音声信号圧縮装置、音声信号圧縮方法、及び、プログラム | |
JP2796408B2 (ja) | 音声情報圧縮装置 | |
JP2003108172A (ja) | 音声信号加工装置、音声信号加工方法及びプログラム | |
AU617993B2 (en) | Multi-pulse type coding system | |
JP3994333B2 (ja) | 音声辞書作成装置、音声辞書作成方法、及び、プログラム | |
JP2535809B2 (ja) | 線形予測型音声分析合成装置 | |
US5899974A (en) | Compressing speech into a digital format | |
JP2003216171A (ja) | 音声信号加工装置、信号復元装置、音声信号加工方法、信号復元方法及びプログラム | |
JP2001337699A (ja) | 符号化装置および符号化方法並びに復号化装置および復号化方法 | |
EP0138954A1 (en) | LANGUAGE PATTERN PROCESSING USING LANGUAGE PATTERN RESTRICTION. |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
FPAY | Annual fee payment | ||
GRNT | Written decision to grant | ||
FPAY | Annual fee payment |
Payment date: 20150209 Year of fee payment: 5 |
|
FPAY | Annual fee payment |
Payment date: 20151217 Year of fee payment: 6 |
|
FPAY | Annual fee payment |
Payment date: 20161220 Year of fee payment: 7 |
|
FPAY | Annual fee payment |
Payment date: 20171219 Year of fee payment: 8 |
|
FPAY | Annual fee payment |
Payment date: 20181226 Year of fee payment: 9 |
|
FPAY | Annual fee payment |
Payment date: 20191217 Year of fee payment: 10 |