KR101009799B1 - 음성 신호 압축 장치, 음성 신호 압축 방법 및 프로그램 - Google Patents
음성 신호 압축 장치, 음성 신호 압축 방법 및 프로그램 Download PDFInfo
- Publication number
- KR101009799B1 KR101009799B1 KR1020057015569A KR20057015569A KR101009799B1 KR 101009799 B1 KR101009799 B1 KR 101009799B1 KR 1020057015569 A KR1020057015569 A KR 1020057015569A KR 20057015569 A KR20057015569 A KR 20057015569A KR 101009799 B1 KR101009799 B1 KR 101009799B1
- Authority
- KR
- South Korea
- Prior art keywords
- data
- signal
- compression
- pitch
- phoneme
- Prior art date
Links
- 238000007906 compression Methods 0.000 title claims abstract description 116
- 230000006835 compression Effects 0.000 title claims abstract description 116
- 238000000034 method Methods 0.000 title claims abstract description 31
- 230000005236 sound signal Effects 0.000 claims abstract description 21
- 230000003595 spectral effect Effects 0.000 claims description 42
- 238000013144 data compression Methods 0.000 claims description 22
- 238000005070 sampling Methods 0.000 claims description 20
- 238000001914 filtration Methods 0.000 claims description 7
- 230000008859 change Effects 0.000 claims description 3
- 230000002238 attenuated effect Effects 0.000 abstract 1
- 239000000284 extract Substances 0.000 abstract 1
- 239000011295 pitch Substances 0.000 description 125
- 238000013139 quantization Methods 0.000 description 27
- 238000004891 communication Methods 0.000 description 18
- 238000002372 labelling Methods 0.000 description 18
- 238000005311 autocorrelation function Methods 0.000 description 9
- 238000004364 calculation method Methods 0.000 description 9
- 230000002159 abnormal effect Effects 0.000 description 7
- 230000006870 function Effects 0.000 description 7
- 230000008569 process Effects 0.000 description 7
- 238000010586 diagram Methods 0.000 description 6
- 230000005856 abnormality Effects 0.000 description 4
- 238000001228 spectrum Methods 0.000 description 4
- 238000001514 detection method Methods 0.000 description 3
- 238000000605 extraction Methods 0.000 description 3
- 230000004044 response Effects 0.000 description 3
- 230000002123 temporal effect Effects 0.000 description 3
- 238000012952 Resampling Methods 0.000 description 2
- 230000015572 biosynthetic process Effects 0.000 description 2
- 238000002156 mixing Methods 0.000 description 2
- 238000005192 partition Methods 0.000 description 2
- 238000003786 synthesis reaction Methods 0.000 description 2
- 230000001131 transforming effect Effects 0.000 description 2
- 241000282412 Homo Species 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 230000008451 emotion Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000009131 signaling function Effects 0.000 description 1
- 238000000638 solvent extraction Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000001308 synthesis method Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/90—Pitch determination of speech signals
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Quality & Reliability (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
Description
Claims (9)
- 압축하는 대상인 음성의 파형을 나타내는 음성 신호를 취득하고, 개개의 음소에 대한 음성 신호 파형으로 분할하는 음소별 분할 수단과,분할된 상기 음성 신호를 필터링하여 피치 신호를 추출하는 필터와,상기 필터에 의해 추출된 피치 신호에 의거하여 상기 음성 신호를 구간으로 구획하고, 각 해당 구간에 관해 상기 구획된 음성 신호와 상기 피치 신호의 상관 관계에 의거하여 위상을 조정하는 위상 조정 수단과,상기 위상 조정 수단에 의해 위상이 조정된 각 구간에 관해, 해당 위상에 의거하여 샘플링 길이를 정하고, 해당 샘플링 길이에 따라 샘플링을 행함에 의해 샘플링 신호를 생성하는 샘플링 수단과,상기 위상 조정 수단에 의한 상기 조정의 결과와 상기 샘플링 길이의 값에 의거하여, 상기 샘플링 신호를 피치 파형 신호로 가공하는 음성 신호 가공 수단과,상기 피치 파형 신호에 의거하여, 각 상기 음소의 스펙트럼 분포의 시간 변화를 나타내는 서브밴드 데이터를 생성하는 서브밴드 데이터 생성 수단과,상기 서브밴드 데이터에, 해당 서브밴드 데이터가 나타내는 음소에 관해 정해진 소정의 조건에 따라 데이터 압축을 시행하는 음소별 압축 수단을 포함하며,상기 음소별 압축 수단은 상기 서브밴드 데이터로부터 소정의 스펙트럼 성분을 삭제하도록 상기 서브밴드 데이터를 변경하는 것에 의해 상기 서브밴드의 데이터 압축을 수행하는 것을 특징으로 하는 음성 신호 압축 장치.
- 제 1항에 있어서,상기 음소별 압축 수단은,각각의 음소를 나타내는 서브밴드 데이터에 시행하는 데이터 압축의 조건을 지정하는 테이블을 재기록 가능하게 기억하는 수단과,각각의 음소를 나타내는 서브밴드 데이터에, 상기 테이블이 지정하는 조건에 따라 데이터 압축을 시행하는 수단에 의해 구성되어 있는 것을 특징으로 하는 음성 신호 압축 장치.
- 제 1항 또는 제 2항에 있어서,상기 음소별 압축 수단은, 각각의 음소를 나타내는 서브밴드 데이터를, 해당 음소에 관해 정해진 조건을 충족시키는 압축률에 달하도록 비선형 양자화함에 의해, 이들의 데이터에 데이터 압축을 시행하는 것을 특징으로 하는 음성 신호 압축 장치.
- 제 1항 또는 제 2항에 있어서,서브밴드 데이터의 각각의 스펙트럼 성분에는 우선도가 정하여져 있고,상기 음소별 압축 수단은, 서브밴드 데이터의 각각의 스펙트럼 성분을, 우선도가 높은 것일 수록 고분해능으로 양자화함에 의해, 이들의 데이터에 데이터 압축을 시행하는 것을 특징으로 하는 음성 신호 압축 장치.
- 삭제
- 삭제
- 음성의 파형 또는 음성의 스펙트럼 분포의 시간 변화를 나타내는 신호를 취득하는 수단과,취득된 신호에 대해, 개개의 음소를 나타내는 부분마다, 해당 부분이 나타내는 음소에 관해 정해진 소정의 조건에 따라 데이터 압축을 수행하는 수단을 포함하고,상기 데이터 압축을 수행하는 수단은 서브밴드 데이터로부터 소정의 스펙트럼 성분을 삭제하도록 상기 서브밴드 데이터를 변경하는 것에 의해 상기 서브밴드의 데이터 압축을 수행하는 것을 특징으로 하는 음성 신호 압축 장치.
- 디지털 신호 처리기에 의해 음성 신호를 압축하는 방법에 있어서,제 1의 처리기 소자에 의해 음성의 스펙트럼 분포의 시간에 따른 변화 또는 음성 파형을 나타내는 신호를 생성하고 취득하는 단계와,상기 취득된 신호의 개개의 음소를 나타내는 각 부분에 대해, 상기 부분에 의해 나타내어지는 음소의 특징에 따라 특정되는 소정의 압축율로 제 2의 처리기 소자에 의해 데이터 압축을 수행하여, 상기 취득된 신호의 개개의 음소를 나타내는 상기 각 부분을, 상기 각 부분에서 소정의 스펙트럼 성분을 삭제하도록 변경하는 단계를 포함하는 것을 특징으로 하는 음성 신호 압축 방법.
- 삭제
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JPJP-P-2003-00090045 | 2003-03-28 | ||
JP2003090045A JP4256189B2 (ja) | 2003-03-28 | 2003-03-28 | 音声信号圧縮装置、音声信号圧縮方法及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20050107763A KR20050107763A (ko) | 2005-11-15 |
KR101009799B1 true KR101009799B1 (ko) | 2011-01-19 |
Family
ID=33127254
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020057015569A KR101009799B1 (ko) | 2003-03-28 | 2004-03-26 | 음성 신호 압축 장치, 음성 신호 압축 방법 및 프로그램 |
Country Status (7)
Country | Link |
---|---|
US (1) | US7653540B2 (ko) |
EP (1) | EP1610300B1 (ko) |
JP (1) | JP4256189B2 (ko) |
KR (1) | KR101009799B1 (ko) |
CN (1) | CN100570709C (ko) |
DE (2) | DE04723803T1 (ko) |
WO (1) | WO2004088634A1 (ko) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5032314B2 (ja) * | 2005-06-23 | 2012-09-26 | パナソニック株式会社 | オーディオ符号化装置、オーディオ復号化装置およびオーディオ符号化情報伝送装置 |
US20070011009A1 (en) * | 2005-07-08 | 2007-01-11 | Nokia Corporation | Supporting a concatenative text-to-speech synthesis |
JP4736699B2 (ja) * | 2005-10-13 | 2011-07-27 | 株式会社ケンウッド | 音声信号圧縮装置、音声信号復元装置、音声信号圧縮方法、音声信号復元方法及びプログラム |
US8694318B2 (en) * | 2006-09-19 | 2014-04-08 | At&T Intellectual Property I, L. P. | Methods, systems, and products for indexing content |
EP3389043A4 (en) * | 2015-12-07 | 2019-05-15 | Yamaha Corporation | VOICE INTERACTION DEVICE AND VOICE INTERACTION METHOD |
CN109817196B (zh) * | 2019-01-11 | 2021-06-08 | 安克创新科技股份有限公司 | 一种噪音消除方法、装置、系统、设备及存储介质 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2003019530A1 (fr) * | 2001-08-31 | 2003-03-06 | Kenwood Corporation | Dispositif et procede de generation d'un signal a forme d'onde affecte d'un pas ; programme |
Family Cites Families (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US3946167A (en) * | 1973-11-20 | 1976-03-23 | Ted Bildplatten Aktiengesellschaft Aeg-Telefunken-Teldec | High density recording playback element construction |
GR58359B (en) * | 1977-08-09 | 1977-10-03 | Of Scient And Applied Res Ltd | Voice codification system |
JPS5667899A (en) | 1979-11-09 | 1981-06-08 | Canon Kk | Voice storage system |
US4661915A (en) * | 1981-08-03 | 1987-04-28 | Texas Instruments Incorporated | Allophone vocoder |
JPH01244499A (ja) * | 1988-03-25 | 1989-09-28 | Toshiba Corp | 音声素片ファイル作成装置 |
JPH03136100A (ja) * | 1989-10-20 | 1991-06-10 | Canon Inc | 音声処理方法及び装置 |
JP2931059B2 (ja) | 1989-12-22 | 1999-08-09 | 沖電気工業株式会社 | 音声合成方式およびこれに用いる装置 |
KR940002854B1 (ko) * | 1991-11-06 | 1994-04-04 | 한국전기통신공사 | 음성 합성시스팀의 음성단편 코딩 및 그의 피치조절 방법과 그의 유성음 합성장치 |
JP3233500B2 (ja) * | 1993-07-21 | 2001-11-26 | 富士重工業株式会社 | 自動車エンジンの燃料ポンプ制御装置 |
BE1010336A3 (fr) * | 1996-06-10 | 1998-06-02 | Faculte Polytechnique De Mons | Procede de synthese de son. |
FR2815457B1 (fr) * | 2000-10-18 | 2003-02-14 | Thomson Csf | Procede de codage de la prosodie pour un codeur de parole a tres bas debit |
JP2002244688A (ja) * | 2001-02-15 | 2002-08-30 | Sony Computer Entertainment Inc | 情報処理方法及び装置、情報伝送システム、情報処理プログラムを情報処理装置に実行させる媒体、情報処理プログラム |
JP2002251196A (ja) | 2001-02-26 | 2002-09-06 | Kenwood Corp | 音素データ処理装置、音素データ処理方法及びプログラム |
US7089184B2 (en) * | 2001-03-22 | 2006-08-08 | Nurv Center Technologies, Inc. | Speech recognition for recognizing speaker-independent, continuous speech |
JP4867076B2 (ja) | 2001-03-28 | 2012-02-01 | 日本電気株式会社 | 音声合成用圧縮素片作成装置、音声規則合成装置及びそれらに用いる方法 |
CA2359771A1 (en) * | 2001-10-22 | 2003-04-22 | Dspfactory Ltd. | Low-resource real-time audio synthesis system and method |
-
2003
- 2003-03-28 JP JP2003090045A patent/JP4256189B2/ja not_active Expired - Lifetime
-
2004
- 2004-03-26 US US10/545,427 patent/US7653540B2/en active Active
- 2004-03-26 EP EP04723803A patent/EP1610300B1/en not_active Expired - Lifetime
- 2004-03-26 KR KR1020057015569A patent/KR101009799B1/ko active IP Right Grant
- 2004-03-26 DE DE04723803T patent/DE04723803T1/de active Pending
- 2004-03-26 WO PCT/JP2004/004304 patent/WO2004088634A1/ja active IP Right Grant
- 2004-03-26 CN CNB2004800086632A patent/CN100570709C/zh not_active Expired - Lifetime
- 2004-03-26 DE DE602004015753T patent/DE602004015753D1/de not_active Expired - Lifetime
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2003019530A1 (fr) * | 2001-08-31 | 2003-03-06 | Kenwood Corporation | Dispositif et procede de generation d'un signal a forme d'onde affecte d'un pas ; programme |
Also Published As
Publication number | Publication date |
---|---|
EP1610300A1 (en) | 2005-12-28 |
EP1610300A4 (en) | 2007-02-21 |
KR20050107763A (ko) | 2005-11-15 |
DE602004015753D1 (de) | 2008-09-25 |
DE04723803T1 (de) | 2006-07-13 |
WO2004088634A1 (ja) | 2004-10-14 |
JP4256189B2 (ja) | 2009-04-22 |
US7653540B2 (en) | 2010-01-26 |
CN1768375A (zh) | 2006-05-03 |
JP2004294969A (ja) | 2004-10-21 |
EP1610300B1 (en) | 2008-08-13 |
CN100570709C (zh) | 2009-12-16 |
US20060167690A1 (en) | 2006-07-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7647226B2 (en) | Apparatus and method for creating pitch wave signals, apparatus and method for compressing, expanding, and synthesizing speech signals using these pitch wave signals and text-to-speech conversion using unit pitch wave signals | |
US7957958B2 (en) | Pitch period equalizing apparatus and pitch period equalizing method, and speech coding apparatus, speech decoding apparatus, and speech coding method | |
RU2144261C1 (ru) | Передающая система на принципах различного кодирования | |
JP4444296B2 (ja) | オーディオ符号化 | |
KR101393298B1 (ko) | 적응적 부호화/복호화 방법 및 장치 | |
JP4170217B2 (ja) | ピッチ波形信号生成装置、ピッチ波形信号生成方法及びプログラム | |
KR101009799B1 (ko) | 음성 신호 압축 장치, 음성 신호 압축 방법 및 프로그램 | |
EP1512952B1 (en) | Speech signal interpolation device, speech signal interpolation method, and program | |
Robinson | Speech analysis | |
JP4736699B2 (ja) | 音声信号圧縮装置、音声信号復元装置、音声信号圧縮方法、音声信号復元方法及びプログラム | |
JP4407305B2 (ja) | ピッチ波形信号分割装置、音声信号圧縮装置、音声合成装置、ピッチ波形信号分割方法、音声信号圧縮方法、音声合成方法、記録媒体及びプログラム | |
JP2000132193A (ja) | 信号符号化装置及び方法、並びに信号復号装置及び方法 | |
JP3994332B2 (ja) | 音声信号圧縮装置、音声信号圧縮方法、及び、プログラム | |
JP2003216172A (ja) | 音声信号加工装置、音声信号加工方法及びプログラム | |
JP2796408B2 (ja) | 音声情報圧縮装置 | |
JP2003108172A (ja) | 音声信号加工装置、音声信号加工方法及びプログラム | |
JP3994333B2 (ja) | 音声辞書作成装置、音声辞書作成方法、及び、プログラム | |
JP2535809B2 (ja) | 線形予測型音声分析合成装置 | |
JP2003216171A (ja) | 音声信号加工装置、信号復元装置、音声信号加工方法、信号復元方法及びプログラム | |
EP0138954A1 (en) | LANGUAGE PATTERN PROCESSING USING LANGUAGE PATTERN RESTRICTION. |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
FPAY | Annual fee payment | ||
GRNT | Written decision to grant | ||
FPAY | Annual fee payment |
Payment date: 20150209 Year of fee payment: 5 |
|
FPAY | Annual fee payment |
Payment date: 20151217 Year of fee payment: 6 |
|
FPAY | Annual fee payment |
Payment date: 20161220 Year of fee payment: 7 |
|
FPAY | Annual fee payment |
Payment date: 20171219 Year of fee payment: 8 |
|
FPAY | Annual fee payment |
Payment date: 20181226 Year of fee payment: 9 |
|
FPAY | Annual fee payment |
Payment date: 20191217 Year of fee payment: 10 |