KR20070099372A - 음성 신호의 하모닉 정보 및 스펙트럼 포락선 정보,유성음화 비율 추정 방법 및 장치 - Google Patents
음성 신호의 하모닉 정보 및 스펙트럼 포락선 정보,유성음화 비율 추정 방법 및 장치 Download PDFInfo
- Publication number
- KR20070099372A KR20070099372A KR1020060030748A KR20060030748A KR20070099372A KR 20070099372 A KR20070099372 A KR 20070099372A KR 1020060030748 A KR1020060030748 A KR 1020060030748A KR 20060030748 A KR20060030748 A KR 20060030748A KR 20070099372 A KR20070099372 A KR 20070099372A
- Authority
- KR
- South Korea
- Prior art keywords
- harmonic
- peak
- information
- peaks
- spectral envelope
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 45
- 238000001228 spectrum Methods 0.000 title abstract description 49
- 230000005236 sound signal Effects 0.000 title description 12
- 230000003595 spectral effect Effects 0.000 claims description 151
- 239000013256 coordination polymer Substances 0.000 claims description 60
- 238000001514 detection method Methods 0.000 claims description 28
- 238000012545 processing Methods 0.000 claims description 19
- 230000015572 biosynthetic process Effects 0.000 claims description 9
- 238000003786 synthesis reaction Methods 0.000 claims description 9
- 239000011295 pitch Substances 0.000 description 32
- 238000004458 analytical method Methods 0.000 description 12
- 238000010586 diagram Methods 0.000 description 12
- 238000000605 extraction Methods 0.000 description 10
- 239000000284 extract Substances 0.000 description 8
- 238000012790 confirmation Methods 0.000 description 3
- 238000005070 sampling Methods 0.000 description 2
- 206010002953 Aphonia Diseases 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
- 230000001755 vocal effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/093—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters using sinusoidal excitation models
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B44—DECORATIVE ARTS
- B44C—PRODUCING DECORATIVE EFFECTS; MOSAICS; TARSIA WORK; PAPERHANGING
- B44C5/00—Processes for producing special ornamental bodies
- B44C5/005—Processes for producing special ornamental bodies comprising inserts
-
- A—HUMAN NECESSITIES
- A21—BAKING; EDIBLE DOUGHS
- A21D—TREATMENT, e.g. PRESERVATION, OF FLOUR OR DOUGH, e.g. BY ADDITION OF MATERIALS; BAKING; BAKERY PRODUCTS; PRESERVATION THEREOF
- A21D13/00—Finished or partly finished bakery products
- A21D13/80—Pastry not otherwise provided for elsewhere, e.g. cakes, biscuits or cookies
-
- A—HUMAN NECESSITIES
- A23—FOODS OR FOODSTUFFS; TREATMENT THEREOF, NOT COVERED BY OTHER CLASSES
- A23G—COCOA; COCOA PRODUCTS, e.g. CHOCOLATE; SUBSTITUTES FOR COCOA OR COCOA PRODUCTS; CONFECTIONERY; CHEWING GUM; ICE-CREAM; PREPARATION THEREOF
- A23G3/00—Sweetmeats; Confectionery; Marzipan; Coated or filled products
- A23G3/02—Apparatus specially adapted for manufacture or treatment of sweetmeats or confectionery; Accessories therefor
- A23G3/28—Apparatus for decorating sweetmeats or confectionery
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B44—DECORATIVE ARTS
- B44C—PRODUCING DECORATIVE EFFECTS; MOSAICS; TARSIA WORK; PAPERHANGING
- B44C1/00—Processes, not specifically provided for elsewhere, for producing decorative surface effects
- B44C1/18—Applying ornamental structures, e.g. shaped bodies consisting of plastic material
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B44—DECORATIVE ARTS
- B44C—PRODUCING DECORATIVE EFFECTS; MOSAICS; TARSIA WORK; PAPERHANGING
- B44C5/00—Processes for producing special ornamental bodies
- B44C5/04—Ornamental plaques, e.g. decorative panels, decorative veneers
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/90—Pitch determination of speech signals
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/93—Discriminating between voiced and unvoiced parts of speech signals
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Food Science & Technology (AREA)
- Computational Linguistics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Chemical & Material Sciences (AREA)
- Polymers & Plastics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
Description
Claims (25)
- 음성 신호의 하모닉 정보 및 스펙트럼 포락선 정보 추정 방법에 있어서,입력된 음성 신호를 주파수 도메인으로 변환하는 과정과,상기 음성 신호의 피치 예측값을 계산하고, 상기 피치 예측값을 이용하여 피크 검색 범위를 결정하는 과정과,상기 음성 신호에 다수의 상기 피크 검색 구간을 설정하여, 상기 각각의 피크 검색 범위에 존재하는 피크들을 검출하고, 상기 검출된 피크들 중 가장 최대 스펙트럼 값을 가지는 피크를 하모닉 피크로 결정하여 상기 음성 신호의 하모닉 정보로 출력하는 과정과,상기 하모닉 피크들을 인터폴레이션(interpolation)하여 하모닉 스펙트럼 포락선을 생성하여 상기 음성 신호의 스펙트럼 포락선 정보로 출력하는 과정을 포함함을 특징으로 하는 추정 방법.
- 제1항에 있어서, 상기 피크 검색 범위는 전체 구간과, 피크 검출이 이루어지지 않는 시프팅 구간과, 실제 피크 검출이 이루어지는 실제 검색 구간을 포함함을 특징으로 하는 추정 방법.
- 제2항에 있어서, 상기 실제 검색 구간은 상기 전체 구간에서 상기 시프팅 구간을 제외한 구간임을 특징으로 하는 추정 방법.
- 제3항에 있어서, 상기 전체 구간은 상기 피치 예측값 보다 크고, 상기 시프팅 구간은 피치 예측값 보다 작게 결정됨을 특징으로 하는 추정 방법.
- 제4항에 있어서, 상기 피크 검색 범위는 피치 예측값이 CP이고, 전체 구간이 b이고, 시프팅 구간이 a일 때 다음 수학식9와 같은 범위로 설정됨을 특징으로 하는 추정 방법.
M·CP<b< 2m·CP, 0<a<m·CP,단, M<2m, 0 < m < 1 < M - 제5항에 있어서, 상기 음성 신호의 최초 하모닉 피크 검출시 상기 전체 구간은 상기 피치 예측값으로 설정하고, 상기 시프팅 구간은 0으로 설정함을 특징으로 하는 추정 방법.
- 제6항에 있어서, 상기 하모닉 피크로 결정하여 출력하는 과정에서 상기 피크 검색 범위는 상기 음성 신호에서 가장 최근 검출된 하모닉 피크를 기준으로 설정됨을 특징으로 하는 추정 방법.
- 제7항에 있어서, 상기 하모닉 피크로 결정하여 출력하는 과정은 상기 가장 최대 스펙트럼 값을 가지는 피크가 2차 이상의 하이 오더 피크임을 확인하면 하모닉 피크로 결정하여 출력하는 과정임을 특징으로 하는 추정 방법.
- 제8항에 있어서, 상기 각각의 피크 검색 범위에서 검출된 상기 피크들 중 상기 하모닉 피크로 결정된 피크를 제외한 피크들을 인터폴레이션(interpolation)하여 비 하모닉 스펙트럼 포락선을 생성하여 출력하는 과정과,상기 하모닉 스펙트럼 포락선 에너지와 상기 비 하모닉 스펙트럼 포락선 에너지를 비교하여, 상기 음성 신호에 포함된 유성음 비율을 나타내는 유성음화 비율을 검출하는 과정을 더 포함함을 특징으로 하는 추정 방법.
- 제9항에 있어서, 상기 하모닉 정보와, 상기 하모닉 스펙트럼 포락선 정보와 상기 유성음화 비율 정보를 이용하여 오디오 코딩, 인식, 합성을 수행하는 과정을 더 포함함을 특징으로 하는 추정 방법.
- 음성 신호의 하모닉 정보 추정 방법에 있어서,입력된 음성 신호를 주파수 도메인으로 변환하는 과정과,상기 음성 신호의 피치 예측값을 계산하고, 상기 피치 예측값을 이용하여 피크 검색 범위를 결정하는 과정과,상기 음성 신호에 다수의 상기 피크 검색 구간을 설정하여, 상기 각각의 피크 검색 범위에 존재하는 피크들을 검출하고, 상기 검출된 피크들 중 가장 최대 스펙트럼 값을 가지는 피크를 하모닉 피크로 결정하여 출력하여, 상기 음성 신호의 하모닉 정보를 출력하는 과정을 포함함을 특징으로 하는 추정 방법.
- 음성 신호의 스펙트럼 포락선 정보를 이용하여 상기 음성 신호에 포함된 유성음 비율 정보를 추정하는 방법에 있어서,상기 음성 신호의 하모닉 피크를 포함하는 하모닉 스펙트럼 포락선 정보를 검출하는 과정과,상기 음성 신호의 피크 중 상기 하모닉 피크를 제외한 피크를 포함하는 비 하모닉 스펙트럼 포락선 정보를 검출하는 과정과,상기 하모닉 스펙트럼 포락선 에너지와 상기 비 하모닉 스펙트럼 포락선 에너지를 비교하여, 상기 음성 신호에 포함된 유성음 비율을 나타내는 유성음화 비율을 검출하는 과정을 포함함을 특징으로 하는 추정 방법.
- 제12항에 있어서, 상기 음성 신호의 하모닉 피크를 포함하는 하모닉 스펙트럼 포락선 정보를 검출하는 과정은입력된 음성 신호를 주파수 도메인으로 변환하는 단계와,상기 음성 신호의 피치 예측값을 계산하고, 상기 피치 예측값을 이용하여 피크 검색 범위를 결정하는 단계와,상기 음성 신호에 다수의 상기 피크 검색 구간을 설정하여, 상기 각각의 피크 검색 범위에 존재하는 피크들을 검출하고, 상기 검출된 피크들 중 가장 최대 스펙트럼 값을 가지는 피크를 하모닉 피크로 결정하여 출력하는 단계와,상기 하모닉 피크들을 인터폴레이션(interpolation)하여 하모닉 스펙트럼 포락선을 생성하여 상기 음성 신호의 스펙트럼 포락선 정보로 출력하는 단계를 포함하고,상기 음성 신호의 피크 중 상기 하모닉 피크를 제외한 피크를 포함하는 비 하모닉 스펙트럼 포락선 정보를 검출하는 과정은 상기 각각의 피크 검색 범위에서 검출된 상기 피크들 중 상기 하모닉 피크로 결정된 피크를 제외한 피크들을 인터폴레이션(interpolation)하여 비 하모닉 스펙트럼 포락선을 생성하여 출력하는 과정 임을 특징으로 하는 추정 방법.
- 음성 신호의 하모닉 정보 및 스펙트럼 포락선 정보 추정 장치에 있어서,입력되는 음성 신호를 주파수 도메인으로 변환하여 출력하는 주파수 도메인 변환부와,상기 주파수 도메인 변환부에서 출력되는 음성 신호에서 상기 음성 신호의 피치 예측값을 계산하고, 상기 피치 예측값을 이용하여 피크 검색 범위를 결정하는 검색 범위 결정부와,상기 주파수 도메인 변환부에서 출력되는 음성 신호에 다수의 상기 피크 검색 구간을 설정하여, 상기 각각의 피크 검색 범위에 존재하는 피크들을 검출하고, 상기 검출된 피크들 중 가장 최대 스펙트럼 값을 가지는 피크를 하모닉 피크로 결정하여 상기 음성 신호의 하모닉 정보로 출력하는 하모닉 피크 검출부와,상기 하모닉 피크들을 인터폴레이션(interpolation)하여 하모닉 스펙트럼 포락선을 생성하여 상기 음성 신호의 스펙트럼 포락선 정보로 출력하는 하모닉 스펙트럼 포락선 검출부를 포함함을 특징으로 하는 추정 장치.
- 제14항에 있어서, 상기 피크 검색 범위는 전체 구간과, 피크 검출이 이루어지지 않는 시프팅 구간과, 실제 피크 검출이 이루어지는 실제 검색 구간을 포함함 을 특징으로 하는 추정 장치.
- 제15항에 있어서, 상기 실제 검색 구간은 상기 전체 구간에서 상기 시프팅 구간을 제외한 구간임을 특징으로 하는 추정 장치.
- 제16항에 있어서, 상기 전체 구간은 상기 피치 예측값 보다 크고, 상기 시프팅 구간은 피치 예측값 보다 작게 결정됨을 특징으로 하는 추정 장치.
- 제17항에 있어서, 상기 피크 검색 범위는 피치 예측값이 CP이고, 전체 구간이 b이고, 시프팅 구간이 a일 때 다음 수학식10과 같은 범위로 설정됨을 특징으로 하는 추정 장치.
M·CP<b< 2m·CP, 0<a<m·CP,단, M<2m, 0 < m < 1 < M - 제17항에 있어서, 상기 검색 범위 결정부는 상기 음성 신호의 최초 하모닉 피크 검출시 상기 전체 구간은 상기 피치 예측값으로 설정하고, 상기 시프팅 구간은 0으로 설정함을 특징으로 하는 추정 장치.
- 제19항에 있어서, 상기 하모닉 피크 검출부는 상기 피크 검색 범위를 상기 음성 신호에서 가장 최근 검출된 하모닉 피크를 기준으로 설정함을 특징으로 하는 추정 장치.
- 제20항에 있어서, 상기 하모닉 피크 검출부는 상기 가장 최대 스펙트럼 값을 가지는 피크가 2차 이상의 하이 오더 피크임을 확인하면 하모닉 피크로 결정하여 출력함을 특징으로 하는 추정 장치.
- 제20항에 있어서, 상기 각각의 피크 검색 범위에서 검출된 상기 피크들 중 상기 하모닉 피크로 결정된 피크를 제외한 피크들을 인터폴레이션(interpolation)하여 비 하모닉 스펙트럼 포락선을 생성하여 출력하는 비 하모닉 스펙트럼 포락선 검출부와,상기 하모닉 스펙트럼 포락선 에너지와 상기 비 하모닉 스펙트럼 포락선 에 너지를 비교하여, 상기 음성 신호에 포함된 유성음 비율을 나타내는 유성음화 비율을 검출하는 유성음화 비율 검출부를 더 포함함을 특징으로 하는 추정 장치.
- 제22항에 있어서, 상기 하모닉 정보와, 상기 하모닉 스펙트럼 포락선 정보와 상기 유성음화 비율 정보를 이용하여 오디오 코딩, 인식, 합성을 수행하는 음성 처리부를 더 포함함을 특징으로 하는 추정 장치.
- 음성 신호의 하모닉 정보 추정 장치에 있어서,입력되는 음성 신호를 주파수 도메인으로 변환하여 출력하는 주파수 도메인 변환부와,상기 주파수 도메인 변환부에서 출력되는 음성 신호에서 상기 음성 신호의 피치 예측값을 계산하고, 상기 피치 예측값을 이용하여 피크 검색 범위를 결정하는 검색 범위 결정부와,상기 주파수 도메인 변환부에서 출력되는 음성 신호에 다수의 상기 피크 검색 구간을 설정하여, 상기 각각의 피크 검색 범위에 존재하는 피크들을 검출하고, 상기 검출된 피크들 중 가장 최대 스펙트럼 값을 가지는 피크를 하모닉 피크로 결정하여 상기 음성 신호의 하모닉 정보로 출력하는 하모닉 피크 검출부를 포함함을 특징으로 하는 추정 장치.
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020060030748A KR100770839B1 (ko) | 2006-04-04 | 2006-04-04 | 음성 신호의 하모닉 정보 및 스펙트럼 포락선 정보,유성음화 비율 추정 방법 및 장치 |
US11/732,650 US7912709B2 (en) | 2006-04-04 | 2007-04-04 | Method and apparatus for estimating harmonic information, spectral envelope information, and degree of voicing of speech signal |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020060030748A KR100770839B1 (ko) | 2006-04-04 | 2006-04-04 | 음성 신호의 하모닉 정보 및 스펙트럼 포락선 정보,유성음화 비율 추정 방법 및 장치 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20070099372A true KR20070099372A (ko) | 2007-10-09 |
KR100770839B1 KR100770839B1 (ko) | 2007-10-26 |
Family
ID=38804831
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020060030748A KR100770839B1 (ko) | 2006-04-04 | 2006-04-04 | 음성 신호의 하모닉 정보 및 스펙트럼 포락선 정보,유성음화 비율 추정 방법 및 장치 |
Country Status (2)
Country | Link |
---|---|
US (1) | US7912709B2 (ko) |
KR (1) | KR100770839B1 (ko) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2009059300A2 (en) * | 2007-11-02 | 2009-05-07 | Melodis Corporation | Pitch selection, voicing detection and vibrato detection modules in a system for automatic transcription of sung or hummed melodies |
KR101140737B1 (ko) * | 2010-07-26 | 2012-05-03 | 전자부품연구원 | 기본 주파수 추출 장치, 보컬 멜로디 추출 장치 및 방법 |
WO2013085801A1 (en) * | 2011-12-09 | 2013-06-13 | Microsoft Corporation | Harmonicity-based single-channel speech quality estimation |
US8554552B2 (en) | 2008-10-31 | 2013-10-08 | Samsung Electronics Co., Ltd. | Apparatus and method for restoring voice |
Families Citing this family (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7598447B2 (en) * | 2004-10-29 | 2009-10-06 | Zenph Studios, Inc. | Methods, systems and computer program products for detecting musical notes in an audio signal |
US8321209B2 (en) * | 2009-11-10 | 2012-11-27 | Research In Motion Limited | System and method for low overhead frequency domain voice authentication |
US9236063B2 (en) | 2010-07-30 | 2016-01-12 | Qualcomm Incorporated | Systems, methods, apparatus, and computer-readable media for dynamic bit allocation |
US9208792B2 (en) | 2010-08-17 | 2015-12-08 | Qualcomm Incorporated | Systems, methods, apparatus, and computer-readable media for noise injection |
US8620646B2 (en) * | 2011-08-08 | 2013-12-31 | The Intellisis Corporation | System and method for tracking sound pitch across an audio signal using harmonic envelope |
CN104115220B (zh) | 2011-12-21 | 2017-06-06 | 华为技术有限公司 | 非常短的基音周期检测和编码 |
CN103325384A (zh) | 2012-03-23 | 2013-09-25 | 杜比实验室特许公司 | 谐度估计、音频分类、音调确定及噪声估计 |
EP2828855B1 (en) * | 2012-03-23 | 2016-04-27 | Dolby Laboratories Licensing Corporation | Determining a harmonicity measure for voice processing |
CN103426441B (zh) | 2012-05-18 | 2016-03-02 | 华为技术有限公司 | 检测基音周期的正确性的方法和装置 |
CN103971693B (zh) | 2013-01-29 | 2017-02-22 | 华为技术有限公司 | 高频带信号的预测方法、编/解码设备 |
KR101440237B1 (ko) | 2013-06-20 | 2014-09-12 | 전북대학교산학협력단 | 구간별 임계값 방법 적용을 위한 스펙트럼 구간 분할 방법 및 이를 이용한 x선 형광 분석 방법 |
RU2632585C2 (ru) | 2013-06-21 | 2017-10-06 | Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. | Способ и устройство для получения спектральных коэффициентов для заменяющего кадра аудиосигнала, декодер аудио, приемник аудио и система для передачи аудиосигналов |
KR101837153B1 (ko) | 2014-05-01 | 2018-03-09 | 니폰 덴신 덴와 가부시끼가이샤 | 주기성 통합 포락 계열 생성 장치, 주기성 통합 포락 계열 생성 방법, 주기성 통합 포락 계열 생성 프로그램, 기록매체 |
GB2526291B (en) * | 2014-05-19 | 2018-04-04 | Toshiba Res Europe Limited | Speech analysis |
US9749733B1 (en) * | 2016-04-07 | 2017-08-29 | Harman Intenational Industries, Incorporated | Approach for detecting alert signals in changing environments |
CN111624668B (zh) * | 2020-06-23 | 2021-05-28 | 中南大学 | 一种用于频分电法的谐波校正方法 |
CN112235002B (zh) * | 2020-12-14 | 2021-03-09 | 展讯通信(上海)有限公司 | 谐波消除方法及装置、存储介质、终端 |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5189701A (en) * | 1991-10-25 | 1993-02-23 | Micom Communications Corp. | Voice coder/decoder and methods of coding/decoding |
US5701390A (en) | 1995-02-22 | 1997-12-23 | Digital Voice Systems, Inc. | Synthesis of MBE-based coded speech using regenerated phase information |
JP3158052B2 (ja) * | 1996-06-14 | 2001-04-23 | アロン化成株式会社 | インバート部材の製造方法 |
JPH102002A (ja) * | 1996-06-17 | 1998-01-06 | Daiwa:Kk | 排水桝と排水桝の内底形成方法 |
JP3325248B2 (ja) * | 1999-12-17 | 2002-09-17 | 株式会社ワイ・アール・ピー高機能移動体通信研究所 | 音声符号化パラメータの取得方法および装置 |
KR100383668B1 (ko) | 2000-09-19 | 2003-05-14 | 한국전자통신연구원 | 시간 분리 부호화 알고리즘을 이용한 음성 부호화기 및부호화 방법 |
GB2375028B (en) * | 2001-04-24 | 2003-05-28 | Motorola Inc | Processing speech signals |
KR100446242B1 (ko) | 2002-04-30 | 2004-08-30 | 엘지전자 주식회사 | 음성 부호화기에서 하모닉 추정 방법 및 장치 |
EP1403783A3 (en) * | 2002-09-24 | 2005-01-19 | Matsushita Electric Industrial Co., Ltd. | Audio signal feature extraction |
JP4649888B2 (ja) * | 2004-06-24 | 2011-03-16 | ヤマハ株式会社 | 音声効果付与装置及び音声効果付与プログラム |
-
2006
- 2006-04-04 KR KR1020060030748A patent/KR100770839B1/ko active IP Right Grant
-
2007
- 2007-04-04 US US11/732,650 patent/US7912709B2/en not_active Expired - Fee Related
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2009059300A2 (en) * | 2007-11-02 | 2009-05-07 | Melodis Corporation | Pitch selection, voicing detection and vibrato detection modules in a system for automatic transcription of sung or hummed melodies |
WO2009059300A3 (en) * | 2007-11-02 | 2009-06-18 | Melodis Corp | Pitch selection, voicing detection and vibrato detection modules in a system for automatic transcription of sung or hummed melodies |
US8554552B2 (en) | 2008-10-31 | 2013-10-08 | Samsung Electronics Co., Ltd. | Apparatus and method for restoring voice |
KR101140737B1 (ko) * | 2010-07-26 | 2012-05-03 | 전자부품연구원 | 기본 주파수 추출 장치, 보컬 멜로디 추출 장치 및 방법 |
WO2013085801A1 (en) * | 2011-12-09 | 2013-06-13 | Microsoft Corporation | Harmonicity-based single-channel speech quality estimation |
US8731911B2 (en) | 2011-12-09 | 2014-05-20 | Microsoft Corporation | Harmonicity-based single-channel speech quality estimation |
Also Published As
Publication number | Publication date |
---|---|
KR100770839B1 (ko) | 2007-10-26 |
US20070288232A1 (en) | 2007-12-13 |
US7912709B2 (en) | 2011-03-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR100770839B1 (ko) | 음성 신호의 하모닉 정보 및 스펙트럼 포락선 정보,유성음화 비율 추정 방법 및 장치 | |
KR100713366B1 (ko) | 모폴로지를 이용한 오디오 신호의 피치 정보 추출 방법 및그 장치 | |
Sadjadi et al. | Unsupervised speech activity detection using voicing measures and perceptual spectral flux | |
KR101437830B1 (ko) | 음성 구간 검출 방법 및 장치 | |
US8990073B2 (en) | Method and device for sound activity detection and sound signal classification | |
KR100744352B1 (ko) | 음성 신호의 하모닉 성분을 이용한 유/무성음 분리 정보를추출하는 방법 및 그 장치 | |
US9390729B2 (en) | Method and apparatus for performing voice activity detection | |
KR100653643B1 (ko) | 하모닉과 비하모닉의 비율을 이용한 피치 검출 방법 및피치 검출 장치 | |
Chen et al. | Improved voice activity detection algorithm using wavelet and support vector machine | |
JPH05346797A (ja) | 有声音判別方法 | |
US7835905B2 (en) | Apparatus and method for detecting degree of voicing of speech signal | |
KR100735343B1 (ko) | 음성신호의 피치 정보 추출장치 및 방법 | |
JP2001236085A (ja) | 音声区間検出装置、定常雑音区間検出装置、非定常雑音区間検出装置、及び雑音区間検出装置 | |
EP2843659B1 (en) | Method and apparatus for detecting correctness of pitch period | |
KR100770896B1 (ko) | 음성 신호에서 음소를 인식하는 방법 및 그 시스템 | |
US20070011001A1 (en) | Apparatus for predicting the spectral information of voice signals and a method therefor | |
EP1335349B1 (en) | Pitch determination method and apparatus | |
KR100744288B1 (ko) | 음성 신호에서 음소를 분절하는 방법 및 그 시스템 | |
CN104036785A (zh) | 语音信号的处理方法和装置、以及语音信号的分析系统 | |
EP1944754B1 (en) | Speech fundamental frequency estimator and method for estimating a speech fundamental frequency | |
EP1436805B1 (en) | 2-phase pitch detection method and appartus | |
US8103512B2 (en) | Method and system for aligning windows to extract peak feature from a voice signal | |
JP2001177416A (ja) | 音声符号化パラメータの取得方法および装置 | |
Murty et al. | Voice activity detection in degraded speech using excitation source information. | |
JP2880683B2 (ja) | 雑音抑制装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
FPAY | Annual fee payment |
Payment date: 20120927 Year of fee payment: 6 |
|
FPAY | Annual fee payment |
Payment date: 20130927 Year of fee payment: 7 |
|
FPAY | Annual fee payment |
Payment date: 20140929 Year of fee payment: 8 |
|
FPAY | Annual fee payment |
Payment date: 20150925 Year of fee payment: 9 |
|
FPAY | Annual fee payment |
Payment date: 20170927 Year of fee payment: 11 |
|
FPAY | Annual fee payment |
Payment date: 20180921 Year of fee payment: 12 |