KR970061590A - 음성의 피치 추출방법 및 장치 - Google Patents
음성의 피치 추출방법 및 장치 Download PDFInfo
- Publication number
- KR970061590A KR970061590A KR1019970002641A KR19970002641A KR970061590A KR 970061590 A KR970061590 A KR 970061590A KR 1019970002641 A KR1019970002641 A KR 1019970002641A KR 19970002641 A KR19970002641 A KR 19970002641A KR 970061590 A KR970061590 A KR 970061590A
- Authority
- KR
- South Korea
- Prior art keywords
- pitch
- calculating
- evaluation parameter
- pass filter
- intensity
- Prior art date
Links
- 238000000605 extraction Methods 0.000 title claims abstract 6
- 238000011156 evaluation Methods 0.000 claims abstract 10
- 230000005236 sound signal Effects 0.000 claims abstract 2
- 239000011295 pitch Substances 0.000 claims 31
- 238000001914 filtration Methods 0.000 claims 2
- 238000000034 method Methods 0.000 claims 2
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/90—Pitch determination of speech signals
-
- F—MECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
- F16—ENGINEERING ELEMENTS AND UNITS; GENERAL MEASURES FOR PRODUCING AND MAINTAINING EFFECTIVE FUNCTIONING OF MACHINES OR INSTALLATIONS; THERMAL INSULATION IN GENERAL
- F16H—GEARING
- F16H48/00—Differential gearings
- F16H48/20—Arrangements for suppressing or influencing the differential action, e.g. locking devices
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/06—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being correlation coefficients
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/18—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Multimedia (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- General Engineering & Computer Science (AREA)
- Mechanical Engineering (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
- Electrophonic Musical Instruments (AREA)
- Measurement Of Velocity Or Position Using Acoustic Or Ultrasonic Waves (AREA)
Abstract
다양한 특성을 갖는 음성신호 피치(pitch)에 의하여 피치를 정확하게 추출할 수 있는 피치 추출(抽出)방법 및 장치에 관한 것이다. HPF(12)와 LPF(16)에 의해 대역 제한된 프레임 단위의 입력 음성신호는 자기 상관 데이터가 구해지는 자기상관 계산부(13,17)로 전송된다. 피치 래그는 피치 강도 및 피치 래그 계산부(14,18)에서 계산되고 정규화된다. HPF(12)와 LPF(16)에 의해 제한된 입력 음성신호들의 피치 신뢰도가 계산된다. 선택부(20)는 피치 래그와 평가 파라미터를 이용하여 HPF(12)와 LPF(16)에 의해 제한된 입력 음성신호들과 같이 구한 파라미터중 하나를 선택한다.
Description
본 내용은 요부공개 건이므로 전문내용을 수록하지 않았음
제1도는 본 발명에 의한 피치 추출장치를 이용한 피치 탐색장치의 실시형태를 도식적으로 설명한다.
Claims (12)
- 피치 추출장치에 있어서, 입력 음성신호를 여러개의 다른 주파수 대역들로 제한하기 위한 필터 수단; 상기 필터 수단으로부터의 각 주파수 대역의 음성신호에 대하여 소저 단위의 자기상관 데이터를 계산하기 위한 자기상관 계산수단; 피치 주기를 계산하기 위해서 피치 강도를 구하기 위한 상기 자기상관 계산수단으로부터의 자기상관 데이터로부터 피크를 검출하기 위한 피치 주기 계산수단; 피치 주기 계산수단으로부터 피치 강도를 이용하여 피치 강도의 신뢰도를 지정하는 평가 파라미터를 계산하기 위한 평가 파라미터 계산수단; 그리고 상기 평가 피라미터 계산수단으로부터의 평가 파라미터와 상기 피치 주기 계산수단으로부터의 피치 주기에 근거하여 상기 주파수 대역중 하나의 음성신호들의 피치를 선택하기 위한 피치 선택수단을 포함하여 구성되는 것을 특징으로 하는 피치 추출장치.
- 제1항에 있어서, 상기 평가 파라미터 계산수단이 상기 피치 강도의 상대값을 계산하는 것을 특징으로 하는 피치 추출장치.
- 제1항에 있어서, 상기 필터 수단이 고역 통과 필터와 저역 통과를 이용하여 두 개의 주파수 대역으로 제한된 음성신호를 출력하는 것을 특징으로 하는 피치 추출장치.
- 제1항에 있어서, 프레임 단위의 음성신호들이 상기 필터 수단으로 입력되는 것을 특징으로 하는 피치 추출장치.
- 제1항에 있어서, 상기 필터 수단이 적어도 하나의 저역 통과 필터를 사용하는 것을 특징으로 하는 피치 추출장치.
- 제5항에 있어서, 상기 필터수단이 고주파수 성분이 없는 신호와 음성신호 자체를 출력하기 위해서 하나의 저역 통과 필터와 이용하는 것을 특징으로 하는 피치 추출장치.
- 제6항에 있어서, 상기 필터 수단이 두 개의 주파수 대역으로 제한된 음성신호를 출력하기 위해서 하나의 고역 통과 필터와 하나의 저역 통과 필터를 사용하는 것을 특징으로 하는 피치 추출장치.
- 제1항에 있어서, 상기 필터 수단이 여러개의 주파수 대역으로 제한된 음성신호들을 프레임 단위로 출력하는 것을 특징으로 하는 피치 추출장치.
- 제8항에 있어서, 상기 필터 수단이 두 개의 주파수 대역으로 제한된 음성신호를 프레임 단위로 출력하기 위해서 하나의 고역통과 필터와 하나의 저역 통과 필터를 사용하는 것을 특징으로 하는 피치 추출장치.
- 피치 추출방법에 있어서, 입력 음성신호를 여러개의 다른 주파수 대역들로 제한하는 필터링 단계; 각 주파수 대역의 음성신호에 대하여 소정 단위의 자기상관 데이터를 계산하는 자기상관 계산 단계; 피치 주기를 계산하기 위해서 피치 강도를 구할 자기상관 데이터로부터 피크를 검출하는 피치 주기 계산 단계; 피치 강도를 이용하여 피치 강도의 신뢰도를 지정하는 평가 파라미터를 계산하는 평가 파라미터 계산 단계; 그리고 피치 주기와 평가 파라미터에 근거하여 상기 주파수 대역중 하나의 음성신호들의 피치를 선택하는 피치 선택 단계로 구성되는 것을 특징으로 하는 피치 추출방법.
- 제10항에 있어서, 상기 평가 파라미터 계산 단계는 상기 피치 강도의 상대값을 계산하는 것을 특징으로 하는 치피 추출방법.
- 제10항에 있어서, 상기 필터 단계는 고역 통과 필터와 저역 통과 필터를 이용하여 두 개의 주파수 대역으로 제한된 음성신호들을 출력하는 것을 특징으로 하는 피치 추출방법.※ 참고사항 : 최초출원 내용에 의하여 공개하는 것임.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP96-016433 | 1996-02-01 | ||
JP01643396A JP3840684B2 (ja) | 1996-02-01 | 1996-02-01 | ピッチ抽出装置及びピッチ抽出方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR970061590A true KR970061590A (ko) | 1997-09-12 |
KR100421817B1 KR100421817B1 (ko) | 2004-08-09 |
Family
ID=11916109
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1019970002641A KR100421817B1 (ko) | 1996-02-01 | 1997-01-29 | 음성의피치추출방법및장치 |
Country Status (5)
Country | Link |
---|---|
US (1) | US5930747A (ko) |
JP (1) | JP3840684B2 (ko) |
KR (1) | KR100421817B1 (ko) |
CN (1) | CN1146862C (ko) |
MY (1) | MY120918A (ko) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2003017250A1 (en) * | 2001-07-27 | 2003-02-27 | Amusetec Co., Ltd. | 2-phase pitch detection method and appartus |
KR100773000B1 (ko) * | 2003-03-31 | 2007-11-05 | 인터내셔널 비지네스 머신즈 코포레이션 | 음성 신호에 대한 주파수 영역 피치 추출법과 시간 영역피치 추출법을 결합한 시스템 및 방법 |
Families Citing this family (28)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CA2283202A1 (en) * | 1998-01-26 | 1999-07-29 | Matsushita Electric Industrial Co., Ltd. | Method and apparatus for enhancing pitch |
GB9811019D0 (en) * | 1998-05-21 | 1998-07-22 | Univ Surrey | Speech coders |
US6415252B1 (en) * | 1998-05-28 | 2002-07-02 | Motorola, Inc. | Method and apparatus for coding and decoding speech |
US7072832B1 (en) * | 1998-08-24 | 2006-07-04 | Mindspeed Technologies, Inc. | System for speech encoding having an adaptive encoding arrangement |
US6418407B1 (en) * | 1999-09-30 | 2002-07-09 | Motorola, Inc. | Method and apparatus for pitch determination of a low bit rate digital voice message |
AU2001260162A1 (en) * | 2000-04-06 | 2001-10-23 | Telefonaktiebolaget Lm Ericsson (Publ) | Pitch estimation in a speech signal |
US6640208B1 (en) * | 2000-09-12 | 2003-10-28 | Motorola, Inc. | Voiced/unvoiced speech classifier |
DE10123366C1 (de) * | 2001-05-14 | 2002-08-08 | Fraunhofer Ges Forschung | Vorrichtung zum Analysieren eines Audiosignals hinsichtlich von Rhythmusinformationen |
EP1793370B1 (en) * | 2001-08-31 | 2009-06-03 | Kabushiki Kaisha Kenwood | apparatus and method for creating pitch wave signals and apparatus and method for synthesizing speech signals using these pitch wave signals |
KR100463417B1 (ko) * | 2002-10-10 | 2004-12-23 | 한국전자통신연구원 | 상관함수의 최대값과 그의 후보값의 비를 이용한 피치검출 방법 및 그 장치 |
KR100590561B1 (ko) * | 2004-10-12 | 2006-06-19 | 삼성전자주식회사 | 신호의 피치를 평가하는 방법 및 장치 |
CN101044553B (zh) * | 2004-10-28 | 2011-06-01 | 松下电器产业株式会社 | 可扩展编码装置、可扩展解码装置及其方法 |
CN1848240B (zh) * | 2005-04-12 | 2011-12-21 | 佳能株式会社 | 基于离散对数傅立叶变换的基音检测方法、设备和介质 |
KR100634572B1 (ko) * | 2005-04-25 | 2006-10-13 | (주)가온다 | 오디오 데이터 자동 생성 방법 및 이를 이용한 사용자단말기 및 기록매체 |
KR101248353B1 (ko) * | 2005-06-09 | 2013-04-02 | 가부시키가이샤 에이.지.아이 | 피치 주파수를 검출하는 음성 해석 장치, 음성 해석 방법,및 음성 해석 프로그램 |
JP4738260B2 (ja) * | 2005-12-20 | 2011-08-03 | 日本電信電話株式会社 | 予測遅延探索方法、その方法を用いた装置、プログラム、および記録媒体 |
KR100724736B1 (ko) | 2006-01-26 | 2007-06-04 | 삼성전자주식회사 | 스펙트럴 자기상관치를 이용한 피치 검출 방법 및 피치검출 장치 |
JP4632136B2 (ja) * | 2006-03-31 | 2011-02-16 | 富士フイルム株式会社 | 楽曲テンポ抽出方法、装置及びプログラム |
KR100735343B1 (ko) * | 2006-04-11 | 2007-07-04 | 삼성전자주식회사 | 음성신호의 피치 정보 추출장치 및 방법 |
EP1918909B1 (en) * | 2006-11-03 | 2010-07-07 | Psytechnics Ltd | Sampling error compensation |
JP5040313B2 (ja) * | 2007-01-05 | 2012-10-03 | 株式会社Jvcケンウッド | 音声信号処理装置、音声信号処理方法、および、音声信号処理プログラム |
MX2011008605A (es) * | 2009-02-27 | 2011-09-09 | Panasonic Corp | Dispositivo de determinacion de tono y metodo de determinacion de tono. |
US8620646B2 (en) * | 2011-08-08 | 2013-12-31 | The Intellisis Corporation | System and method for tracking sound pitch across an audio signal using harmonic envelope |
CN103165133A (zh) * | 2011-12-13 | 2013-06-19 | 联芯科技有限公司 | 一种最大相关系数的优化方法及其装置 |
US8645128B1 (en) * | 2012-10-02 | 2014-02-04 | Google Inc. | Determining pitch dynamics of an audio signal |
EP3306609A1 (en) * | 2016-10-04 | 2018-04-11 | Fraunhofer Gesellschaft zur Förderung der Angewand | Apparatus and method for determining a pitch information |
CN109448749B (zh) * | 2018-12-19 | 2022-02-15 | 中国科学院自动化研究所 | 基于有监督学习听觉注意的语音提取方法、系统、装置 |
CN110379438B (zh) * | 2019-07-24 | 2020-05-12 | 山东省计算中心(国家超级计算济南中心) | 一种语音信号基频检测与提取方法及系统 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US3617636A (en) * | 1968-09-24 | 1971-11-02 | Nippon Electric Co | Pitch detection apparatus |
-
1996
- 1996-02-01 JP JP01643396A patent/JP3840684B2/ja not_active Expired - Fee Related
-
1997
- 1997-01-24 US US08/788,194 patent/US5930747A/en not_active Expired - Lifetime
- 1997-01-28 MY MYPI97000322A patent/MY120918A/en unknown
- 1997-01-29 KR KR1019970002641A patent/KR100421817B1/ko not_active IP Right Cessation
- 1997-02-01 CN CNB971031762A patent/CN1146862C/zh not_active Expired - Fee Related
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2003017250A1 (en) * | 2001-07-27 | 2003-02-27 | Amusetec Co., Ltd. | 2-phase pitch detection method and appartus |
KR100773000B1 (ko) * | 2003-03-31 | 2007-11-05 | 인터내셔널 비지네스 머신즈 코포레이션 | 음성 신호에 대한 주파수 영역 피치 추출법과 시간 영역피치 추출법을 결합한 시스템 및 방법 |
Also Published As
Publication number | Publication date |
---|---|
CN1146862C (zh) | 2004-04-21 |
JP3840684B2 (ja) | 2006-11-01 |
JPH09212194A (ja) | 1997-08-15 |
KR100421817B1 (ko) | 2004-08-09 |
CN1165365A (zh) | 1997-11-19 |
US5930747A (en) | 1999-07-27 |
MY120918A (en) | 2005-12-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR970061590A (ko) | 음성의 피치 추출방법 및 장치 | |
US4328579A (en) | Voice band multiplex transmission system | |
Joshi et al. | MATLAB based feature extraction using Mel frequency cepstrum coefficients for automatic speech recognition | |
US8494668B2 (en) | Sound signal processing apparatus and method | |
DE07003891T1 (de) | Vorrichtung und Verfahren zur Erzeugung von Tonhöhenwellensignalen und Vorrichtung sowie Verfahren zum Komprimieren, Erweitern und Synthetisieren von Sprachsignalen unter Verwendung dieser Tonhöhenwellensignale | |
TW200741217A (en) | Testing apparatus, testing method, jitter filter circuit, and method of jitter filtering | |
CN104252872A (zh) | 歌词生成方法和智能终端 | |
KR880006860A (ko) | 신호분류 장치 및 방법 | |
KR840001034A (ko) | 잡음 저감회로 | |
KR950034058A (ko) | 음성 신호의 피치 주기 추출 장치 | |
GB978303A (en) | Improvements in or relating to means for processing signals composed of components of different frequencies | |
US3400216A (en) | Speech recognition apparatus | |
JP3266124B2 (ja) | アナログ信号中の類似波形検出装置及び同信号の時間軸伸長圧縮装置 | |
US3448216A (en) | Vocoder system | |
JP4360527B2 (ja) | ピッチ検出方法 | |
KR900000754A (ko) | 과대음성검출장치 | |
JPH04116700A (ja) | 音声分析・合成装置 | |
JP3019603B2 (ja) | 音声の基本周波数の抽出装置 | |
KR0160206B1 (ko) | 음성신호 추출장치 | |
JPS6031196A (ja) | 音声パタ−ン作成装置 | |
JPH03223798A (ja) | 音声切り出し装置 | |
JPS63163495A (ja) | 音声区間検出装置 | |
JPS61273600A (ja) | 音声認識装置 | |
KR20040031898A (ko) | 음성신호 추적장치 및 그 방법 | |
JPS58199397A (ja) | 音声認識装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
FPAY | Annual fee payment |
Payment date: 20120221 Year of fee payment: 9 |
|
LAPS | Lapse due to unpaid annual fee |