KR970061590A - 음성의 피치 추출방법 및 장치 - Google Patents

음성의 피치 추출방법 및 장치 Download PDF

Info

Publication number
KR970061590A
KR970061590A KR1019970002641A KR19970002641A KR970061590A KR 970061590 A KR970061590 A KR 970061590A KR 1019970002641 A KR1019970002641 A KR 1019970002641A KR 19970002641 A KR19970002641 A KR 19970002641A KR 970061590 A KR970061590 A KR 970061590A
Authority
KR
South Korea
Prior art keywords
pitch
calculating
evaluation parameter
pass filter
intensity
Prior art date
Application number
KR1019970002641A
Other languages
English (en)
Other versions
KR100421817B1 (ko
Inventor
가즈유끼 이이지마
마사유끼 니시구찌
준 마쯔모또
시로 오모리
Original Assignee
이데이 노브유끼
소니 가부시끼가이샤
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 이데이 노브유끼, 소니 가부시끼가이샤 filed Critical 이데이 노브유끼
Publication of KR970061590A publication Critical patent/KR970061590A/ko
Application granted granted Critical
Publication of KR100421817B1 publication Critical patent/KR100421817B1/ko

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/90Pitch determination of speech signals
    • FMECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
    • F16ENGINEERING ELEMENTS AND UNITS; GENERAL MEASURES FOR PRODUCING AND MAINTAINING EFFECTIVE FUNCTIONING OF MACHINES OR INSTALLATIONS; THERMAL INSULATION IN GENERAL
    • F16HGEARING
    • F16H48/00Differential gearings
    • F16H48/20Arrangements for suppressing or influencing the differential action, e.g. locking devices
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/06Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being correlation coefficients
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/18Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • General Engineering & Computer Science (AREA)
  • Mechanical Engineering (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
  • Electrophonic Musical Instruments (AREA)
  • Measurement Of Velocity Or Position Using Acoustic Or Ultrasonic Waves (AREA)

Abstract

다양한 특성을 갖는 음성신호 피치(pitch)에 의하여 피치를 정확하게 추출할 수 있는 피치 추출(抽出)방법 및 장치에 관한 것이다. HPF(12)와 LPF(16)에 의해 대역 제한된 프레임 단위의 입력 음성신호는 자기 상관 데이터가 구해지는 자기상관 계산부(13,17)로 전송된다. 피치 래그는 피치 강도 및 피치 래그 계산부(14,18)에서 계산되고 정규화된다. HPF(12)와 LPF(16)에 의해 제한된 입력 음성신호들의 피치 신뢰도가 계산된다. 선택부(20)는 피치 래그와 평가 파라미터를 이용하여 HPF(12)와 LPF(16)에 의해 제한된 입력 음성신호들과 같이 구한 파라미터중 하나를 선택한다.

Description

음성의 피치 추출방법 및 장치
본 내용은 요부공개 건이므로 전문내용을 수록하지 않았음
제1도는 본 발명에 의한 피치 추출장치를 이용한 피치 탐색장치의 실시형태를 도식적으로 설명한다.

Claims (12)

  1. 피치 추출장치에 있어서, 입력 음성신호를 여러개의 다른 주파수 대역들로 제한하기 위한 필터 수단; 상기 필터 수단으로부터의 각 주파수 대역의 음성신호에 대하여 소저 단위의 자기상관 데이터를 계산하기 위한 자기상관 계산수단; 피치 주기를 계산하기 위해서 피치 강도를 구하기 위한 상기 자기상관 계산수단으로부터의 자기상관 데이터로부터 피크를 검출하기 위한 피치 주기 계산수단; 피치 주기 계산수단으로부터 피치 강도를 이용하여 피치 강도의 신뢰도를 지정하는 평가 파라미터를 계산하기 위한 평가 파라미터 계산수단; 그리고 상기 평가 피라미터 계산수단으로부터의 평가 파라미터와 상기 피치 주기 계산수단으로부터의 피치 주기에 근거하여 상기 주파수 대역중 하나의 음성신호들의 피치를 선택하기 위한 피치 선택수단을 포함하여 구성되는 것을 특징으로 하는 피치 추출장치.
  2. 제1항에 있어서, 상기 평가 파라미터 계산수단이 상기 피치 강도의 상대값을 계산하는 것을 특징으로 하는 피치 추출장치.
  3. 제1항에 있어서, 상기 필터 수단이 고역 통과 필터와 저역 통과를 이용하여 두 개의 주파수 대역으로 제한된 음성신호를 출력하는 것을 특징으로 하는 피치 추출장치.
  4. 제1항에 있어서, 프레임 단위의 음성신호들이 상기 필터 수단으로 입력되는 것을 특징으로 하는 피치 추출장치.
  5. 제1항에 있어서, 상기 필터 수단이 적어도 하나의 저역 통과 필터를 사용하는 것을 특징으로 하는 피치 추출장치.
  6. 제5항에 있어서, 상기 필터수단이 고주파수 성분이 없는 신호와 음성신호 자체를 출력하기 위해서 하나의 저역 통과 필터와 이용하는 것을 특징으로 하는 피치 추출장치.
  7. 제6항에 있어서, 상기 필터 수단이 두 개의 주파수 대역으로 제한된 음성신호를 출력하기 위해서 하나의 고역 통과 필터와 하나의 저역 통과 필터를 사용하는 것을 특징으로 하는 피치 추출장치.
  8. 제1항에 있어서, 상기 필터 수단이 여러개의 주파수 대역으로 제한된 음성신호들을 프레임 단위로 출력하는 것을 특징으로 하는 피치 추출장치.
  9. 제8항에 있어서, 상기 필터 수단이 두 개의 주파수 대역으로 제한된 음성신호를 프레임 단위로 출력하기 위해서 하나의 고역통과 필터와 하나의 저역 통과 필터를 사용하는 것을 특징으로 하는 피치 추출장치.
  10. 피치 추출방법에 있어서, 입력 음성신호를 여러개의 다른 주파수 대역들로 제한하는 필터링 단계; 각 주파수 대역의 음성신호에 대하여 소정 단위의 자기상관 데이터를 계산하는 자기상관 계산 단계; 피치 주기를 계산하기 위해서 피치 강도를 구할 자기상관 데이터로부터 피크를 검출하는 피치 주기 계산 단계; 피치 강도를 이용하여 피치 강도의 신뢰도를 지정하는 평가 파라미터를 계산하는 평가 파라미터 계산 단계; 그리고 피치 주기와 평가 파라미터에 근거하여 상기 주파수 대역중 하나의 음성신호들의 피치를 선택하는 피치 선택 단계로 구성되는 것을 특징으로 하는 피치 추출방법.
  11. 제10항에 있어서, 상기 평가 파라미터 계산 단계는 상기 피치 강도의 상대값을 계산하는 것을 특징으로 하는 치피 추출방법.
  12. 제10항에 있어서, 상기 필터 단계는 고역 통과 필터와 저역 통과 필터를 이용하여 두 개의 주파수 대역으로 제한된 음성신호들을 출력하는 것을 특징으로 하는 피치 추출방법.
    ※ 참고사항 : 최초출원 내용에 의하여 공개하는 것임.
KR1019970002641A 1996-02-01 1997-01-29 음성의피치추출방법및장치 KR100421817B1 (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP96-016433 1996-02-01
JP01643396A JP3840684B2 (ja) 1996-02-01 1996-02-01 ピッチ抽出装置及びピッチ抽出方法

Publications (2)

Publication Number Publication Date
KR970061590A true KR970061590A (ko) 1997-09-12
KR100421817B1 KR100421817B1 (ko) 2004-08-09

Family

ID=11916109

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1019970002641A KR100421817B1 (ko) 1996-02-01 1997-01-29 음성의피치추출방법및장치

Country Status (5)

Country Link
US (1) US5930747A (ko)
JP (1) JP3840684B2 (ko)
KR (1) KR100421817B1 (ko)
CN (1) CN1146862C (ko)
MY (1) MY120918A (ko)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2003017250A1 (en) * 2001-07-27 2003-02-27 Amusetec Co., Ltd. 2-phase pitch detection method and appartus
KR100773000B1 (ko) * 2003-03-31 2007-11-05 인터내셔널 비지네스 머신즈 코포레이션 음성 신호에 대한 주파수 영역 피치 추출법과 시간 영역피치 추출법을 결합한 시스템 및 방법

Families Citing this family (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2283202A1 (en) * 1998-01-26 1999-07-29 Matsushita Electric Industrial Co., Ltd. Method and apparatus for enhancing pitch
GB9811019D0 (en) * 1998-05-21 1998-07-22 Univ Surrey Speech coders
US6415252B1 (en) * 1998-05-28 2002-07-02 Motorola, Inc. Method and apparatus for coding and decoding speech
US7072832B1 (en) * 1998-08-24 2006-07-04 Mindspeed Technologies, Inc. System for speech encoding having an adaptive encoding arrangement
US6418407B1 (en) * 1999-09-30 2002-07-09 Motorola, Inc. Method and apparatus for pitch determination of a low bit rate digital voice message
AU2001260162A1 (en) * 2000-04-06 2001-10-23 Telefonaktiebolaget Lm Ericsson (Publ) Pitch estimation in a speech signal
US6640208B1 (en) * 2000-09-12 2003-10-28 Motorola, Inc. Voiced/unvoiced speech classifier
DE10123366C1 (de) * 2001-05-14 2002-08-08 Fraunhofer Ges Forschung Vorrichtung zum Analysieren eines Audiosignals hinsichtlich von Rhythmusinformationen
EP1793370B1 (en) * 2001-08-31 2009-06-03 Kabushiki Kaisha Kenwood apparatus and method for creating pitch wave signals and apparatus and method for synthesizing speech signals using these pitch wave signals
KR100463417B1 (ko) * 2002-10-10 2004-12-23 한국전자통신연구원 상관함수의 최대값과 그의 후보값의 비를 이용한 피치검출 방법 및 그 장치
KR100590561B1 (ko) * 2004-10-12 2006-06-19 삼성전자주식회사 신호의 피치를 평가하는 방법 및 장치
CN101044553B (zh) * 2004-10-28 2011-06-01 松下电器产业株式会社 可扩展编码装置、可扩展解码装置及其方法
CN1848240B (zh) * 2005-04-12 2011-12-21 佳能株式会社 基于离散对数傅立叶变换的基音检测方法、设备和介质
KR100634572B1 (ko) * 2005-04-25 2006-10-13 (주)가온다 오디오 데이터 자동 생성 방법 및 이를 이용한 사용자단말기 및 기록매체
KR101248353B1 (ko) * 2005-06-09 2013-04-02 가부시키가이샤 에이.지.아이 피치 주파수를 검출하는 음성 해석 장치, 음성 해석 방법,및 음성 해석 프로그램
JP4738260B2 (ja) * 2005-12-20 2011-08-03 日本電信電話株式会社 予測遅延探索方法、その方法を用いた装置、プログラム、および記録媒体
KR100724736B1 (ko) 2006-01-26 2007-06-04 삼성전자주식회사 스펙트럴 자기상관치를 이용한 피치 검출 방법 및 피치검출 장치
JP4632136B2 (ja) * 2006-03-31 2011-02-16 富士フイルム株式会社 楽曲テンポ抽出方法、装置及びプログラム
KR100735343B1 (ko) * 2006-04-11 2007-07-04 삼성전자주식회사 음성신호의 피치 정보 추출장치 및 방법
EP1918909B1 (en) * 2006-11-03 2010-07-07 Psytechnics Ltd Sampling error compensation
JP5040313B2 (ja) * 2007-01-05 2012-10-03 株式会社Jvcケンウッド 音声信号処理装置、音声信号処理方法、および、音声信号処理プログラム
MX2011008605A (es) * 2009-02-27 2011-09-09 Panasonic Corp Dispositivo de determinacion de tono y metodo de determinacion de tono.
US8620646B2 (en) * 2011-08-08 2013-12-31 The Intellisis Corporation System and method for tracking sound pitch across an audio signal using harmonic envelope
CN103165133A (zh) * 2011-12-13 2013-06-19 联芯科技有限公司 一种最大相关系数的优化方法及其装置
US8645128B1 (en) * 2012-10-02 2014-02-04 Google Inc. Determining pitch dynamics of an audio signal
EP3306609A1 (en) * 2016-10-04 2018-04-11 Fraunhofer Gesellschaft zur Förderung der Angewand Apparatus and method for determining a pitch information
CN109448749B (zh) * 2018-12-19 2022-02-15 中国科学院自动化研究所 基于有监督学习听觉注意的语音提取方法、系统、装置
CN110379438B (zh) * 2019-07-24 2020-05-12 山东省计算中心(国家超级计算济南中心) 一种语音信号基频检测与提取方法及系统

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3617636A (en) * 1968-09-24 1971-11-02 Nippon Electric Co Pitch detection apparatus

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2003017250A1 (en) * 2001-07-27 2003-02-27 Amusetec Co., Ltd. 2-phase pitch detection method and appartus
KR100773000B1 (ko) * 2003-03-31 2007-11-05 인터내셔널 비지네스 머신즈 코포레이션 음성 신호에 대한 주파수 영역 피치 추출법과 시간 영역피치 추출법을 결합한 시스템 및 방법

Also Published As

Publication number Publication date
CN1146862C (zh) 2004-04-21
JP3840684B2 (ja) 2006-11-01
JPH09212194A (ja) 1997-08-15
KR100421817B1 (ko) 2004-08-09
CN1165365A (zh) 1997-11-19
US5930747A (en) 1999-07-27
MY120918A (en) 2005-12-30

Similar Documents

Publication Publication Date Title
KR970061590A (ko) 음성의 피치 추출방법 및 장치
US4328579A (en) Voice band multiplex transmission system
Joshi et al. MATLAB based feature extraction using Mel frequency cepstrum coefficients for automatic speech recognition
US8494668B2 (en) Sound signal processing apparatus and method
DE07003891T1 (de) Vorrichtung und Verfahren zur Erzeugung von Tonhöhenwellensignalen und Vorrichtung sowie Verfahren zum Komprimieren, Erweitern und Synthetisieren von Sprachsignalen unter Verwendung dieser Tonhöhenwellensignale
TW200741217A (en) Testing apparatus, testing method, jitter filter circuit, and method of jitter filtering
CN104252872A (zh) 歌词生成方法和智能终端
KR880006860A (ko) 신호분류 장치 및 방법
KR840001034A (ko) 잡음 저감회로
KR950034058A (ko) 음성 신호의 피치 주기 추출 장치
GB978303A (en) Improvements in or relating to means for processing signals composed of components of different frequencies
US3400216A (en) Speech recognition apparatus
JP3266124B2 (ja) アナログ信号中の類似波形検出装置及び同信号の時間軸伸長圧縮装置
US3448216A (en) Vocoder system
JP4360527B2 (ja) ピッチ検出方法
KR900000754A (ko) 과대음성검출장치
JPH04116700A (ja) 音声分析・合成装置
JP3019603B2 (ja) 音声の基本周波数の抽出装置
KR0160206B1 (ko) 음성신호 추출장치
JPS6031196A (ja) 音声パタ−ン作成装置
JPH03223798A (ja) 音声切り出し装置
JPS63163495A (ja) 音声区間検出装置
JPS61273600A (ja) 音声認識装置
KR20040031898A (ko) 음성신호 추적장치 및 그 방법
JPS58199397A (ja) 音声認識装置

Legal Events

Date Code Title Description
A201 Request for examination
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20120221

Year of fee payment: 9

LAPS Lapse due to unpaid annual fee