KR960039666A - 음성 부호화의 피치 추정방법 - Google Patents

음성 부호화의 피치 추정방법 Download PDF

Info

Publication number
KR960039666A
KR960039666A KR1019950009128A KR19950009128A KR960039666A KR 960039666 A KR960039666 A KR 960039666A KR 1019950009128 A KR1019950009128 A KR 1019950009128A KR 19950009128 A KR19950009128 A KR 19950009128A KR 960039666 A KR960039666 A KR 960039666A
Authority
KR
South Korea
Prior art keywords
pitch
closed loop
frame
candidate
satisfied
Prior art date
Application number
KR1019950009128A
Other languages
English (en)
Other versions
KR0141158B1 (ko
Inventor
하남규
김흥국
Original Assignee
김광호
삼성전자 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 김광호, 삼성전자 주식회사 filed Critical 김광호
Priority to KR1019950009128A priority Critical patent/KR0141158B1/ko
Publication of KR960039666A publication Critical patent/KR960039666A/ko
Application granted granted Critical
Publication of KR0141158B1 publication Critical patent/KR0141158B1/ko

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
    • G10L19/125Pitch excitation, e.g. pitch synchronous innovation CELP [PSI-CELP]
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/90Pitch determination of speech signals

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

본 발명은 음성 부호화의 피치추정방법을 공개한다. 그 방법은 피치를 구할 현재 프레임의 피치를 추정하기 위해서 먼저, 프레임의 폐쇠루프로부터 4개의 피치를 구하고, 과거 두 개의 프레임들과 이들 프레임의 선형성을 이용하여 예측된 후보피치를 구한 후, 4개의 폐쇠 루프 피치들중 후보피치보다 0.8배 크거나 같고, 1.2배 작거가 같은 폐쇠 루프피치를 현재 프레임의 추정된 피치로 결정함으로서, 피치 추정의 정확도가 향상되고, 피치 추정을 위하여 미래의 프레임 정보를 참조하지 않기 때문에 프레임 지연시간이 발생하지 않으며, 피치 추정 알고리즘의 처리시간이 단축되는 효과가 있다.

Description

음성 부호화의 피치 추정방법
본 내용은 요부공개 건이므로 전문내용을 수록하지 않았음
제2도는 본 발명에 의한 음성부호화의 피치 추정방법을 설명하기 위한 플로우차트이다, 제3도는 제2도에 도시된 방법을 세부적으로 설명하기 위한 플로우차트이다.

Claims (5)

  1. 음성 부호화함에 있어서, 음성 프레임을 분석하여 각 부프레임별로 구해진 N개의 폐쇠 루프 피치들로부터 선형회귀법에 의해 상기 음성 프레임의 후보피치를 구하는 후보피치단계; 곱셈인자(M[x])의 변수(x)를 초기화하고, 상기 곱셈인자의 승산순서를 정하는 곱셈인자단계; 상기 곱셈인자를 상기 후보피치에 곱하여 새로운 후보피치(P')를 구하는 피치곱셈단계; 상기 N개의 폐쇠 루프 피치들 중 하나의 폐쇠 루프 피치가 상기 푸보피치(P')의 제1소정수배보다 크거나 같고, 제2소정수배보다 적거나 같은가를 판단하는 제1판단단계; 상기 제1판단단계를 만족하면 상기 변수(x)를 초기화하고, 상기 제1판단단계에서 판단된 상기 폐쇠 루프 피치를 상기 프레임의 피치로 추정하는 피치추정단계; 상기 제1판단단계를 만족하지 않으면 상기 제1판단단계에서 상기 폐쇠 루프 피치들이 모두 판단되었는가를 판단하는 제2판단단계; 상기 제2판단단계를 만족하지 않으면 다음에 판단할 폐쇠 루프 피치를 지정하여 상기 제1판단단계로 진행하는 인자 지정단계; 상기 제2판단단계를 만족하면 상기 변수(x)를 1만큼 증가시켜 상기 피치곱셈단계로 진행하는 변수증가단계를 구비하는 것을 특징으로 하는 음성 부호화의 피치 추정방법.
  2. 제1항에 있어서, 후보피치단계는 상기 피치를 추적할 상기 음성프레임을 구하는 프레임단계; 상기 프레임 별로 상기 폐쇠 루프 피치를 계산하는 피치계산단계; 계산된 상기 폐쇠 루프 피치들을 분류하는 피치분류단계; 상기 선형회귀법을 이용하여 상기 프레임별로 상기 후보피치를 구하는 후보피치계산단계를 구비하는 것을 특징으로 하는 음성 부호화의 피치 추정방법.
  3. 제1항에 있어서, 음성 부호화의 피치 추정방법은 상기 피치 곱셈단계후에 상기 폐쇠 루프 피치들 중 제1폐쇠 루프 피치가 상기 후보피치보다 제1소정수배 크거나 같고, 제2소정수배보다 적거나 같은가를 판단하는 제3판단단계; 상기 제3판단단계를 만족하면 상기 변수를 초기화하고, 상기 제1폐쇠 루프 피치를 상기 프레임의 피치로 추정하는 제1피치 추정단계; 상기 제3판단단계를 만족하지 않으면 상기 폐쇠 루프 피치들 중 제2폐쇠 루프 피치가 상기 후보피치보다 제1소정수배보다 크거나 같고, 제2소정수배보다 적거나 같은가를 판단하는 제4판단단계; 상기 제4판단단계를 만족하면 상기 변수를 초기화하고, 상기 제2폐루프 피치를 상기 프레임의 피치로 추정하는 제2피치 추정단계; 상기 제4판단단계를 만족하지 않으면 상기 폐쇠 루프 피치들 중 제3폐쇠 루프 피치가 상기 후보피치보다 제1소정수배보다 크거나 같고, 제2소정수배보다 적거나 같은가를 판단하는 제5판단단계; 상기 제5판단단계를 만족하면 상기 변수를 초기화하고, 상기 제3폐쇠 루프 피치를 상기 프레임의 피치로 추정하는 제3피치 추정단계; 상기 제5판단단계를 만족하지 않으면 상기 폐쇠 루프 피치들 중 제4폐쇠 루프 피치가 상기 후보피치보다 제1소정수배보다 크거나 같고, 제2소정수배보다 적거나 같은가를 판단하여 만족하지 않으면 상기 변수증가단계로 진행하는 제6판단단계; 상기 제6판단단계를 만족하면 상기 변수를 초기화하고, 상기 제4폐쇠 루프 피치를 상기 프레임의 피치로 추정하는 제4피치 추정단계를 구비하는 것을 특징으로 하는 음성 부호화의 피치 추정방법.
  4. 제1항에 있어서, 상기 선형회귀법은 과거 두 개의 프레임들의 선형성을 이용하여 상기 후보피치를 구하는 것을 특징으로 하는 음성 부호화의 피치 추정방법.
  5. 제1항에 있어서, 상가 제1소정수는 0.8이고, 상기 제2소정수는 1.2인 것을 특징으로 하는 음성 부호화의 피치 추정방법.
    ※ 참고사항 : 최초출원 내용에 의하여 공개하는 것임.
KR1019950009128A 1995-04-18 1995-04-18 음성 부호화의 피치 추정방법 KR0141158B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1019950009128A KR0141158B1 (ko) 1995-04-18 1995-04-18 음성 부호화의 피치 추정방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1019950009128A KR0141158B1 (ko) 1995-04-18 1995-04-18 음성 부호화의 피치 추정방법

Publications (2)

Publication Number Publication Date
KR960039666A true KR960039666A (ko) 1996-11-25
KR0141158B1 KR0141158B1 (ko) 1998-07-15

Family

ID=19412452

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1019950009128A KR0141158B1 (ko) 1995-04-18 1995-04-18 음성 부호화의 피치 추정방법

Country Status (1)

Country Link
KR (1) KR0141158B1 (ko)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6988064B2 (en) * 2003-03-31 2006-01-17 Motorola, Inc. System and method for combined frequency-domain and time-domain pitch extraction for speech signals

Also Published As

Publication number Publication date
KR0141158B1 (ko) 1998-07-15

Similar Documents

Publication Publication Date Title
KR950000842B1 (ko) 피치 검출기
KR100880480B1 (ko) 디지털 오디오 신호의 실시간 음악/음성 식별 방법 및시스템
EP1380029B1 (en) Time-scale modification of signals applying techniques specific to determined signal types
FI115328B (fi) Äänen aktiivisuuden ilmaisu
KR940024660A (ko) 음성인식장치
KR960030075A (ko) 유기 파라미터의 결정을 위한 디지탈화된 음성 신호 분석방법 및 시스템
DE69412913T2 (de) Verfahren und Vorrichtung für digitale Sprachkodierung mit Sprachsignalhöhenabschätzung und Klassifikation in digitalen Sprachkodierern
EP0737012A3 (en) Method for segmenting and estimating a moving object motion
KR102120073B1 (ko) 개선된 피치 래그 추정을 사용하여 acelpp-형 은폐 내에서 적응적 코드북의 개선된 은폐를 위한 장치 및 방법
US8849662B2 (en) Method and system for segmenting phonemes from voice signals
KR960039666A (ko) 음성 부호화의 피치 추정방법
KR970068623A (ko) 물체의 윤곽 부호화 시스템 및 그의 움직임 추정방법(system for encoding contour of object in object based encoding system and motion estimation method thereof)
JP2004070353A (ja) 信号間相関係数決定装置及び方法並びにこれを利用した信号ピッチ決定装置及び方法
JPH08305388A (ja) 音声区間検出装置
Hwang Computational improvement for G. 729 standard
JP3034279B2 (ja) 有音検出装置および有音検出方法
JP2921059B2 (ja) 連続音声認識装置
JPH06131000A (ja) 基本周期符号化装置
KR950035412A (ko) 동영상 부호화기에 있어서 움직임 평가방법
JP2001228900A (ja) 音声パラメータ符号化装置およびその装置に用いられる符号化方式およびその符号化アルゴリズムを記載したコンピュータ読み取り可能な記録媒体、および、音声パラメータ量子化装置およびその装置に用いられる量子化方法およびその量子化アルゴリズムを記載したコンピュータ読み取り可能な記録媒体
JP2001022368A (ja) 音声判別装置及び音声判別方法
KR950005030A (ko) 블럭정합기를 이용한 대칭블럭 움직임 추정방법 및 장치
JP3328642B2 (ja) 音声判別装置及び音声判別方法
KR960020017A (ko) 씨이엘피(celp)부호화기의 피치검색방법
JPH02266400A (ja) 有音/無音判定回路

Legal Events

Date Code Title Description
A201 Request for examination
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20070105

Year of fee payment: 10

LAPS Lapse due to unpaid annual fee