KR20050088698A - 휴대폰의 음성구간 검출방법 - Google Patents

휴대폰의 음성구간 검출방법 Download PDF

Info

Publication number
KR20050088698A
KR20050088698A KR1020040014113A KR20040014113A KR20050088698A KR 20050088698 A KR20050088698 A KR 20050088698A KR 1020040014113 A KR1020040014113 A KR 1020040014113A KR 20040014113 A KR20040014113 A KR 20040014113A KR 20050088698 A KR20050088698 A KR 20050088698A
Authority
KR
South Korea
Prior art keywords
section
voice
mobile phone
vocoder rate
determining
Prior art date
Application number
KR1020040014113A
Other languages
English (en)
Inventor
양태영
Original Assignee
엘지전자 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 엘지전자 주식회사 filed Critical 엘지전자 주식회사
Priority to KR1020040014113A priority Critical patent/KR20050088698A/ko
Publication of KR20050088698A publication Critical patent/KR20050088698A/ko

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/20Speech recognition techniques specially adapted for robustness in adverse environments, e.g. in noise, of stress induced speech
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Telephone Function (AREA)
  • Mobile Radio Communication Systems (AREA)

Abstract

본 발명은 음성인식 기능을 구비한 휴대폰에서 보코더 레이트 정보를 이용하여 음성구간을 검출하는 기술에 관한 것이다. 이러한 본 발명은, 음성인식모드에서 마이크를 통해 입력되는 신호를 CDMA 패킷으로 변환하는 제1과정과; 상기 CDMA 패킷들에 포함된 보코더 레이트가 4인 구간은 음성 프레임으로 판단하는 제2과정과; 상기 음성 프레임이 특정 조건을 만족할 때 해당 구간을 음성신호 구간으로 판단하는 제3과정에 의해 달성된다.

Description

휴대폰의 음성구간 검출방법{END-POINT DETECTION METHOD IN MOBILE PHONE}
본 발명은 음성인식 기능을 구비한 휴대폰에서 음성구간을 검출하는 기술에 관한 것으로, 특히 CDMA 방식의 휴대폰에서 CDMA 패킷 중 보코더 레이트(vocoder rate) 정보를 이용하여 음성구간을 검출할 수 있도록 한 휴대폰의 음성구간 검출방법에 관한 것이다.
근래 들어, 휴대폰의 보급률이 급속히 증가되어 현대인의 생활 필수품으로 자리매김되고 있는 실정에 있다. 이와 같은 휴대폰은 고유의 음성통화 서비스는 물론, 각종 데이터 전송 서비스와 다양한 부가서비스를 제공하므로 기능상 멀티미디어 통신기기라 할 수 있다.
최근 들어, 음성인식 기능을 탑재한 휴대폰이 출시되어 사용자들로부터 좋은 반응을 얻고 있다. 이와 같은 휴대폰에서, 사용자가 음성인식 기능을 이용하고자 하는 경우 특정 버튼을 누른 후 음을 발성하게 되는데, 시스템에서는 그 음성을 인식하여 해당 기능이 수행되도록 제어한다.
상기와 같이 사용자가 음성인식 기능을 이용하기 위해 특정 버튼을 누르면, 마이크를 동작시키고 그 마이크를 통해 음성신호가 입력되기를 기다리게 되는데, 이후 임의의 시간에 사용자의 음성이 입력되므로 사용자의 음성명령 앞과 뒤에는 묵음 또는 잡음이 존재하게 된다.
따라서, 음성 구간과 비음성 구간을 정확하게 검출할수록 높은 음성인식 성능을 기대할 수 있게 된다.
그런데, 종래의 휴대폰에 있어서는 음성인식을 위한 음성구간을 검출할 때 매 프레임 신호의 에너지를 구하고, 이를 근거로 음성구간 여부를 판단하였다.
이와 같이 음성인식 기능이 구비된 종래의 휴대폰에 있어서는 입력신호에 대한 매 프레임의 에너지를 구하고 이를 근거로 음성구간 여부를 판단하게 되어 있으므로, 부가적인 계산과정이 추가되어 인식속도가 저하되는 문제점이 있었다.
따라서, 본 발명의 목적은 휴대폰에서의 음성인식을 위해 보다 정확하게 음성 구간을 검출하는데 있다.
본 발명의 다른 목적은 음성 구간을 검출할 때 CDMA 패킷 중 에너지 정보와 보코더 레이트 정보를 이용하여 음성구간을 검출하는데 있다.
본 발명의 제1특징에 따르면, 휴대폰 음성인식에서 CDMA 형태로 변환된 패킷 중 보코더 레이트 정보를 이용하여 사용자의 음성구간을 판별한다.
본 발명의 제2특징에 따르면, 보코더 레이트의 구간값 중 4 구간을 음성 프레임으로 판단하고, 이렇게 판단된 음성프레임들이 특정 조건을 만족할 때 해당 구간을 음성신호 구간으로 판단하게 된다.
본 발명에 의한 휴대폰의 음성구간 검출방법은, 음성인식모드에서 마이크를 통해 입력되는 신호를 CDMA 패킷으로 변환하는 제1과정과; 상기 CDMA 패킷들에 포함된 보코더 레이트가 4인 구간은 음성 프레임으로, 2인 구간은 비음성 프레임으로, 3 또는 1인 구간은 보코더 레이트가 4 또는 2인 구간이 연장된 것으로 판단하는 제2과정과; 상기 음성 프레임으로 판단된 프레임 수가 일정 수 이상이거나, 보코더 레이트가 4인 구간 중 에너지가 주변잡음 에너지보다 일정치 이상 큰 구간을 음성신호 구간으로 판단하는 제3과정으로 이루어지는 것으로, 이와 같이 이루어지는 본 발명의 음성구간 검출과정을 첨부한 도 1을 참조하여 상세히 설명하면 다음과 같다.
사용자가 휴대폰에서 음성인식 기능을 이용하고자 하는 경우 먼저 특정 버튼을 누르게 되는데, 이때 시스템에서는 마이크를 동작시키고 그 마이크를 통해 음성신호가 입력되기를 기다린다.(S1,S2)
이어서, 사용자는 휴대폰의 여러 기능 중 목적한 기능을 실행시키기 위해 임의의 명령어를 발성하거나 인명을 발성하게 된다.
사용자의 음성은 매 단위시간(프레임)마다 CDMA 패킷으로 변환되는데, 이 때 음성의 앞과 뒤에는 묵음 또는 잡음이 존재하게 되며 이들도 음성과 같이 패킷으로 변환된다. 따라서, 음성의 시작과 끝을 정확히 검출하여야 음성인식 성능이 향상된다.(S3)
그런데, 본 발명에서는 상기 패킷들에 포함된 정보 중의 하나인 보코더 레이트 정보를 이용하여 음성 구간을 판별한다. 상기 보코더 레이트는 1,2,3,4의 네 가지 값을 갖게 되는데, 입력 신호가 클수록 2,3,4로 증가한다. 1의 값을 갖는 경우는 패킷에 에러가 발생했다는 의미이다. 구체적인 판단 기준은 다음과 같다.
보코더 레이트가 4인 구간은 음성 프레임으로 판단하고, 2인 구간은 비음성 프레임으로 판단한다.(S4-S7)
상기 보코더 레이트가 3인 구간은 가장 최근의 보코더 레이트가 4 또는 2인 구간이 연장된 것으로 판단하고, 1인 구간은 프레임은 패킷에 에러가 발생하여 가장 최근의 보코더 레이트가 4 또는 2인 구간이 연장된 것으로 판단한다.(S8-S10)
이후, 상기 판단 결과를 근거로 음성신호 구간을 최종적으로 판단하게 되는데, 음성 프레임으로 판단된 프레임 수가 일정 수(N) 이상이면 음성신호가 검출된 것으로 판단한다.(S11,S12)
또 다른 예로써, 상기 보코더 레이트가 4인 구간 중 에너지가 주변잡음 에너지보다 일정치 이상 큰 구간을 음성신호 구간으로 판단한다. 이때, 주변잡음 에너지는 보코더 레이트가 2인 비음성 구간의 에너지를 평균하여 구한다.(S13,S14)
이상에서 상세히 설명한 바와 같이 본 발명은 휴대폰의 음성인식 시스템에서 CDMA 패킷 중 보코더 레이트 정보를 이용하여 음성구간을 검출할 수 있도록 함으로써, 음성 검출을 위한 별도의 계산과정이 불필요하여 음성인식 속도가 향상되고 음성인식을 위한 별도의 비용이 추가되지 않는 효과가 있다.
도 1a 및 도 1b는 본 발명에 의한 휴대폰의 음성구간 검출방법의 처리과정을 나타낸 신호 흐름도.

Claims (5)

  1. 음성인식모드에서 마이크를 통해 입력되는 신호를 CDMA 패킷으로 변환하는 제1과정과; 상기 CDMA 패킷들에 포함된 보코더 레이트가 4인 구간은 음성 프레임으로 판단하는 제2과정과; 상기 음성 프레임이 특정 조건을 만족할 때 해당 구간을 음성신호 구간으로 판단하는 제3과정으로 이루어지는 것을 특징으로 하는 휴대폰의 음성구간 검출방법.
  2. 제1항에 있어서, 제2과정은 상기 보코더 레이트가 2인 구간은 비음성 프레임으로, 3 또는 1인 구간은 보코더 레이트가 4 또는 2인 구간이 연장된 것으로 판단하는 단계를 더 포함하여 이루어지는 것을 특징으로 하는 휴대폰의 음성구간 검출방법.
  3. 제1항에 있어서, 제3과정은 상기 음성 프레임으로 판단된 프레임 수가 일정 수 이상일 때 해당 구간을 음성신호 구간으로 판단하는 단계를 포함하여 이루어지는 것을 특징으로 하는 휴대폰의 음성구간 검출방법.
  4. 제1항에 있어서, 제3과정은 보코더 레이트가 4인 구간 중 에너지가 주변잡음 에너지보다 일정치 이상 큰 구간을 음성신호 구간으로 판단하는 단계를 포함하여 이루어지는 것을 특징으로 하는 휴대폰의 음성구간 검출방법.
  5. 제4항에 있어서, 주변잡음 에너지는 보코더 레이트가 2인 비음성 구간의 에너지를 평균하여 구하는 것을 특징으로 하는 휴대폰의 음성구간 검출방법.
KR1020040014113A 2004-03-02 2004-03-02 휴대폰의 음성구간 검출방법 KR20050088698A (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020040014113A KR20050088698A (ko) 2004-03-02 2004-03-02 휴대폰의 음성구간 검출방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020040014113A KR20050088698A (ko) 2004-03-02 2004-03-02 휴대폰의 음성구간 검출방법

Publications (1)

Publication Number Publication Date
KR20050088698A true KR20050088698A (ko) 2005-09-07

Family

ID=37271331

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020040014113A KR20050088698A (ko) 2004-03-02 2004-03-02 휴대폰의 음성구간 검출방법

Country Status (1)

Country Link
KR (1) KR20050088698A (ko)

Similar Documents

Publication Publication Date Title
CN101911730B (zh) 向用户发信号通知麦克风遮盖
US8600454B2 (en) Decisions on ambient noise suppression in a mobile communications handset device
US9524735B2 (en) Threshold adaptation in two-channel noise estimation and voice activity detection
US9100756B2 (en) Microphone occlusion detector
US8606573B2 (en) Voice recognition improved accuracy in mobile environments
US8594744B2 (en) System and methods for adaptively switching a mobile device's mode of operation
CN101911723A (zh) 通过在来自多个麦克风的信号之间智能地进行选择而改善声音质量
CN101207663A (zh) 网络通信装置及消除网络通信装置的噪音的方法
WO2009088431A1 (en) Method and apparatus for detecting and suppressing echo in packet networks
JP2000059496A (ja) 携帯通信装置においてスピ―カフォン動作を行うための方法および装置
JP2010061151A (ja) 雑音環境のための音声活動検出器及び有効化器
CN103262517A (zh) 指示在呼叫中存在瞬态噪声的方法及其装置
JP2004133403A (ja) 音声信号処理装置
US7246059B2 (en) Method for fast dynamic estimation of background noise
US7171004B2 (en) Room acoustics echo meter for voice terminals
JP4888262B2 (ja) 通話状態判定装置および該通話状態判定装置を備えたエコーキャンセラ
EP3821429B1 (en) Transmission control for audio device using auxiliary signals
KR20050088698A (ko) 휴대폰의 음성구간 검출방법
CA2581591A1 (en) System and methods for adaptively switching a mobile device's mode of operation
JP2004165865A (ja) 電話機及び受話音量調整方法
JP3517306B2 (ja) 自動音声応答機能付き電話機
JP5628066B2 (ja) ハンズフリーインターホン装置
JP4918118B2 (ja) 通話区間検出装置、その方法、プログラム
JP2006343642A (ja) 音声認識方法、音声認識装置、プログラム、記録媒体
JPS6212249A (ja) 音声スイツチ装置

Legal Events

Date Code Title Description
WITN Withdrawal due to no request for examination