KR20030008726A - 음성인식에 따른 오동작을 방지 및 음성인식율을 향상 할수 있는 전자기기 및 방법 - Google Patents

음성인식에 따른 오동작을 방지 및 음성인식율을 향상 할수 있는 전자기기 및 방법 Download PDF

Info

Publication number
KR20030008726A
KR20030008726A KR1020010043581A KR20010043581A KR20030008726A KR 20030008726 A KR20030008726 A KR 20030008726A KR 1020010043581 A KR1020010043581 A KR 1020010043581A KR 20010043581 A KR20010043581 A KR 20010043581A KR 20030008726 A KR20030008726 A KR 20030008726A
Authority
KR
South Korea
Prior art keywords
sound
signal
audio signal
unit
voice
Prior art date
Application number
KR1020010043581A
Other languages
English (en)
Other versions
KR100552468B1 (ko
Inventor
오윤학
차순백
Original Assignee
삼성전자 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 삼성전자 주식회사 filed Critical 삼성전자 주식회사
Priority to KR1020010043581A priority Critical patent/KR100552468B1/ko
Priority to US10/101,718 priority patent/US20030018479A1/en
Priority to CNB021055165A priority patent/CN1188829C/zh
Priority to EP02252890A priority patent/EP1278183B1/en
Priority to DE60217444T priority patent/DE60217444T2/de
Priority to JP2002208771A priority patent/JP2003044069A/ja
Publication of KR20030008726A publication Critical patent/KR20030008726A/ko
Application granted granted Critical
Publication of KR100552468B1 publication Critical patent/KR100552468B1/ko

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/018Audio watermarking, i.e. embedding inaudible data in the audio signal
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0272Voice signal separating

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Quality & Reliability (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Details Of Television Systems (AREA)
  • Selective Calling Equipment (AREA)

Abstract

음성인식에 따른 오동작을 방지 및 음성 인식율을 향상 할 수 있는 전자기기가 개시된다. 음성인식에 따른 오동작 방지용 전자기기는, 오디오신호를 출력하는 스피커, 외부로부터 입력되는 음향을 수신하는 음향수신부, 음향수신부에서 수신된 음향의 신호에서 삽입된 워터마크정보를 찾는 검출부, 워트마크가 검출되었을 경우 검출부에서 추출한 음향 스펙트럼을 이용한 음향 제거부, 음향신호의 에너지크기로 음성신호의 유무를 판단하는 음성신호 판단부, 음향을 인식하여 음향에 해당되는 명령을 출력하는 음성인식부, 및 명령을 수령하여 명령에 대응되는 동작을 제어하는 제어부를 포함한다. 스피커에서 출력되는 음향은 제거되어 사용자의 음성에 대해서만 음성인식을 하므로, 전자기기의 오동작을 방지할 수 있다.

Description

음성인식에 따른 오동작을 방지 및 음성인식율을 향상 할 수 있는 전자기기 및 방법{an electronic-apparatus and method for preventing mis-operation and rising speech recognition rate according to sound recognizing}
본 발명은 텔레비전 등과 같은 전자기기에 관한 것으로서, 보다 상세하게는, 음성인식을 통한 동작의 제어가 가능한 전자기기에 관한 것이다.
음성인식기술의 발전에 따라, 사용자가 발성한 음성을 인식하여 이에 대응되는 명령을 입력하여 동작을 제어할 수 있는 전자기기가 개발되어 있다. 이러한 전자기기는 사용자가 음성으로 "재생", "녹화" 등을 발성하면, 이 발성음을 음성패턴인식하여 해당되는 명령어 코드를 출력하고 이에 따른 동작을 수행하도록 제어한다.
도 1은 이러한 음성인식을 통한 동작의 제어가 가능한 전자기기의 예로서 텔레비전을 개략적으로 도시한 도면이다. 종래의 텔레비전은 방송신호를 수신하는 튜너(1), VTR(Video Tape Recoder)과 같은 영상재생장치로부터 재생된 신호를 수신하기 위한 외부신호입력부(2), 튜너(1) 및 외부신호입력부(2)에서 입력된 신호를 선택적으로 출력하는 마이콤(3), 마이콤(3)에서 출력된 신호중에서 영상신호를 증폭하는 영상증폭부(4), 증폭된 영상신호를 디스플레이하는 화면(7), 마이콤(3)에서출력된 신호중 오디오신호를 증폭하는 오디오증폭부(5), 및 증폭된 오디오신호를 청취 가능하도록 증폭 출력하는 스피커(6)를 갖는다. 또한, 종래의 텔레비전은 사용자로부터 제어신호를 입력하도록 하는 키입력부(8)가 마련되어 있다.
또한, 텔레비전은 사용자의 음성을 인식하여 이에 대응되는 명령을 마이콤(3)에 전송하는 음성인식부(9), 및 사용자로부터 발성된 음향을 수취하여 음성인식부(9)에 무선으로 전송하는 무선마이크(10)를 갖는다. 이때, 음성인식부(9)에는 사용자의 음성에 대한 주파수대역정보가 저장된다. 이러한 음성인식부(9)는 사용자의 음성에 대한 주파수대역의 음향신호는 통과시키고, 이외의 주파수대역의 음향은 차단하는 통과필터(미도시)가 마련되어 있다. 한편, 무선마이크(10)는 무선으로 텔레비전의 동작을 제어할 수 있는 키입력패널(미도시)이 마련되어 있어 무선리모콘의 기능을 가지고 있다. 이러한 무선마이크(10)에는 텔레비전에 대한 일반모드 및 음성인식모드로의 전환이 가능한 모드전환키가 마련되어 있다.
종래의 음성인식을 통한 텔레비전의 동작제어는 텔레비전 시청도중에 사용자가 무선마이크(10)에 마련된 모드전환키를 선택하여 텔레비전을 음성인식모드로 전환한다. 텔레비전이 음성인식모드로 전환되면, 사용자가 무선마이크(10)로 해당 명령에 대응되는 음성을 발성한다. 이때, 무선마이크(10)에는 사람의 음성뿐만 아니라 스피커(6)를 통해 출력된 오디오의 음향도 함께 수취되고, 이렇게 수취된 두 가지의 신호는 음성인식부(9)에 함께 제공된다. 여기서, 음성인식부(9)는 설정된 주파수대역에 해당하는 사용자의 음향신호는 통과시키고, 스피커(6)에서 출력된 오디오신호를 비롯한 나머지신호에 대해서는 차단한다. 이에 따라, 음성인식부(9)는수신된 사용자의 음성을 음성패턴인식하여 이에 대응하는 명령을 추출하여 마이콤(3)에 전송한다.
그런데, 이러한 종래의 텔레비전의 음성인식부(9)는 스피커(6)에서 출력되는 오디오신호의 음향 주파수대역이 사용자의 음향 주파수대역과 겹치는 대역이 발생할 경우, 오디오신호의 음향을 따로 분리하여 제거하는데 어려움이 있다. 또한, 스피커(6)에서 출력되는 오디오신호의 음향이 음성인식부(9)의 설정된 통과필터대역에 해당하고 텔레비전의 동작을 제어할 수 있는 음향에 해당하는 경우, 음성인식부(9)는 스피커(6)에서 출력된 음향을 제어신호로 오인하여 텔레비전이 오동작하게 되는 요인을 제공하는 문제점이 있다.
이러한, 문제점을 완화하기 위해 텔레비전을 시청하는 도중에 스피커(6)의 출력을 묵음(mute)시키고 무선마이크(10)를 통해 사용자가 제어명령에 해당하는 음성을 발성할 수 있다. 이에 따라, 음성인식부(9)는 사용자의 음성만을 수취하게 되어 이에 대응하는 명령을 마이콤(3)에 전송할 수 있다. 그런데, 이는 음성인식은 수행하는 동안은 사용자가 스피커(6)에서 출력되는 음향을 청취할 수 없어 텔레비전 시청에 대한 불편함이 따르게된다.
이러한 문제점은, 음향을 출력할 수 있는 전자기기와 음성을 수취하여 이에 따른 동작을 수행할 수 있는 전자기기 사이에서도 동일하게 발생한다. 음향을 출력할 수 있는 전자기기의 예로는 텔레비전 및 라디오 등을 들 수 있다. 또한, 음성을 수취하여 이에 따른 동작을 수행할 수 있는 전자기기의 예로는 텔레비전, 라디오, VTR, 전기밥솥, 청소기, 에어컨, 선풍기 등과 같은 전기신호를 통해 동작되는 모든 전자기기를 들 수 있다.
음향을 출력할 수 있는 라디오 및 음성을 수취하여 이에 따른 동작을 수행할 수 있는 선풍기를 예로 하여 종래의 음성인식을 통한 동작을 설명하면, 라디오에서 선풍기가 인식할 수 있는 주파수대역이면서 선풍기가 동작할 수 있는 음향이 출력되면, 선풍기는 라디오에서 출력된 음향을 사용자의 제어 음성으로 오인하여 이에 대응되는 동작을 수행하게 된다. 이에 따라, 선풍기는 사용자가 원하지 않는 오동작을 수행하게 되는 문제점이 있다. 또한, 라디오에서 출력된 음향과 사용자의 음향이 동시에 입력될 경우, 오디오신호의 음향을 따로 분리하여 제거하는데 어려움이 있어서 음성인식명령이 제대로 수행되지 않을 수 있다.
상기와 같은 문제점을 해결하기 위한 본 발명의 목적은, 스피커를 통해 출력되는 음향이 음성인식부에 수취됨에 따른 오동작을 방지할 수 있는 음성인식을 통한 제어가 가능한 전자기기를 제공하는데 있다.
또한, 본 발명의 다른 목적은, 스피커를 통해 오디오신호를 출력시 출력되는 음향에 대한 정보가 포함된 음향을 출력할 수 있는 전자기기를 제공하는데 있다.
한편, 본 발명의 또 다른 목적은, 판별이 가능한 정보가 포함된 음향을 수취하여 수취된 음향에 대한 판별이 가능한 음성인식을 통한 동작 제어가 가능한 전자기기를 제공하는데 있다.
도 1은 음성인식을 통한 동작의 제어가 가능한 텔레비전을 개략적으로 도시한 도면,
도 2는 본 발명에 따른 음성인식에 따른 오동작을 방지 및 음성인식율을 향상 할 수 있는 전자기기의 바람직한 실시예를 도시한 도면,
도 3은 도 2의 판별부를 상세히 도시한 블록도, 그리고
도 4는 본 발명에 따른 전자기기의 음성인식을 통한 오동작을 방지 및 음성인식율을 향상 할 수 있는 방법의 바람직한 실시예가 도시된 순서도이다.
* 도면의 주요 부분에 대한 부호의 설명 *
21 : 튜너부 22 : 외부신호입력부
23 : 전원부 24 : 마이콤
25 : 키입력부 26 : 영상증폭부
27 : 표시부 28 : 화면
30 : 오디오증폭부 31 : 스피커
40 : 워터마크발생부 50 : 음향수신제어부
52 : 음향수신부 54 : 판별부
54a : 검출부 54b : 음향제거부
54c : 검출부56 : 음성인식부
60 : 무선마이크
상기와 같은 목적을 달성하기 위한 본 발명에 따른 오동작을 방지할 수 있는전자기기는, 오디오신호를 출력하는 스피커, 외부로부터 입력되는 음향을 수신하는 음향수신부, 음향수신부에서 수신된 음향의 신호에서 삽입된 워터마크정보를 찾는 검출부, 워트마크가 검출되었을 경우 검출부에서 추출한 음향 스펙트럼을 이용한 음향 제거부, 음향신호의 에너지크기로 음성신호의 유무를 판단하는 음성신호 판단부, 음향을 인식하여 음향에 해당되는 명령을 출력하는 음성인식부, 및 명령을 수령하여 명령에 대응되는 동작을 제어하는 제어부를 포함한다.
바람직하게는, 본 발명의 전자기기는, 오디오신호에 대한 스펙트럼정보가 포함된 워터마크정보를 오디오신호에 부가하는 음향정보제공부를 더 포함하며, 이에 따라 검출부는 음향의 신호에서 워트마크로 삽입된 스펙트럼 정보를 검출하고, 워트마크가 검출되었을 경우 음향 제거부에서는 검출된 스펙트럼을 이용하여 음향을 제거한다. 한편, 본 발명의 전자기기는 사용자의 선택에 따라 음향정보제공부의 동작여부에 대한 모드의 설정이 가능하다.
한편, 상기와 같은 목적을 달성하기 위한 본 발명에 따른 음성인식에 따른 오동작을 방지방법은, a) 스피커를 통해 오디오신호를 출력하는 단계, b) 음향의 신호에 오디오신호가 부가되어 있는 것으로 판단되면, 오디오 신호를 제거하고 음성신호만을 음성 인식부로 전송하는 단계, c) 음향을 인식하여 음향에 해당하는 명령을 출력하는 단계, 및 d) 명령을 수령하여 명령에 대응하는 동작을 제어하는 단계를 포함한다.
바람직하게는, 본 발명의 음성인식에 따른 오동작을 방지방법은, a)단계 전에, 오디오신호에 대한 스펙트럼정보가 포함된 워터마크정보를 오디오신호에 부가하는 단계를 더 포함한다.
본 발명에 따르면, 텔레비전의 음성인식모드에서 스피커에서 출력되는 오디오신호에 워터마크정보를 부가하여, 외부에서 수신된 음향의 신호에 대해 검출부, 음향제거부 및 음성신호판단부가 수신된 음향의 신호에 대한 워터마크정보의 유무를 판별하여 사용자의 음성신호를 검출함으로써 음성인식을 통한 전자기기의 오동작을 방지할 수 있다.
이하, 도면을 참조하여 본 발명을 상세히 설명한다.
도 2는 본 발명에 따른 음성인식에 따른 오동작을 방지할 수 있는 전자기기의 바람직한 실시예를 도시한 도면이다. 참고로, 본 실시예는 텔레비전을 일 예로 설명한다. 도면을 참조하면, 본 발명의 전자기기는, 방송신호를 수신하는 튜너(21), VTR 및 DVDP 등과 같은 영상재생장치로부터 재생된 신호를 수신하는 외부신호입력부(22), 튜너(21) 및 외부신호입력부(22)에서 입력된 신호를 선택적으로 출력하는 마이콤(24), 마이콤(24)에 전원을 인가하는 전원부(23), 마이콤(24)을 통한 해당 동작의 제어를 위한 키를 입력하도록 마련된 키입력부(25), 음성인식을 통해 해당 동작에 대한 마이콤(24)을 제어하기 위한 음향수신제어부(50)를 갖는다.
도면에 따른 텔레비전은 마이콤(24)에서 출력된 신호중에서 영상신호를 증폭하는 영상증폭부(26), 증폭된 영상신호를 표시 가능한 포맷으로 변환하는 표시부(27), 및 포맷이 변된 영상신호를 디스플레이하기 위한 화면(28)을 갖는다. 또한, 도면에 따른 텔레비전은 마이콤(24)에서 출력된 신호중에서 오디오신호를 증폭하는 오디오증폭부(30), 증폭된 오디오신호에 대한 스펙트럼정보를 추출하여 추출된 스펙트럼정보를 증폭된 오디오신호에 부가하는 워터마크(water mark)발생부(40), 및 스펙트럼정보가 부가된 오디오신호를 청취 가능한 음향으로 증폭출력하는 스피커(31)를 갖는다.
한편, 음향수신제어부(50)는, 무선마이크(60)로부터 입력되는 음향신호를 수신하는 음향수신부(52), 음향수신부(52)에 수신된 음향의 신호가 스피커(31)에서 출력된 신호인지 사용자의 음성신호인지를 판별하는 판별부(54), 및 판별부(54)에서 음향의 신호가 사용자의 음성신호인 것으로 판단되면 수신된 음향에 대한 음성패턴인식을 통해 해당 명령을 추출하여 마이콤(24)에 전송하는 음성인식부(56)를 갖는다.
도 3은 도 2의 판별부(54)를 상세히 도시한 블록도이다. 도면에 따른 판별부(54)는, 음향수신부(52)에서 수신된 음향의 신호에서 삽입된 워터마크정보를 찾는 검출부(54a), 워트마크정보가 검출되었을 경우 검출부(54a)에서 추출한 음향 스펙트럼을 이용하여 워터마크정보가 포함된 오디오신호를 제거하는 음향제거부(54b), 오디오신호가 제거된 음향신호 중에서 음향신호의 에너지크기를 통해 음성신호의 유무를 판단하는 음성신호판단부(54c)를 갖는다.
무선마이크(60)는 무선으로 텔레비전의 동작을 제어할 수 있는 키입력패널(미도시)이 마련되어 있어 무선리모콘의 기능을 가지고 있다. 이러한 무선마이크(60)에는 텔레비전시청에 대한 일반모드 및 음성인식모드로의 전환이 가능한 모드전환키가 마련되어 있다. 여기서, 일반모드란, 무선마이크(60)의 키선택 및 키입력부(25)의 키선택에 따라 마이콤(24)의 동작을 제어하여 텔레비전을 시청하는 모드를 말한다. 또한, 음성인식모드란, 음향수신제어부(50)를 통해 음성을 수취함으로써 이에 대한 마이콤(24)을 제어할 수 있는 모드를 말한다.
한편, 워터마크발생부(40)의 동작은 무선마이크(60)를 통한 음성인시모드선택시에만 선택적으로 동작하도록 설정되어 있다. 바람직하게는, 사용자가 무선마이크(60)의 모드전환키를 선택하여 음성인식모드로 전환하면, 음향수신제어부(50)는 음성인식모드로 전환됨을 알리는 신호를 마이콤(24)에 전송한다. 이에 따라, 마이콤(24)은 일반모드에서는 워터마크발생부(40)의 동작 없이 증폭된 오디오신호를 스피커(31)로 출력한다. 또한, 마이콤(24)은 음향수신제어부(50)로부터 음성인식모드로 전환됨을 알리는 신호가 수신되면, 워터마크발생부(40)를 제어하여 증폭된 오디수신호에 오디오신호에 대한 스펙트럼정보를 부가하도록 하여 스피커(31)로 출력한다. 이때, 오디오신호에 대한 스펙트럼정보를 워터마크정보라한다. 이러한 워터마크정보는 원신호의 질에는 영향을 미치지 않고 원신호에 대한 정보를 원신호에 내포하는 은닉정보이다. 따라서, 워터마크정보가 포함된 오디오신호가 스피커(31)로 출력되더라도, 사용자는 오디오신호에 대응되는 음향만을 청취하게 된다.
한편, 워터마크발생부(40)에서 오디오신호에 대한 스펙트럼정보를 추출하여 워터마크정보를 산출하는 것은 일반적으로 오디오신호를 샘플링하고 스펙트럼변환을 통해 계수를 산출하는 선형예측변환(Linear Predictive Coding : LPC)이 사용된다. 이에 따라, 검출부(54a)에서는 음향수신부(52)에서 수신된 음향의 신호에서 워터마크정보로 삽입된 스펙트럼정보를 찾고, 음향제거부(54b)에서는 검출부(54a)에서 추출한 음향의 스펙트럼 정보를 이용하여 워터마크정보가 포함된 음향신호를제거하고한다. 이때, 음성신호판단부(54c)에서는 수신된 음향의 신호들 중에서 오디오신호가 제거되고 잔존하는 음향 신호의 에너지크기가 문턱치보다 작으면 음성신호가 없는 것으로 판단하여 종료하고, 문턱치보다 크면 음성신호가 존재한다고 판단하여 음성인식부(56)에 전달한다. 음성인식부(56)에서는 음성패턴인식을 통해 입력된 음성신호를 인식하여 해당명령을 추출한다. 이렇게 추출된 명령은 마이콤(24)으로 전송되어 마이콤(24)을 통해 해당 동작이 수행되도록 한다.
따라서, 음성인식모드로 전환된 상태에서 오디오신호가 스피커(31)로 출력되기 전에 워터마크발생부(40)에서 오디신호에 대한 워터마크정보를 추출하여 오디오신호에 부가하여 스피커(31)를 통해 출력함으로써, 판별부(54)의 음성인식판별시 워터마크정보에 기초하여 오디오신호를 추출할 수 있다.
이에 따라, 음성인식부(56)는 수신된 음향의 신호중에서 음성신호에 대해서만 음성패턴인식하여 해당 명령을 추출하고, 마이콤(24)은 잘못된 음성인식에 따른 전자기기의 오동작을 방지할 수 있다.
한편, 도면의 텔레비전에 대해 사용자의 음성을 통해 제어가 가능한 명령으로는 전원의 온/오프(on/off), 채널의 선택, 볼륨조절, 사운드의 묵음(mute) 등을 들 수 있다. 전원의 온/오프는 전원부(23)로부터 인가된 전원을 마이콤(24)이 각 부에 전송하는 전원차폐동작을 제어하는 것이고, 채널의 선택은 해당 채널의 숫자를 음성으로 발성하면 해당 채널이 선곡될 수 있도록 마이콤(24)을 제어하는 것이다. 또한, 볼륨조절은 사용자가 음성으로 "크게", "작게" 등을 발성하면, 이에 대응하여 볼륨의 높낮이가 조절되도록 마이콤(24)이 오디오증폭부(30)를 제어하도록하는 것이다. 한편, 사운드의 묵음은 사용자가 "묵음"이라는 음성을 발성하면, 이에 따라 마이콤(24)이 오디오증폭부(30)를 제어하여 오디오신호의 출력을 차폐시키는 것을 말한다.
도 4은 본 발명에 따른 전자기기의 음성인식을 통한 오동작을 방지할 수 있는 방법에 대한 바람직한 실시예가 도시된 순서도이다. 도면을 참조하면, 먼저 전원이 켜진(on)상태에서 방송신호 또는 재생장치로부터 입력된 재생신호를 수신하여 이에 대응하는 동작을 수행하는 상태에서, 마이콤(24)은 현재 제어신호입력모드가 무선마이크(60)의 모드키의 선택에 따라 음성모드인지를 판단한다(S42). S42단계에서 음성모드가 아닌 것으로 판단되면, 마이콤(24)은 수신된 방송신호 및 재생신호를 일반모드에서 화면(28) 및 스피커(31)에 출력되도록 한다(S44). S42단계에서 현재 음성모드인것으로 판단되면, 마이콤(24)은 워터마크발생부(40)를 제어하여 증폭된 오디오신호에 워터마크정보를 부가하도록 한다(S46). 이렇게 워터마크정보가 부가된 오디오신호는 스피커(31)를 통해 외부로 증폭출력된다(S48).
한편, 검출부(54a)는 수신된 음향의 신호들 중에 워터마크정보가 존재하는지의 여부를 검출한다(S52). S52단계에서 수신된 음향의 신호들 중에 워터마크정보가 존재하는 신호가 검출되면, 수신된 음향의 신호들 중에 스피커(31)에서 출력된 오디오신호가 존재함을 알 수 있다. 따라서, 음향제거부(54b)는 수신된 음향의 신호들 중에 워터마크정보가 존재하는 것으로 검출된 신호, 즉 스피커(31)에서 출력된 오디오신호를 추출하여 제거한다(S54).
또한, 음성신호판단부(54c)는 수신된 음향의 신호들 중에서 오디오신호가 제거되고 잔존하는 음향의 신호의 에너지를 문턱치와 비교하여 음성신호의 존재여부를 판단한다(S56). 수신된 음향의 신호들 중에서 오디오신호가 제거되고 잔존하는 음향 신호의 에너지크기가 문턱치보다 작으면 음성신호가 없는 것으로 판단하여 종료하고, 문턱치보다 크면 음성신호가 존재한다고 판단하여 음성인식부(56)에 전달한다(S58).
한편, S52단계에서 수신된 음향의 신호들 중에 워터마크정보가 존재하지 않는 것으로 판단되면, 음성신호 판단부(54c)로 전달되고, 음성신호 판단부(54c)는 수신된 음향의 신호의 에너지를 문턱치와 비교하여 음성신호의 존재여부를 판단한다(S56). 음향 신호의 에너지크기가 문턱치보다 작으면 음성신호가 없는 것으로 판단하여 종료하고, 문턱치보다 크면 음성신호가 존재한다고 판단하여 음성인식부(56)에 전달한다(S58).
S58단계에서 음성신호로 판별도어 입력된 음성신호에 대해 음성인식부(56)는 수신된 음성신호에 대한 음성패턴인식을 통해 해당 음성신호에 대응되는 명령을 마이콤(24)에 출력한다(S60). 한편, 마이콤(24)은 수신된 명령에 대응하여 텔레비전의 동작을 제어한다(S62).
따라서, 텔레비전의 음성인식모드에서 스피커(31)에서 출력되는 오디오신호에 워터마크정보를 부가함으로써, 무선마이크(60)를 통해 전송되어 수신된 음향의 신호에 대해 판별부(54)가 수신된 음향의 신호에 대한 워터마크정보의 유무를 판별하여 사용자의 음성신호를 검출함으로써 음성인식을 통한 텔레비전의 오동작을 방지할 수 있다.
한편, 상술한 본 발명에 따른 실시예에서는 워터마크발생부(40) 및 음향수신제어부(50)가 복합된 하나의 전자기기에 대해 설명하고 있지만, 워터마크발생부(40) 및 음향수신제어부(50)가 이종의 전자기기에 각각 존재하는 경우에도 본 실시예가 동일하게 적용될 수 있다. 즉, 스피커를 통해 오디오신호를 출력할 수 있는 전자기기에는 스피커의 전단에 워터마크발생부(40)를 부가하고, 음성인식을 통해 동작이 가능한 전자기기에는 음향수신제어부(50)를 부가하면, 본 실시예가 동일하게 적용될 수 있다.
본 발명에 따르면, 음성인식모드로 전환된 상태에서 오디오신호가 스피커(31)로 출력되기 전에 워터마크발생부(40)에서 오디오신호에 대한 워터마크정보를 추출하여 오디오신호에 부가하여 스피커(31)를 통해 출력함으로써, 판별부(54)의 음성인식판별시 워터마크정보에 기초하여 오디오신호를 추출할 수 있다. 따라서, 음성인식부(56)는 수신된 음향의 신호중에서 음성신호에 대해서만 음성패턴인식하여 해당 명령을 추출하고, 이에 따라 마이콤(24)은 잘못된 음성인식에 따른 전자기기의 오동작을 방지할 수 있다.
이상에서는 본 발명의 바람직한 실시예에 대해 도시하고 설명하였으나, 본 발명은 상술한 특정의 바람직한 실시예에 한정되지 아니하며, 청구범위에서 청구하는 본 발명의 요지를 벗어남이 없이 당해 발명이 속하는 기술분야에서 통상의 지식을 가진 자라면 누구든지 다양한 변형 실시가 가능한 것은 물론이고, 그와 같은 변경은 청구범위 기재의 범위 내에 있게 된다.

Claims (13)

  1. 오디오신호를 출력하는 스피커;
    외부로부터 입력되는 음향을 수신하는 음향수신부;
    상기 음성수신부에서 수신된 상기 음향의 신호가 상기 스피커에서 출력된 상기 오디오신호인지를 판별하는 판별부;
    상기 판별부에서 상기 음향의 신호가 상기 오디오신호가 아닌 것으로 판단하는 경우, 상기 음향을 인식하여 상기 음향에 해당되는 명령을 출력하는 음성인식부; 및
    상기 명령을 수령하여 상기 명령에 대응되는 동작을 제어하는 제어부;를 포함하는 것을 특징으로 하는 전자기기.
  2. 제 1항에 있어서,
    상기 오디오신호에 소정의 식별정보를 부가하는 식별정보제공부;를 더 포함하며,
    상기 판별부는 상기 음성인식부에 수신된 신호 내에 상기 식별정보가 존재하는 지의 여부에 기초하여 상기 오디오신호인지의 여부를 판별하는 것을 특징으로 하는 전자기기.
  3. 제 2항에 있어서,
    상기 식별정보는 상기 오디오신호에 대한 스펙트럼정보가 포함된 워터마크정보이고,
    상기 식별정보제공부는 상기 오디오신호에 상기 워터마크정보를 부가하는 워터마크발생부이며,
    상기 판별부는 상기 음성인식부에 수신된 신호 내에 상기 워터마크정보가 존재하는지의 여부에 기초하여 상기 오디오신호의 여부를 판별하는 것을 특징으로 하는 전자기기.
  4. 제 3항에 있어서,
    상기 판별부는,
    상기 음향수신부에서 수신된 음향의 신호에서 삽입된 상기 워터마크정보를 찾는 검출부;
    상기 워트마크정보가 검출되었을 경우 상기 검출부에서 추출한 상기 스펙트럼정보를 이용하여 상기 워터마크정보가 포함된 상기 오디오신호를 제거하는 음향제거부; 및
    상기 오디오신호가 제거된 상기 음향신호 중에서 상기 음향신호의 에너지크기를 통해 음성신호의 유무를 판단하는 음성신호판단부;를 포함하는 것을 특징으로 하는 전자기기.
  5. 제 2항에 있어서,
    사용자의 선택에 따라 상기 식별정보제공부의 동작여부에 대한 모드의 설정이 가능한 것을 특징으로 하는 전자기기.
  6. 오디오신호에 소정의 식별정보를 부가하는 식별정보제공부; 및
    상기 식별정보가 포함된 상기 오디오신호를 출력하는 스피커;를 포함하는 것을 특징으로 하는 전자기기.
  7. 제 6항에 있어서,
    상기 식별정보는 상기 오디오신호에 대한 스펙트럼정보가 포함된 워터마크정보이며,
    상기 식별정보제공부는 상기 오디오신호에 상기 워터마크정보를 포함하여 상기 스피커에 출력하는 워터마크발생부인 것을 특징으로 하는 전자기기.
  8. 외부로부터 입력되는 음향을 수신하는 음향수신부;
    상기 음향수신부에서 수신된 상기 음향의 신호 내에 소정의 식별정보가 포함되어 있는지 여부를 판별하는 판별부;
    상기 판별부에서 상기 음향의 신호 내에 상기 식별정보가 존재하지 않는 것으로 판단하는 경우, 상기 음향을 인식하여 상기 음향에 해당되는 명령을 출력하는 음성인식부; 및
    상기 명령을 수령하여 상기 명령에 대응되는 동작을 제어하는 제어부;를 포함하는 것을 특징으로 하는 전자기기.
  9. 제 8항에 있어서,
    상기 식별정보는 상기 음향의 신호의 스펙트럼특성인 워터마크정보이며,
    상기 판별부는 상기 음성인식부에 수신된 신호 내에 상기 워터마크정보가 존재하는지의 여부에 기초하여 상기 오디오신호의 여부를 판별하는 것을 특징으로 하는 전자기기.
  10. 제 9항에 있어서,
    상기 판별부는,
    상기 음향수신부에서 수신된 음향의 신호에서 삽입된 상기 워터마크정보를 찾는 검출부;
    상기 워트마크정보가 검출되었을 경우 상기 검출부에서 추출한 상기 스펙트럼을 이용하여 상기 워터마크정보가 포함된 상기 오디오신호를 제거하는 음향제거부; 및
    상기 오디오신호가 제거된 상기 음향신호 중에서 상기 음향신호의 에너지크기를 통해 음성신호의 유무를 판단하는 음성신호판단부;를 포함하는 것을 특징으로 하는 전자기기.
  11. a) 스피커를 통해 오디오신호를 출력하는 단계;
    b) 수신된 음향의 신호에 상기 오디오신호가 부가되어 있으면, 상기 음향의 신호중에서 상기 오디오신호를 제거하는 단계;
    c) 상기 음향을 인식하여 상기 음향에 해당하는 명령을 출력하는 단계; 및
    d) 상기 명령을 수령하여 상기 명령에 대응하는 동작을 제어하는 단계;를 포함하는 것을 특징으로 하는 음향수신방법.
  12. 제 11항에 있어서,
    상기 a)단계 전에,
    상기 오디오신호에 소정의 식별정보를 부가하는 단계;를 더 포함하며,
    상기 b)단계에서는 상기 음향의 신호 내에 상기 식별정보가 존재하는지의 여부에 기초하여 상기 오디오신호인지의 여부를 판별하는 것을 특징으로 하는 음향수신방법.
  13. 제 12항에 있어서,
    상기 식별정보는 상기 오디오신호에 대한 스펙트럼정보가 포함된 워터마크정보이고,
    상기 부가단계는 상기 오디오신호에 상기 워터마크정보를 부가하며,
    상기 b)단계는 상기 음향의 신호 내에 상기 워터마크정보가 존재하는 지의 여부에 기초하여 상기 오디오신호인지의 여부를 판별하는 것을 특징으로 하는 음향수신방법.
KR1020010043581A 2001-07-19 2001-07-19 음성인식에 따른 오동작을 방지 및 음성인식율을 향상 할수 있는 전자기기 및 방법 KR100552468B1 (ko)

Priority Applications (6)

Application Number Priority Date Filing Date Title
KR1020010043581A KR100552468B1 (ko) 2001-07-19 2001-07-19 음성인식에 따른 오동작을 방지 및 음성인식율을 향상 할수 있는 전자기기 및 방법
US10/101,718 US20030018479A1 (en) 2001-07-19 2002-03-21 Electronic appliance capable of preventing malfunction in speech recognition and improving the speech recognition rate
CNB021055165A CN1188829C (zh) 2001-07-19 2002-04-12 能够防止语音识别中的错误和提高语音识别率的电子设备
EP02252890A EP1278183B1 (en) 2001-07-19 2002-04-24 Voice operated electronic appliance
DE60217444T DE60217444T2 (de) 2001-07-19 2002-04-24 Sprachgesteuertes elektronisches Gerät
JP2002208771A JP2003044069A (ja) 2001-07-19 2002-07-17 音声認識による誤動作の防止及び音声認識率の向上が可能な電子機器及び方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020010043581A KR100552468B1 (ko) 2001-07-19 2001-07-19 음성인식에 따른 오동작을 방지 및 음성인식율을 향상 할수 있는 전자기기 및 방법

Publications (2)

Publication Number Publication Date
KR20030008726A true KR20030008726A (ko) 2003-01-29
KR100552468B1 KR100552468B1 (ko) 2006-02-15

Family

ID=19712317

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020010043581A KR100552468B1 (ko) 2001-07-19 2001-07-19 음성인식에 따른 오동작을 방지 및 음성인식율을 향상 할수 있는 전자기기 및 방법

Country Status (6)

Country Link
US (1) US20030018479A1 (ko)
EP (1) EP1278183B1 (ko)
JP (1) JP2003044069A (ko)
KR (1) KR100552468B1 (ko)
CN (1) CN1188829C (ko)
DE (1) DE60217444T2 (ko)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20040048435A (ko) * 2002-12-03 2004-06-10 조미화 음성 제어 텔레비젼 수상기 및 음성 제어 방법
KR20150096419A (ko) * 2012-12-19 2015-08-24 마이크로소프트 테크놀로지 라이센싱, 엘엘씨 능동 화자 검출을 위한 비디오 및 오디오 태깅 기법
US11600270B2 (en) 2017-09-15 2023-03-07 Saturn Licensing Llc Information processing apparatus and information processing method
US11710498B2 (en) 2019-02-11 2023-07-25 Samsung Electronics Co., Ltd. Electronic device and control method therefor

Families Citing this family (40)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7324947B2 (en) 2001-10-03 2008-01-29 Promptu Systems Corporation Global speech user interface
DE10251209A1 (de) * 2002-10-31 2004-05-19 Sennheiser Electronic Gmbh & Co. Kg Mikrofonsystem
JP2005338454A (ja) * 2004-05-27 2005-12-08 Toshiba Tec Corp 音声対話装置
US10032452B1 (en) 2016-12-30 2018-07-24 Google Llc Multimodal transmission of packetized data
CN100426768C (zh) * 2004-12-16 2008-10-15 智捷科技股份有限公司 无线网络传输发送器与接收器及建立无线网络传输的方法
US20080086311A1 (en) * 2006-04-11 2008-04-10 Conwell William Y Speech Recognition, and Related Systems
US11017428B2 (en) 2008-02-21 2021-05-25 Google Llc System and method of data transmission rate adjustment
US10013986B1 (en) 2016-12-30 2018-07-03 Google Llc Data structure pooling of voice activated data packets
JP2010164992A (ja) * 2010-03-19 2010-07-29 Toshiba Tec Corp 音声対話装置
TWI412019B (zh) * 2010-12-03 2013-10-11 Ind Tech Res Inst 聲音事件偵測模組及其方法
US9922334B1 (en) 2012-04-06 2018-03-20 Google Llc Providing an advertisement based on a minimum number of exposures
US10152723B2 (en) 2012-05-23 2018-12-11 Google Llc Methods and systems for identifying new computers and providing matching services
US10776830B2 (en) 2012-05-23 2020-09-15 Google Llc Methods and systems for identifying new computers and providing matching services
CN104956436B (zh) 2012-12-28 2018-05-29 株式会社索思未来 带有语音识别功能的设备以及语音识别方法
JP6115152B2 (ja) * 2013-01-29 2017-04-19 コニカミノルタ株式会社 情報処理システム、情報処理装置、情報処理端末及びプログラム
US10735552B2 (en) 2013-01-31 2020-08-04 Google Llc Secondary transmissions of packetized data
US10650066B2 (en) 2013-01-31 2020-05-12 Google Llc Enhancing sitelinks with creative content
US9384754B2 (en) 2013-03-12 2016-07-05 Comcast Cable Communications, Llc Removal of audio noise
CN104238379B (zh) * 2013-06-07 2017-07-28 艾默生过程控制流量技术有限公司 变送器、现场仪表以及用于控制变送器的方法
CN103366744B (zh) * 2013-07-04 2015-10-14 三星半导体(中国)研究开发有限公司 基于语音控制便携式终端的方法和装置
CN104135619A (zh) * 2014-08-12 2014-11-05 广东欧珀移动通信有限公司 一种摄像头控制方法及装置
CN104456830A (zh) * 2014-10-29 2015-03-25 无锡悟莘科技有限公司 一种智能空调的声音控制方法
US9818414B2 (en) * 2015-06-04 2017-11-14 Intel Corporation Dialogue system with audio watermark
US10453460B1 (en) * 2016-02-02 2019-10-22 Amazon Technologies, Inc. Post-speech recognition request surplus detection and prevention
JP6810527B2 (ja) * 2016-03-11 2021-01-06 パイオニア株式会社 再生制御装置、再生制御システム、並びに再生制御方法、プログラム及び記録媒体
US11138987B2 (en) 2016-04-04 2021-10-05 Honeywell International Inc. System and method to distinguish sources in a multiple audio source environment
US10708313B2 (en) 2016-12-30 2020-07-07 Google Llc Multimodal transmission of packetized data
US10593329B2 (en) 2016-12-30 2020-03-17 Google Llc Multimodal transmission of packetized data
US10395650B2 (en) 2017-06-05 2019-08-27 Google Llc Recorded media hotword trigger suppression
CN107464560A (zh) * 2017-08-14 2017-12-12 广东九联科技股份有限公司 一种智能语音回采方法及其系统
US10276175B1 (en) * 2017-11-28 2019-04-30 Google Llc Key phrase detection with audio watermarking
JP7013093B2 (ja) * 2018-05-01 2022-01-31 アルパイン株式会社 故障検出装置、移動体搭載装置、故障検出方法
US10692496B2 (en) 2018-05-22 2020-06-23 Google Llc Hotword suppression
JP7106120B2 (ja) * 2018-11-22 2022-07-26 国立大学法人東北大学 音声対話装置および音声対話システム
CN113168834A (zh) * 2018-12-18 2021-07-23 日产自动车株式会社 声音识别装置、声音识别装置的控制方法、内容播放装置以及内容发送接收系统
KR20200076441A (ko) * 2018-12-19 2020-06-29 삼성전자주식회사 전자 장치 및 그의 제어 방법
KR102584588B1 (ko) 2019-01-21 2023-10-05 삼성전자주식회사 전자 장치 및 전자 장치의 제어 방법
WO2021100555A1 (ja) * 2019-11-21 2021-05-27 ソニーグループ株式会社 情報処理システム、情報処理装置、情報処理方法及びプログラム
KR20210123633A (ko) * 2020-04-03 2021-10-14 삼성전자주식회사 음성 명령에 대응하는 태스크를 수행하는 전자 장치 및 그 동작 방법
CN116959438A (zh) * 2022-04-18 2023-10-27 华为技术有限公司 唤醒设备的方法、电子设备和存储介质

Family Cites Families (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3004104A (en) * 1954-04-29 1961-10-10 Muzak Corp Identification of sound and like signals
JPS60193000A (ja) * 1984-03-14 1985-10-01 富士重工業株式会社 自動車の音声認識装置
JPS63171071A (ja) * 1987-01-08 1988-07-14 Matsushita Commun Ind Co Ltd 音声制御装置
US5267323A (en) * 1989-12-29 1993-11-30 Pioneer Electronic Corporation Voice-operated remote control system
JPH05197385A (ja) * 1992-01-20 1993-08-06 Sanyo Electric Co Ltd 音声認識装置
US5452289A (en) * 1993-01-08 1995-09-19 Multi-Tech Systems, Inc. Computer-based multifunction personal communications system
US5765130A (en) * 1996-05-21 1998-06-09 Applied Language Technologies, Inc. Method and apparatus for facilitating speech barge-in in connection with voice recognition systems
EP0941597B1 (en) * 1996-11-28 2002-01-30 BRITISH TELECOMMUNICATIONS public limited company Interactive apparatus and method
CN1291324A (zh) * 1997-01-31 2001-04-11 T-内提克斯公司 检测录制声音的系统和方法
JPH10257583A (ja) * 1997-03-06 1998-09-25 Asahi Chem Ind Co Ltd 音声処理装置およびその音声処理方法
DE19712632A1 (de) * 1997-03-26 1998-10-01 Thomson Brandt Gmbh Verfahren und Vorrichtung zur Sprachfernsteuerung von Geräten
US6385176B1 (en) * 1998-06-04 2002-05-07 Lucent Technologies Inc. Communication system based on echo canceler tap profile
JP2000132200A (ja) * 1998-10-27 2000-05-12 Matsushita Electric Ind Co Ltd 音声認識機能付きオーディオ/ビデオ装置および音声認識方法
US6522769B1 (en) * 1999-05-19 2003-02-18 Digimarc Corporation Reconfiguring a watermark detector
KR20010004832A (ko) * 1999-06-30 2001-01-15 구자홍 음성인식을 이용한 기기 제어장치
JP4554044B2 (ja) * 1999-07-28 2010-09-29 パナソニック株式会社 Av機器用音声認識装置
WO2001050665A1 (en) * 1999-12-30 2001-07-12 Digimarc Corporation Watermark-based personal audio appliance
KR100865247B1 (ko) * 2000-01-13 2008-10-27 디지맥 코포레이션 메타데이터를 인증하고 매체 신호들의 워터마크들 내에 메타데이터를 임베딩하는 방법
US6737957B1 (en) * 2000-02-16 2004-05-18 Verance Corporation Remote control signaling using audio watermarks
KR20020058116A (ko) * 2000-12-29 2002-07-12 조미화 음성 제어 텔레비젼 수상기 및 음성 제어 방법
WO2004103773A2 (en) * 2003-05-19 2004-12-02 Gentex Corporation Rearview mirror assemblies incorporating hands-free telephone components

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20040048435A (ko) * 2002-12-03 2004-06-10 조미화 음성 제어 텔레비젼 수상기 및 음성 제어 방법
KR20150096419A (ko) * 2012-12-19 2015-08-24 마이크로소프트 테크놀로지 라이센싱, 엘엘씨 능동 화자 검출을 위한 비디오 및 오디오 태깅 기법
US11600270B2 (en) 2017-09-15 2023-03-07 Saturn Licensing Llc Information processing apparatus and information processing method
US11710498B2 (en) 2019-02-11 2023-07-25 Samsung Electronics Co., Ltd. Electronic device and control method therefor

Also Published As

Publication number Publication date
CN1399247A (zh) 2003-02-26
DE60217444D1 (de) 2007-02-22
CN1188829C (zh) 2005-02-09
JP2003044069A (ja) 2003-02-14
DE60217444T2 (de) 2007-05-24
EP1278183A1 (en) 2003-01-22
US20030018479A1 (en) 2003-01-23
KR100552468B1 (ko) 2006-02-15
EP1278183B1 (en) 2007-01-10

Similar Documents

Publication Publication Date Title
KR100552468B1 (ko) 음성인식에 따른 오동작을 방지 및 음성인식율을 향상 할수 있는 전자기기 및 방법
US8271287B1 (en) Voice command remote control system
US7885818B2 (en) Controlling an apparatus based on speech
KR100845476B1 (ko) 가전제품에 속하는 디바이스의 음성제어를 위한 방법 및장치
US20060235698A1 (en) Apparatus for controlling a home theater system by speech commands
KR20060123072A (ko) 오디오 신호의 재생을 제어하는 방법 및 장치
KR20070003425A (ko) 영상표시기기의 언어설정 장치 및 방법
JPH07123376A (ja) 文字多重放送受信装置
JPH0847079A (ja) 音響装置
KR100203048B1 (ko) 사용자 지정단어에 대한 음성출력레벨 조정기능을 갖춘 캡션 텔레비전
JP3019608U (ja) 時刻報知装置
KR20010002739A (ko) 음성인식기를 이용한 자동 캡션 삽입 장치 및 방법
JP4257546B2 (ja) 記録再生装置、およびhdd内蔵型ディジタルテレビジョン
KR20240041956A (ko) Tv 및 리모컨을 포함하는 시스템 및 그 제어 방법
KR100327723B1 (ko) 텔레비전의 영상/음성 재생 장치 및 그 방법
KR100232816B1 (ko) 텔레비전 수상기의 음성출력 제어장치
KR100726721B1 (ko) 학습기능을 갖는 노래반주기 및 그 학습방법
JP2013121096A (ja) 音声調整装置およびデジタル放送受信装置
JP2006129171A (ja) 映像機器および音声出力制御方法
KR19980040422A (ko) 비디오 테이프 레코더의 광고방송 신호검파에 의한 음량자동 조정장치
KR20070089267A (ko) 하드디스크 내장형 광디스크 플레이어에서의 비디오/오디오신호 기록 시스템 및 방법
KR20000021676A (ko) 복합텔레비전의 학습레벨판별 학습방법 및 그 장치
KR19980040423A (ko) 비디오 테이프 레코더의 다중 언어방송 신호검파에 의한 음량자동 조정장치
KR19980038619A (ko) 텔레비전에서의 시간알림방법
KR19990025605A (ko) 노래방 기기의 점수 계산 시스템

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
LAPS Lapse due to unpaid annual fee