KR20030008726A

KR20030008726A - 음성인식에 따른 오동작을 방지 및 음성인식율을 향상 할수 있는 전자기기 및 방법

Info

Publication number: KR20030008726A
Application number: KR1020010043581A
Authority: KR
Inventors: 오윤학; 차순백
Original assignee: 삼성전자 주식회사
Priority date: 2001-07-19
Filing date: 2001-07-19
Publication date: 2003-01-29
Also published as: CN1399247A; DE60217444D1; CN1188829C; JP2003044069A; DE60217444T2; EP1278183A1; US20030018479A1; KR100552468B1; EP1278183B1

Abstract

음성인식에 따른 오동작을 방지 및 음성 인식율을 향상 할 수 있는 전자기기가 개시된다. 음성인식에 따른 오동작 방지용 전자기기는, 오디오신호를 출력하는 스피커, 외부로부터 입력되는 음향을 수신하는 음향수신부, 음향수신부에서 수신된 음향의 신호에서 삽입된 워터마크정보를 찾는 검출부, 워트마크가 검출되었을 경우 검출부에서 추출한 음향 스펙트럼을 이용한 음향 제거부, 음향신호의 에너지크기로 음성신호의 유무를 판단하는 음성신호 판단부, 음향을 인식하여 음향에 해당되는 명령을 출력하는 음성인식부, 및 명령을 수령하여 명령에 대응되는 동작을 제어하는 제어부를 포함한다. 스피커에서 출력되는 음향은 제거되어 사용자의 음성에 대해서만 음성인식을 하므로, 전자기기의 오동작을 방지할 수 있다.

Description

음성인식에 따른 오동작을 방지 및 음성인식율을 향상 할 수 있는 전자기기 및 방법{an electronic-apparatus and method for preventing mis-operation and rising speech recognition rate according to sound recognizing}

본 발명은 텔레비전 등과 같은 전자기기에 관한 것으로서, 보다 상세하게는, 음성인식을 통한 동작의 제어가 가능한 전자기기에 관한 것이다.

음성인식기술의 발전에 따라, 사용자가 발성한 음성을 인식하여 이에 대응되는 명령을 입력하여 동작을 제어할 수 있는 전자기기가 개발되어 있다. 이러한 전자기기는 사용자가 음성으로 "재생", "녹화" 등을 발성하면, 이 발성음을 음성패턴인식하여 해당되는 명령어 코드를 출력하고 이에 따른 동작을 수행하도록 제어한다.

도 1은 이러한 음성인식을 통한 동작의 제어가 가능한 전자기기의 예로서 텔레비전을 개략적으로 도시한 도면이다. 종래의 텔레비전은 방송신호를 수신하는 튜너(1), VTR(Video Tape Recoder)과 같은 영상재생장치로부터 재생된 신호를 수신하기 위한 외부신호입력부(2), 튜너(1) 및 외부신호입력부(2)에서 입력된 신호를 선택적으로 출력하는 마이콤(3), 마이콤(3)에서 출력된 신호중에서 영상신호를 증폭하는 영상증폭부(4), 증폭된 영상신호를 디스플레이하는 화면(7), 마이콤(3)에서출력된 신호중 오디오신호를 증폭하는 오디오증폭부(5), 및 증폭된 오디오신호를 청취 가능하도록 증폭 출력하는 스피커(6)를 갖는다. 또한, 종래의 텔레비전은 사용자로부터 제어신호를 입력하도록 하는 키입력부(8)가 마련되어 있다.

또한, 텔레비전은 사용자의 음성을 인식하여 이에 대응되는 명령을 마이콤(3)에 전송하는 음성인식부(9), 및 사용자로부터 발성된 음향을 수취하여 음성인식부(9)에 무선으로 전송하는 무선마이크(10)를 갖는다. 이때, 음성인식부(9)에는 사용자의 음성에 대한 주파수대역정보가 저장된다. 이러한 음성인식부(9)는 사용자의 음성에 대한 주파수대역의 음향신호는 통과시키고, 이외의 주파수대역의 음향은 차단하는 통과필터(미도시)가 마련되어 있다. 한편, 무선마이크(10)는 무선으로 텔레비전의 동작을 제어할 수 있는 키입력패널(미도시)이 마련되어 있어 무선리모콘의 기능을 가지고 있다. 이러한 무선마이크(10)에는 텔레비전에 대한 일반모드 및 음성인식모드로의 전환이 가능한 모드전환키가 마련되어 있다.

종래의 음성인식을 통한 텔레비전의 동작제어는 텔레비전 시청도중에 사용자가 무선마이크(10)에 마련된 모드전환키를 선택하여 텔레비전을 음성인식모드로 전환한다. 텔레비전이 음성인식모드로 전환되면, 사용자가 무선마이크(10)로 해당 명령에 대응되는 음성을 발성한다. 이때, 무선마이크(10)에는 사람의 음성뿐만 아니라 스피커(6)를 통해 출력된 오디오의 음향도 함께 수취되고, 이렇게 수취된 두 가지의 신호는 음성인식부(9)에 함께 제공된다. 여기서, 음성인식부(9)는 설정된 주파수대역에 해당하는 사용자의 음향신호는 통과시키고, 스피커(6)에서 출력된 오디오신호를 비롯한 나머지신호에 대해서는 차단한다. 이에 따라, 음성인식부(9)는수신된 사용자의 음성을 음성패턴인식하여 이에 대응하는 명령을 추출하여 마이콤(3)에 전송한다.

그런데, 이러한 종래의 텔레비전의 음성인식부(9)는 스피커(6)에서 출력되는 오디오신호의 음향 주파수대역이 사용자의 음향 주파수대역과 겹치는 대역이 발생할 경우, 오디오신호의 음향을 따로 분리하여 제거하는데 어려움이 있다. 또한, 스피커(6)에서 출력되는 오디오신호의 음향이 음성인식부(9)의 설정된 통과필터대역에 해당하고 텔레비전의 동작을 제어할 수 있는 음향에 해당하는 경우, 음성인식부(9)는 스피커(6)에서 출력된 음향을 제어신호로 오인하여 텔레비전이 오동작하게 되는 요인을 제공하는 문제점이 있다.

이러한, 문제점을 완화하기 위해 텔레비전을 시청하는 도중에 스피커(6)의 출력을 묵음(mute)시키고 무선마이크(10)를 통해 사용자가 제어명령에 해당하는 음성을 발성할 수 있다. 이에 따라, 음성인식부(9)는 사용자의 음성만을 수취하게 되어 이에 대응하는 명령을 마이콤(3)에 전송할 수 있다. 그런데, 이는 음성인식은 수행하는 동안은 사용자가 스피커(6)에서 출력되는 음향을 청취할 수 없어 텔레비전 시청에 대한 불편함이 따르게된다.

이러한 문제점은, 음향을 출력할 수 있는 전자기기와 음성을 수취하여 이에 따른 동작을 수행할 수 있는 전자기기 사이에서도 동일하게 발생한다. 음향을 출력할 수 있는 전자기기의 예로는 텔레비전 및 라디오 등을 들 수 있다. 또한, 음성을 수취하여 이에 따른 동작을 수행할 수 있는 전자기기의 예로는 텔레비전, 라디오, VTR, 전기밥솥, 청소기, 에어컨, 선풍기 등과 같은 전기신호를 통해 동작되는 모든 전자기기를 들 수 있다.

음향을 출력할 수 있는 라디오 및 음성을 수취하여 이에 따른 동작을 수행할 수 있는 선풍기를 예로 하여 종래의 음성인식을 통한 동작을 설명하면, 라디오에서 선풍기가 인식할 수 있는 주파수대역이면서 선풍기가 동작할 수 있는 음향이 출력되면, 선풍기는 라디오에서 출력된 음향을 사용자의 제어 음성으로 오인하여 이에 대응되는 동작을 수행하게 된다. 이에 따라, 선풍기는 사용자가 원하지 않는 오동작을 수행하게 되는 문제점이 있다. 또한, 라디오에서 출력된 음향과 사용자의 음향이 동시에 입력될 경우, 오디오신호의 음향을 따로 분리하여 제거하는데 어려움이 있어서 음성인식명령이 제대로 수행되지 않을 수 있다.

상기와 같은 문제점을 해결하기 위한 본 발명의 목적은, 스피커를 통해 출력되는 음향이 음성인식부에 수취됨에 따른 오동작을 방지할 수 있는 음성인식을 통한 제어가 가능한 전자기기를 제공하는데 있다.

또한, 본 발명의 다른 목적은, 스피커를 통해 오디오신호를 출력시 출력되는 음향에 대한 정보가 포함된 음향을 출력할 수 있는 전자기기를 제공하는데 있다.

한편, 본 발명의 또 다른 목적은, 판별이 가능한 정보가 포함된 음향을 수취하여 수취된 음향에 대한 판별이 가능한 음성인식을 통한 동작 제어가 가능한 전자기기를 제공하는데 있다.

도 1은 음성인식을 통한 동작의 제어가 가능한 텔레비전을 개략적으로 도시한 도면,

도 2는 본 발명에 따른 음성인식에 따른 오동작을 방지 및 음성인식율을 향상 할 수 있는 전자기기의 바람직한 실시예를 도시한 도면,

도 3은 도 2의 판별부를 상세히 도시한 블록도, 그리고

도 4는 본 발명에 따른 전자기기의 음성인식을 통한 오동작을 방지 및 음성인식율을 향상 할 수 있는 방법의 바람직한 실시예가 도시된 순서도이다.

* 도면의 주요 부분에 대한 부호의 설명 *

21 : 튜너부 22 : 외부신호입력부

23 : 전원부 24 : 마이콤

25 : 키입력부 26 : 영상증폭부

27 : 표시부 28 : 화면

30 : 오디오증폭부 31 : 스피커

40 : 워터마크발생부 50 : 음향수신제어부

52 : 음향수신부 54 : 판별부

54a : 검출부 54b : 음향제거부

54c : 검출부56 : 음성인식부

60 : 무선마이크

상기와 같은 목적을 달성하기 위한 본 발명에 따른 오동작을 방지할 수 있는전자기기는, 오디오신호를 출력하는 스피커, 외부로부터 입력되는 음향을 수신하는 음향수신부, 음향수신부에서 수신된 음향의 신호에서 삽입된 워터마크정보를 찾는 검출부, 워트마크가 검출되었을 경우 검출부에서 추출한 음향 스펙트럼을 이용한 음향 제거부, 음향신호의 에너지크기로 음성신호의 유무를 판단하는 음성신호 판단부, 음향을 인식하여 음향에 해당되는 명령을 출력하는 음성인식부, 및 명령을 수령하여 명령에 대응되는 동작을 제어하는 제어부를 포함한다.

바람직하게는, 본 발명의 전자기기는, 오디오신호에 대한 스펙트럼정보가 포함된 워터마크정보를 오디오신호에 부가하는 음향정보제공부를 더 포함하며, 이에 따라 검출부는 음향의 신호에서 워트마크로 삽입된 스펙트럼 정보를 검출하고, 워트마크가 검출되었을 경우 음향 제거부에서는 검출된 스펙트럼을 이용하여 음향을 제거한다. 한편, 본 발명의 전자기기는 사용자의 선택에 따라 음향정보제공부의 동작여부에 대한 모드의 설정이 가능하다.

한편, 상기와 같은 목적을 달성하기 위한 본 발명에 따른 음성인식에 따른 오동작을 방지방법은, a) 스피커를 통해 오디오신호를 출력하는 단계, b) 음향의 신호에 오디오신호가 부가되어 있는 것으로 판단되면, 오디오 신호를 제거하고 음성신호만을 음성 인식부로 전송하는 단계, c) 음향을 인식하여 음향에 해당하는 명령을 출력하는 단계, 및 d) 명령을 수령하여 명령에 대응하는 동작을 제어하는 단계를 포함한다.

바람직하게는, 본 발명의 음성인식에 따른 오동작을 방지방법은, a)단계 전에, 오디오신호에 대한 스펙트럼정보가 포함된 워터마크정보를 오디오신호에 부가하는 단계를 더 포함한다.

본 발명에 따르면, 텔레비전의 음성인식모드에서 스피커에서 출력되는 오디오신호에 워터마크정보를 부가하여, 외부에서 수신된 음향의 신호에 대해 검출부, 음향제거부 및 음성신호판단부가 수신된 음향의 신호에 대한 워터마크정보의 유무를 판별하여 사용자의 음성신호를 검출함으로써 음성인식을 통한 전자기기의 오동작을 방지할 수 있다.

이하, 도면을 참조하여 본 발명을 상세히 설명한다.

도 2는 본 발명에 따른 음성인식에 따른 오동작을 방지할 수 있는 전자기기의 바람직한 실시예를 도시한 도면이다. 참고로, 본 실시예는 텔레비전을 일 예로 설명한다. 도면을 참조하면, 본 발명의 전자기기는, 방송신호를 수신하는 튜너(21), VTR 및 DVDP 등과 같은 영상재생장치로부터 재생된 신호를 수신하는 외부신호입력부(22), 튜너(21) 및 외부신호입력부(22)에서 입력된 신호를 선택적으로 출력하는 마이콤(24), 마이콤(24)에 전원을 인가하는 전원부(23), 마이콤(24)을 통한 해당 동작의 제어를 위한 키를 입력하도록 마련된 키입력부(25), 음성인식을 통해 해당 동작에 대한 마이콤(24)을 제어하기 위한 음향수신제어부(50)를 갖는다.

도면에 따른 텔레비전은 마이콤(24)에서 출력된 신호중에서 영상신호를 증폭하는 영상증폭부(26), 증폭된 영상신호를 표시 가능한 포맷으로 변환하는 표시부(27), 및 포맷이 변된 영상신호를 디스플레이하기 위한 화면(28)을 갖는다. 또한, 도면에 따른 텔레비전은 마이콤(24)에서 출력된 신호중에서 오디오신호를 증폭하는 오디오증폭부(30), 증폭된 오디오신호에 대한 스펙트럼정보를 추출하여 추출된 스펙트럼정보를 증폭된 오디오신호에 부가하는 워터마크(water mark)발생부(40), 및 스펙트럼정보가 부가된 오디오신호를 청취 가능한 음향으로 증폭출력하는 스피커(31)를 갖는다.

한편, 음향수신제어부(50)는, 무선마이크(60)로부터 입력되는 음향신호를 수신하는 음향수신부(52), 음향수신부(52)에 수신된 음향의 신호가 스피커(31)에서 출력된 신호인지 사용자의 음성신호인지를 판별하는 판별부(54), 및 판별부(54)에서 음향의 신호가 사용자의 음성신호인 것으로 판단되면 수신된 음향에 대한 음성패턴인식을 통해 해당 명령을 추출하여 마이콤(24)에 전송하는 음성인식부(56)를 갖는다.

도 3은 도 2의 판별부(54)를 상세히 도시한 블록도이다. 도면에 따른 판별부(54)는, 음향수신부(52)에서 수신된 음향의 신호에서 삽입된 워터마크정보를 찾는 검출부(54a), 워트마크정보가 검출되었을 경우 검출부(54a)에서 추출한 음향 스펙트럼을 이용하여 워터마크정보가 포함된 오디오신호를 제거하는 음향제거부(54b), 오디오신호가 제거된 음향신호 중에서 음향신호의 에너지크기를 통해 음성신호의 유무를 판단하는 음성신호판단부(54c)를 갖는다.

무선마이크(60)는 무선으로 텔레비전의 동작을 제어할 수 있는 키입력패널(미도시)이 마련되어 있어 무선리모콘의 기능을 가지고 있다. 이러한 무선마이크(60)에는 텔레비전시청에 대한 일반모드 및 음성인식모드로의 전환이 가능한 모드전환키가 마련되어 있다. 여기서, 일반모드란, 무선마이크(60)의 키선택 및 키입력부(25)의 키선택에 따라 마이콤(24)의 동작을 제어하여 텔레비전을 시청하는 모드를 말한다. 또한, 음성인식모드란, 음향수신제어부(50)를 통해 음성을 수취함으로써 이에 대한 마이콤(24)을 제어할 수 있는 모드를 말한다.

한편, 워터마크발생부(40)의 동작은 무선마이크(60)를 통한 음성인시모드선택시에만 선택적으로 동작하도록 설정되어 있다. 바람직하게는, 사용자가 무선마이크(60)의 모드전환키를 선택하여 음성인식모드로 전환하면, 음향수신제어부(50)는 음성인식모드로 전환됨을 알리는 신호를 마이콤(24)에 전송한다. 이에 따라, 마이콤(24)은 일반모드에서는 워터마크발생부(40)의 동작 없이 증폭된 오디오신호를 스피커(31)로 출력한다. 또한, 마이콤(24)은 음향수신제어부(50)로부터 음성인식모드로 전환됨을 알리는 신호가 수신되면, 워터마크발생부(40)를 제어하여 증폭된 오디수신호에 오디오신호에 대한 스펙트럼정보를 부가하도록 하여 스피커(31)로 출력한다. 이때, 오디오신호에 대한 스펙트럼정보를 워터마크정보라한다. 이러한 워터마크정보는 원신호의 질에는 영향을 미치지 않고 원신호에 대한 정보를 원신호에 내포하는 은닉정보이다. 따라서, 워터마크정보가 포함된 오디오신호가 스피커(31)로 출력되더라도, 사용자는 오디오신호에 대응되는 음향만을 청취하게 된다.

한편, 워터마크발생부(40)에서 오디오신호에 대한 스펙트럼정보를 추출하여 워터마크정보를 산출하는 것은 일반적으로 오디오신호를 샘플링하고 스펙트럼변환을 통해 계수를 산출하는 선형예측변환(Linear Predictive Coding : LPC)이 사용된다. 이에 따라, 검출부(54a)에서는 음향수신부(52)에서 수신된 음향의 신호에서 워터마크정보로 삽입된 스펙트럼정보를 찾고, 음향제거부(54b)에서는 검출부(54a)에서 추출한 음향의 스펙트럼 정보를 이용하여 워터마크정보가 포함된 음향신호를제거하고한다. 이때, 음성신호판단부(54c)에서는 수신된 음향의 신호들 중에서 오디오신호가 제거되고 잔존하는 음향 신호의 에너지크기가 문턱치보다 작으면 음성신호가 없는 것으로 판단하여 종료하고, 문턱치보다 크면 음성신호가 존재한다고 판단하여 음성인식부(56)에 전달한다. 음성인식부(56)에서는 음성패턴인식을 통해 입력된 음성신호를 인식하여 해당명령을 추출한다. 이렇게 추출된 명령은 마이콤(24)으로 전송되어 마이콤(24)을 통해 해당 동작이 수행되도록 한다.

따라서, 음성인식모드로 전환된 상태에서 오디오신호가 스피커(31)로 출력되기 전에 워터마크발생부(40)에서 오디신호에 대한 워터마크정보를 추출하여 오디오신호에 부가하여 스피커(31)를 통해 출력함으로써, 판별부(54)의 음성인식판별시 워터마크정보에 기초하여 오디오신호를 추출할 수 있다.

이에 따라, 음성인식부(56)는 수신된 음향의 신호중에서 음성신호에 대해서만 음성패턴인식하여 해당 명령을 추출하고, 마이콤(24)은 잘못된 음성인식에 따른 전자기기의 오동작을 방지할 수 있다.

한편, 도면의 텔레비전에 대해 사용자의 음성을 통해 제어가 가능한 명령으로는 전원의 온/오프(on/off), 채널의 선택, 볼륨조절, 사운드의 묵음(mute) 등을 들 수 있다. 전원의 온/오프는 전원부(23)로부터 인가된 전원을 마이콤(24)이 각 부에 전송하는 전원차폐동작을 제어하는 것이고, 채널의 선택은 해당 채널의 숫자를 음성으로 발성하면 해당 채널이 선곡될 수 있도록 마이콤(24)을 제어하는 것이다. 또한, 볼륨조절은 사용자가 음성으로 "크게", "작게" 등을 발성하면, 이에 대응하여 볼륨의 높낮이가 조절되도록 마이콤(24)이 오디오증폭부(30)를 제어하도록하는 것이다. 한편, 사운드의 묵음은 사용자가 "묵음"이라는 음성을 발성하면, 이에 따라 마이콤(24)이 오디오증폭부(30)를 제어하여 오디오신호의 출력을 차폐시키는 것을 말한다.

도 4은 본 발명에 따른 전자기기의 음성인식을 통한 오동작을 방지할 수 있는 방법에 대한 바람직한 실시예가 도시된 순서도이다. 도면을 참조하면, 먼저 전원이 켜진(on)상태에서 방송신호 또는 재생장치로부터 입력된 재생신호를 수신하여 이에 대응하는 동작을 수행하는 상태에서, 마이콤(24)은 현재 제어신호입력모드가 무선마이크(60)의 모드키의 선택에 따라 음성모드인지를 판단한다(S42). S42단계에서 음성모드가 아닌 것으로 판단되면, 마이콤(24)은 수신된 방송신호 및 재생신호를 일반모드에서 화면(28) 및 스피커(31)에 출력되도록 한다(S44). S42단계에서 현재 음성모드인것으로 판단되면, 마이콤(24)은 워터마크발생부(40)를 제어하여 증폭된 오디오신호에 워터마크정보를 부가하도록 한다(S46). 이렇게 워터마크정보가 부가된 오디오신호는 스피커(31)를 통해 외부로 증폭출력된다(S48).

한편, 검출부(54a)는 수신된 음향의 신호들 중에 워터마크정보가 존재하는지의 여부를 검출한다(S52). S52단계에서 수신된 음향의 신호들 중에 워터마크정보가 존재하는 신호가 검출되면, 수신된 음향의 신호들 중에 스피커(31)에서 출력된 오디오신호가 존재함을 알 수 있다. 따라서, 음향제거부(54b)는 수신된 음향의 신호들 중에 워터마크정보가 존재하는 것으로 검출된 신호, 즉 스피커(31)에서 출력된 오디오신호를 추출하여 제거한다(S54).

또한, 음성신호판단부(54c)는 수신된 음향의 신호들 중에서 오디오신호가 제거되고 잔존하는 음향의 신호의 에너지를 문턱치와 비교하여 음성신호의 존재여부를 판단한다(S56). 수신된 음향의 신호들 중에서 오디오신호가 제거되고 잔존하는 음향 신호의 에너지크기가 문턱치보다 작으면 음성신호가 없는 것으로 판단하여 종료하고, 문턱치보다 크면 음성신호가 존재한다고 판단하여 음성인식부(56)에 전달한다(S58).

한편, S52단계에서 수신된 음향의 신호들 중에 워터마크정보가 존재하지 않는 것으로 판단되면, 음성신호 판단부(54c)로 전달되고, 음성신호 판단부(54c)는 수신된 음향의 신호의 에너지를 문턱치와 비교하여 음성신호의 존재여부를 판단한다(S56). 음향 신호의 에너지크기가 문턱치보다 작으면 음성신호가 없는 것으로 판단하여 종료하고, 문턱치보다 크면 음성신호가 존재한다고 판단하여 음성인식부(56)에 전달한다(S58).

S58단계에서 음성신호로 판별도어 입력된 음성신호에 대해 음성인식부(56)는 수신된 음성신호에 대한 음성패턴인식을 통해 해당 음성신호에 대응되는 명령을 마이콤(24)에 출력한다(S60). 한편, 마이콤(24)은 수신된 명령에 대응하여 텔레비전의 동작을 제어한다(S62).

따라서, 텔레비전의 음성인식모드에서 스피커(31)에서 출력되는 오디오신호에 워터마크정보를 부가함으로써, 무선마이크(60)를 통해 전송되어 수신된 음향의 신호에 대해 판별부(54)가 수신된 음향의 신호에 대한 워터마크정보의 유무를 판별하여 사용자의 음성신호를 검출함으로써 음성인식을 통한 텔레비전의 오동작을 방지할 수 있다.

한편, 상술한 본 발명에 따른 실시예에서는 워터마크발생부(40) 및 음향수신제어부(50)가 복합된 하나의 전자기기에 대해 설명하고 있지만, 워터마크발생부(40) 및 음향수신제어부(50)가 이종의 전자기기에 각각 존재하는 경우에도 본 실시예가 동일하게 적용될 수 있다. 즉, 스피커를 통해 오디오신호를 출력할 수 있는 전자기기에는 스피커의 전단에 워터마크발생부(40)를 부가하고, 음성인식을 통해 동작이 가능한 전자기기에는 음향수신제어부(50)를 부가하면, 본 실시예가 동일하게 적용될 수 있다.

본 발명에 따르면, 음성인식모드로 전환된 상태에서 오디오신호가 스피커(31)로 출력되기 전에 워터마크발생부(40)에서 오디오신호에 대한 워터마크정보를 추출하여 오디오신호에 부가하여 스피커(31)를 통해 출력함으로써, 판별부(54)의 음성인식판별시 워터마크정보에 기초하여 오디오신호를 추출할 수 있다. 따라서, 음성인식부(56)는 수신된 음향의 신호중에서 음성신호에 대해서만 음성패턴인식하여 해당 명령을 추출하고, 이에 따라 마이콤(24)은 잘못된 음성인식에 따른 전자기기의 오동작을 방지할 수 있다.

이상에서는 본 발명의 바람직한 실시예에 대해 도시하고 설명하였으나, 본 발명은 상술한 특정의 바람직한 실시예에 한정되지 아니하며, 청구범위에서 청구하는 본 발명의 요지를 벗어남이 없이 당해 발명이 속하는 기술분야에서 통상의 지식을 가진 자라면 누구든지 다양한 변형 실시가 가능한 것은 물론이고, 그와 같은 변경은 청구범위 기재의 범위 내에 있게 된다.

Claims

오디오신호를 출력하는 스피커;

외부로부터 입력되는 음향을 수신하는 음향수신부;

상기 음성수신부에서 수신된 상기 음향의 신호가 상기 스피커에서 출력된 상기 오디오신호인지를 판별하는 판별부;

상기 판별부에서 상기 음향의 신호가 상기 오디오신호가 아닌 것으로 판단하는 경우, 상기 음향을 인식하여 상기 음향에 해당되는 명령을 출력하는 음성인식부; 및

상기 명령을 수령하여 상기 명령에 대응되는 동작을 제어하는 제어부;를 포함하는 것을 특징으로 하는 전자기기.
제 1항에 있어서,

상기 오디오신호에 소정의 식별정보를 부가하는 식별정보제공부;를 더 포함하며,

상기 판별부는 상기 음성인식부에 수신된 신호 내에 상기 식별정보가 존재하는 지의 여부에 기초하여 상기 오디오신호인지의 여부를 판별하는 것을 특징으로 하는 전자기기.
제 2항에 있어서,

상기 식별정보는 상기 오디오신호에 대한 스펙트럼정보가 포함된 워터마크정보이고,

상기 식별정보제공부는 상기 오디오신호에 상기 워터마크정보를 부가하는 워터마크발생부이며,

상기 판별부는 상기 음성인식부에 수신된 신호 내에 상기 워터마크정보가 존재하는지의 여부에 기초하여 상기 오디오신호의 여부를 판별하는 것을 특징으로 하는 전자기기.
제 3항에 있어서,

상기 판별부는,

상기 음향수신부에서 수신된 음향의 신호에서 삽입된 상기 워터마크정보를 찾는 검출부;

상기 워트마크정보가 검출되었을 경우 상기 검출부에서 추출한 상기 스펙트럼정보를 이용하여 상기 워터마크정보가 포함된 상기 오디오신호를 제거하는 음향제거부; 및

상기 오디오신호가 제거된 상기 음향신호 중에서 상기 음향신호의 에너지크기를 통해 음성신호의 유무를 판단하는 음성신호판단부;를 포함하는 것을 특징으로 하는 전자기기.
제 2항에 있어서,

사용자의 선택에 따라 상기 식별정보제공부의 동작여부에 대한 모드의 설정이 가능한 것을 특징으로 하는 전자기기.
오디오신호에 소정의 식별정보를 부가하는 식별정보제공부; 및

상기 식별정보가 포함된 상기 오디오신호를 출력하는 스피커;를 포함하는 것을 특징으로 하는 전자기기.
제 6항에 있어서,

상기 식별정보는 상기 오디오신호에 대한 스펙트럼정보가 포함된 워터마크정보이며,

상기 식별정보제공부는 상기 오디오신호에 상기 워터마크정보를 포함하여 상기 스피커에 출력하는 워터마크발생부인 것을 특징으로 하는 전자기기.
외부로부터 입력되는 음향을 수신하는 음향수신부;

상기 음향수신부에서 수신된 상기 음향의 신호 내에 소정의 식별정보가 포함되어 있는지 여부를 판별하는 판별부;

상기 판별부에서 상기 음향의 신호 내에 상기 식별정보가 존재하지 않는 것으로 판단하는 경우, 상기 음향을 인식하여 상기 음향에 해당되는 명령을 출력하는 음성인식부; 및

상기 명령을 수령하여 상기 명령에 대응되는 동작을 제어하는 제어부;를 포함하는 것을 특징으로 하는 전자기기.
제 8항에 있어서,

상기 식별정보는 상기 음향의 신호의 스펙트럼특성인 워터마크정보이며,

상기 판별부는 상기 음성인식부에 수신된 신호 내에 상기 워터마크정보가 존재하는지의 여부에 기초하여 상기 오디오신호의 여부를 판별하는 것을 특징으로 하는 전자기기.
제 9항에 있어서,

상기 판별부는,

상기 음향수신부에서 수신된 음향의 신호에서 삽입된 상기 워터마크정보를 찾는 검출부;

상기 워트마크정보가 검출되었을 경우 상기 검출부에서 추출한 상기 스펙트럼을 이용하여 상기 워터마크정보가 포함된 상기 오디오신호를 제거하는 음향제거부; 및

상기 오디오신호가 제거된 상기 음향신호 중에서 상기 음향신호의 에너지크기를 통해 음성신호의 유무를 판단하는 음성신호판단부;를 포함하는 것을 특징으로 하는 전자기기.
a) 스피커를 통해 오디오신호를 출력하는 단계;

b) 수신된 음향의 신호에 상기 오디오신호가 부가되어 있으면, 상기 음향의 신호중에서 상기 오디오신호를 제거하는 단계;

c) 상기 음향을 인식하여 상기 음향에 해당하는 명령을 출력하는 단계; 및

d) 상기 명령을 수령하여 상기 명령에 대응하는 동작을 제어하는 단계;를 포함하는 것을 특징으로 하는 음향수신방법.
제 11항에 있어서,

상기 a)단계 전에,

상기 오디오신호에 소정의 식별정보를 부가하는 단계;를 더 포함하며,

상기 b)단계에서는 상기 음향의 신호 내에 상기 식별정보가 존재하는지의 여부에 기초하여 상기 오디오신호인지의 여부를 판별하는 것을 특징으로 하는 음향수신방법.
제 12항에 있어서,

상기 식별정보는 상기 오디오신호에 대한 스펙트럼정보가 포함된 워터마크정보이고,

상기 부가단계는 상기 오디오신호에 상기 워터마크정보를 부가하며,

상기 b)단계는 상기 음향의 신호 내에 상기 워터마크정보가 존재하는 지의 여부에 기초하여 상기 오디오신호인지의 여부를 판별하는 것을 특징으로 하는 음향수신방법.