KR100311414B1 - 화자인식 모듈을 구비한 디지털 티브이 수신기 및 그의화자인식 방법 - Google Patents

화자인식 모듈을 구비한 디지털 티브이 수신기 및 그의화자인식 방법

Info

Publication number
KR100311414B1
KR100311414B1 KR1019990058569A KR19990058569A KR100311414B1 KR 100311414 B1 KR100311414 B1 KR 100311414B1 KR 1019990058569 A KR1019990058569 A KR 1019990058569A KR 19990058569 A KR19990058569 A KR 19990058569A KR 100311414 B1 KR100311414 B1 KR 100311414B1
Authority
KR
South Korea
Prior art keywords
speaker
user
audio
voice
speaker recognition
Prior art date
Application number
KR1019990058569A
Other languages
English (en)
Other versions
KR20010056900A (ko
Inventor
이서구
Original Assignee
구자홍
엘지전자주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 구자홍, 엘지전자주식회사 filed Critical 구자홍
Priority to KR1019990058569A priority Critical patent/KR100311414B1/ko
Publication of KR20010056900A publication Critical patent/KR20010056900A/ko
Application granted granted Critical
Publication of KR100311414B1 publication Critical patent/KR100311414B1/ko

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/441Acquiring end-user identification, e.g. using personal code sent by the remote control or by inserting a card
    • H04N21/4415Acquiring end-user identification, e.g. using personal code sent by the remote control or by inserting a card using biometric characteristics of the user, e.g. by voice recognition or fingerprint scanning
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/06Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
    • G10L15/065Adaptation
    • G10L15/07Adaptation to the speaker
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/41Structure of client; Structure of client peripherals
    • H04N21/426Internal components of the client ; Characteristics thereof

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Signal Processing (AREA)
  • Human Computer Interaction (AREA)
  • Artificial Intelligence (AREA)
  • Theoretical Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Computational Linguistics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Circuits Of Receivers In General (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Television Receiver Circuits (AREA)

Abstract

본 발명은 화자인식 모듈을 구비한 디지털 티브이 수신기 및 그의 화자인식 방법에 관한 것으로, 종래에는 시청자가 록(LOCK) 메뉴에 접근하고자 할 때 비밀번호 입력방식을 사용하고 있는데, 이 경우 비밀번호 유출시의 위험성과 비밀번호를 잊어버린 경우 사용상의 불편함이 있었다. 따라서 본 발명은 사용자에 의한 채널 절환 또는 새로운 프로그램 전송시 EIT에 의한 해당 프로그램에 대한 등급정보와 록 메뉴를 비교하는 제1단계와, 상기에서 새로운 프로그램이 록(LOCK)이 걸려있지 않으면 그대로 프로그램을 출력하고, 록이 걸려 있게 되면 비디오 및 오디오를 뮤트시키는 제2단계와, 상기에서 비디오 및 오디오 뮤트 후 사용자 음성을 받아들여 화자인식을 수행하는 제3단계와, 상기에서 인식된 화자가 등록되어 있으면 뮤트를 해제시켜 비디오 및 오디오를 출력하고, 등록되어 있지 않으면 비디오 및 오디오 출력을 정지시키는 제4단계로 동작하여, 허가된 사용자에게만 선별적으로 티브이에 접근할 수 있도록 한 것이다.

Description

화자인식 모듈을 구비한 디지털 티브이 수신기 및 그의 화자인식 방법{A DIGITAL TELEVISION RECEIVER HAVING THE SPEAKER RECOGNITION MODULE AND A SPEAKER RECOGNITION METHOD THEREOF}
본 발명은 조작자의 불편없이 조작자의 신분을 디지털 티비이에 인식시킬 수 있도록 한 디지털 티브이 수신기의 화자인식 장치 및 방법에 관한 것으로, 특히 화자인식을 이용하여 허가된 사용자에게만 선별적으로 티브이를 접근할 수 있도록 한 디지털 티브이 수신기의 화자인식 장치 및 방법에 관한 것이다.
현재 디지털 티브이 방송으로는 위성을 통한 디지털 위성 방송과 지상파를 이용한 지상파 디지털 방송이 있고, 케이블 디지털 방송도 시행될 예정이다.
이러한 3가지 방송 방식에서, 전송매체(위성, 지상파, 케이블)는 확연하게 다르지만 영상/음성 압축과 패킷 구성 등 나머지 부분은 거의 같다.
따라서, 이들 방송 수신기의 구성도 전송 방식에 관련된 부분만 다르고, 나머지 부분은 거의 유사하다.
현재 디지털 방송에서 기본이 되는 전송 포맷은 국제 규격으로 정해진 MPEG-2로서, ISO/IEC 13818-1(시스템), ISO/IEC 13818-2(비디오), ISO/IEC 13818-3(오디오) 규격에 규정되어 있다.
그러나, 미국향과 한국향 디지털 티브이 수신기에서는 오디오 규격에서 엠펙 오디오를 사용하지 않고, 돌비 AC-3 오디오 규격을 따르고 있다.
시스템 규격은 트랜스포트 스트림 패킷(TSP)이라고 불리는 시간 다중화된(time-multiplexed) 신호열에 관해 규정하며 비디오 규격, 오디오 규격은압축된 영상, 음성 신호열에 관해 규정한다.
패킷의 시작 부분의 헤더내에는 PID(Packet IDdentifier) 번호가 들어있다.
상기 PID번호는 시간 다중화된 신호를 역다중할 수 있는 정보를 제공한다.
그리고 PID번호는 현재의 패킷이 비디오 패킷인지, 오디오 패킷인지, 부가정보(Program Specific Information)인지를 나타내 주는 식별 번호이다.
영상, 음성 기타 부가정보는 시간 다중화되어 여러개의 트랜스포트 스트림 패킷에 실려서 전송되며, 이들 신호열은 PID번호로 구별된다.
상기에서와 같이 시간 다중화된 여러개의 트랜스포트 스트림 패킷에 실려 디지털 티브이 수신기에 전송되면, 상기 디지털 티브이 수신기는 원하는 채널을 선국하여 원래의 영상/음성 신호를 복원함으로써 시청자는 화면에 표시되는 영상을 보면서 스피커로 출력되는 영상에 대응하는 음성을 청취하게 된다.
이와같이 동작하는 디지털 티브이 수신기에 대하여 도 1에 의거하여 살펴보면 다음과 같다.
도 1은 일반적인 디지털 티브이 수신기의 블럭 구성도로서, 이에 도시된 바와같이, 안테나로 부터 원하는 채널의 신호를 입력받고, 그 신호를 검파 및 오류 정정을 행한 트랜스포트 신호열을 출력하는 튜너(1)와, 상기에서 출력된 트랜스포트 신호열을 받아 영상 신호열, 음성 신호열, 부가정보 신호열로 각각 분리하는 패킷 분리기(2)와, 상기 패킷 분리기(2)에서 출력되는 음성 신호열을 신장시켜 출력하는 오디오 디코더(3)와, 상기 패킷 분리기(2)에서 출력되는 영상 신호열을 신장시켜 출력하는 비디오 디코더(4)와, 상기 오디오 디코더(3)에서 출력되는 디지털의음성신호를 아날로그의 음성신호로 변환시켜 스피커의 L,R에 전달하는 오디오 디지털/아날로그 변환기(11)와, 시스템 전체를 제어하기 위한 마이크로 컴퓨터(8)와, 상기 마이크로 컴퓨터(8)의 프로그램을 저장하고 있는 롬(9)과, 수행과정에 필요한 부가정보 저장 장소로 쓰이는 램(10)과, 사용자가 원하는 명령을 마이크로 컴퓨터(8)로 전달하는 사용자 인터페이스(12)와, 상기 사용자 인터페이스(12)로 부터 키 입력에 대해 대응하는 OSD정보를 롬으로 부터 전달받아 OSD영상을 출력하는 OSD 처리기(7)와, 상기 비디오 디코더(4)와 OSD 처리기(7)의 출력을 스위칭하는 스위치(5)와, 상기 스위치(5)를 통해 전달되는 영상신호를 일반 티브이나 모니터(CRT)로 디스플레이할 수 있도록 휘도신호(Y)와 색신호(C)로 출력하는 엔티에스씨 엔코더(6)로 구성된다.
이와같이 구성된 종래 기술에 대하여 상세히 살펴보면 다음과 같다.
튜너(1)는 안테나로 부터 VSB(Vestigial SideBand) 또는 QAM(Quadrature Amplitude Modulation) 신호를 입력으로 받고, 이 신호를 검파하고 오류를 정정하여 얻은 트랜스포트 신호열을 패킷 분리기(2)로 출력시킨다.
그러면 상기 패킷 분리기(2)는 트랜스포트 신호열을 입력으로 받아서 역다중화를 수행하여 영상 신호열, 음성 신호열, 부가정보 신호열을 각각 분리한다.
이렇게 분리한 신호열중 음성 신호열은 오디오 디코더(3)로 제공하고, 영상 신호열은 비디오 디코더(4)로 제공하고, 부가정보 신호열은 마이크로 컴퓨터(8)로 제공한다.
그러면 상기 오디오 디코더(3)는 돌비 AC3로 압축된 음성 신호열을 원래의신호로 신장시켜서 오디오 디지털/아날로그 변환기(11)로 출력하면, 상기 오디오 디지털/아날로그 변환기(11)는 디지탈 음성신호를 아날로그 음성신호로 변환시켜 스피커의 L,R로 제공하여 음성을 출력한다.
그리고 비디오 디코더(4)는 MPEG-2로 압축된 영상 신호열을 원래의 크기로 신장시켜서 엔티에스씨 엔코더(6)로 출력한다.
이때 마이크로 컴퓨터(8)는 패킷 분리기(2)에서 분리된 부가정보를 읽어와 분석 및 조합 과정을 거쳐 시청자에게 제공될 수 정보로 데이터 베이스화한 후 램(10)에 저장해두고 필요할 때 읽어들여 사용한다.
그리고, 상기 마이크로 컴퓨터(8)는 리모콘, 조작 키와 같은 사용자 인터페이스(12)를 통해 기능 키가 입력되면, 그 기능을 수행시키기 위한 동작을 행한다.
마이크로 컴퓨터(8)는 사용자 인터페이스(12)로 부터 키 입력에 대해서 대응하는 OSD정보를 롬(9)으로 읽어들여 OSD 처리기(7)로 전송한다.
이에 상기 OSD 처리기(7)는 OSD 정보를 OSD 영상으로 처리하여 스위치(5)로 출력한다.
이때 마이크로 컴퓨터(8)는 스위치(5)가 비디오 디코더(4)와 OSD 처리기(7)를 번갈아가면서 스위칭하도록 제어한다.
상기 비디오 디코더(4)와 OSD 처리기(7)에서 영상과 OSD를 엔티에스씨 엔코더(6)에서 입력으로 받아 일반 티브이나 모니터로 디스플레이 할 수 있도록 휘도신호(Y)와 색신호(C)로 처리하여 출력한다.
이 출력된 신호는 CRT에 입력되어 영상을 보여준다.
미국향, 한국향 디지털 티브이의 부가정보 중에는 PSIP(Program and System Information Protocol)이 포함되어 있다.
PSIP는 다음과 같은 테이블의 조합으로 구성되며, 그 테이블의 기본구조는 도 2에 도시된 바와같다.
MGT(Master Guide Table) : 모든 테이블의 버전 관장
TVCT(Terrestrial Virtual Channel Table) : 채널에 대한 정보를 저장
RRT(Rating Region Table): 각 프로그램의 지역별 등급표를 저장
EIT(Event Information Table) : 현재 프로그램과 미래 프로그램의 정보
ETT(Extend Text Table) : 현재 프로그램과 미래 프로그램의 상세 정보
STT(System Time Table) : 현재 시간을 전송
방송국에서는 RRT에 각 지역별 프로그램의 등급에 대한 정의를 표기하며, EIT의 content advisory descriptor안에 해당 프로그램의 등급정보를 실어 보낸다.
디지털 방송 수신에서는 content advisory descriptor를 해독해 사용자의 프로그램 접근을 허용할지 안할지를 결정한다.
이러한 시청자의 등급에 관한 기술로는 록(LOCK) 메뉴를 설정하여 등급에 관한 정보를 구체적으로 설정할 수 있게 하고 있으며, 사용자 인터페이스(12)를 통해 비밀번호 입력방식을 사용하여 록 메뉴에 접근하도록 하고 있다.
여기서 록 메뉴는 미성년자들이 시청해서는 안되고, 성인들만이 시청가능한 프로그램의 종류이다.
그러나, 상기에서와 같은 종래기술에 있어서, 시청자가 록(Lock) 메뉴에 접근하고자 할 경우 비밀번호 입력방식을 사용하고 있는데, 비밀번호 유출시의 위험성이 있고, 비밀번호를 바꾸어야 하는 사용상의 불편함이 있으며, 비밀번호를 잊어버린 경우 비밀번호를 알아낼 때 까지 사용할 수 없는 등의 문제점이 있다.
따라서 상기에서와 같은 종래의 문제점을 해결하기 위한 본 발명의 목적은 디지털 티브이의 부가정보인 PSIP(Program and System Information Protocol)에 포함되어 있는 RRT(Rating Region Table)의 내용을 효과적으로 구현할 수 있도록 한 디지털 티브이 수신기의 화자인식 장치 및 방법을 제공함에 있다.
본 발명의 다른 목적은 조작자의 불편없이 조작자의 신분을 디지털 티브이에 인식시킬 수 있도록 한 디지털 티브이 수신기의 화자인식 장치 및 방법을 제공함에 있다.
본 발명의 또 다른 목적은 화자인식을 이용하여 허가된 사용자에게만 선별적으로 티브이를 시청할 수 있도록 한 디지털 티브이 수신기의 화자인식 장치 및 방법을 제공함에 있다.
도 1은 일반적인 디지털 티브이 수신기의 블럭 구성도.
도 2는 도 1에서, PSIP(Program and System Information Protocol) 테이블의 기본 구조도.
도 3은 본 발명 화자인식 모듈을 구비한 디지털 티브이 수신기의 블럭 구성도.
도 4는 도 3에서, 화자인식 모듈에 의한 화자인식 과정도.
도 5는 본 발명 화자인식 모듈을 구비한 디지털 티브이 수신기의 초기출하시 사용자 등록방법에 대한 동작 흐름도.
도 6은 도 5에서, 사용자 등록시 사용자 특징추출방법에 대한 동작 흐름도.
도 7은 본 발명 디지털 티브이 수신기의 화자인식 방법에 대한 제1실시예.
도 8은 본 발명은 디지털 티브이 수신기의 화자인식 방법에 대한 제2실시예.
***** 도면의 주요 부분에 대한 부호의 설명 *****
101 : 튜너 102 : 패킷 분리기
103 : 오디오 디코더 104 : 비디오 디코더
105 : 스위치 106 : 엔티에스씨 엔코더
107 : OSD 처리기 108 : 마이크로 컴퓨터
109 : 롬 110 : 램
111 : 오디오 디지털/아날로그 변환기
112 : 사용자 인터페이스 113 : 음성 입력부
114 : 화자인식 모듈
상기 목적을 달성하기 위한 본 발명은 사용자가 록(LOCK) 메뉴 접근시 오디오를 뮤트시키는 제1단계와, 오디오 뮤트 후 사용자 음성을 받아들이는 제2단계와, 상기에서 사용자 음성을 받아들인 후 오디오를 뮤트시킨 후 화자인식 모듈을 통해 사용자가 등록된 화자인지를 검색하는 제3단계와, 상기에서 등록된 화자이면 록 메뉴의 접근을 허가하고 등록된 화자가 아니면 록 메뉴 접근을 허가하지 않도록 하는제4단계로 이루어진 것을 특징으로 한다.
또한 본 발명은 사용자에 의한 채널 절환 또는 새로운 프로그램 전송시 EIT에 의한 해당 프로그램에 대한 등급정보와 록 메뉴를 비교하는 제1단계와, 상기에서 새로운 프로그램이 록(LOCK)이 걸려있지 않으면 그대로 프로그램을 출력하고, 록이 걸려 있게 되면 비디오와 오디오 출력을 중지시키는 제2단계와, 상기에서 비디오 및 오디오 출력 중지 후 사용자 음성을 받아들여 등록된 사용자인지를 판단하는 제3단계와, 상기에서 등록된 사용자이면 중지시킨 비디오와 오디오를 출력해주고, 등록된 사용자가 아니면 비디오와 오디오 출력을 정지시키는 제4단계로 이루어진다.
이하, 첨부한 도면에 의거하여 상세히 설명하면 다음과 같다.
도 3은 본 발명 화자인식 모듈을 구비한 디지털 티브이 수신기의 블럭 구성도로서, 이에 도시한 바와같이, 안테나로 부터 원하는 채널의 신호를 입력받고, 그 신호를 검파 및 오류 정정을 행한 트랜스포트 신호열을 출력하는 튜너(101)와, 상기 트랜스포트 신호열을 받아 영상 신호열, 음성 신호열, 부가정보 신호열로 각각 분리하는 패킷 분리기(102)와, 상기에서 분리된 음성 및 영상 신호열을 신장시켜 오디오는 스피커(L,R)로, 영상은 CRT로 각각 출력하는 오디오/비디오 디코더(103)(104)와, 상기 부가정보 신호열을 입력받아 시청자에게 제공될 수 있는 정보로 데이터 베이스화하고, 화자인식을 수행하기 위한 동작을 제어하는 마이크로 컴퓨터(108)와, 사용자의 명령을 전달하는 사용자 인터페이스(112)와, 상기 사용자 인터페이스(112)로 부터 키 입력에 대해 대응하는 OSD정보를 롬으로 부터 전달받아OSD영상을 출력하는 OSD 처리기(107)와, 상기 비디오 디코더(104)와 OSD 처리기(107)의 출력을 스위칭하는 스위치(105)와, 상기 스위치(105)를 통해 전달되는 영상신호를 일반 티브이나 모니터(CRT)로 디스플레이할 수 있도록 휘도신호(Y)와 색신호(C)로 출력하는 엔티에스씨 엔코더(106)와, 사용자의 음성을 입력하기 위한 음성 입력부(113)와, 상기 음성 입력부(113)를 통해 입력되는 사용자의 음성 특징을 추출하여 미리 등록되어 있는 사용자와 비교하여 유사정도가 가장 큰 모델을 찾고, 이를 드레쉬홀드값과 비교하여 등록된 사용자인지를 여부를 판단하여 마이크로 컴퓨터(108)로 전달하는 화자인식 모듈(114)로 구성한다.
도 7은 본 발명 화자인식 모듈을 구비한 디지털 티브이 수신기의 화자인식 방법에 대한 제1실시예로서, 이에 도시한 바와같이, 사용자가 록(LOCK) 메뉴 접근시 오디오를 뮤트시키는 제1단계(S42)와, 상기에서 오디오 뮤트 후 사용자 음성의 입력을 요구한 후 그 사용자 음성을 받아들이는 제2단계(S43)와, 상기에서 사용자 음성을 받아들인 후 오디오 뮤트를 해제하는 제3단계(S44)와, 상기 제2단계에서 받아들인 사용자 음성의 특징을 이용하여 화자를 인식하는 제4단계(S45)와, 상기에서 인식한 화자가 등록되어 있는 화자인지를 검색하는 제5단계(S46)와, 상기에서 등록되어 있는 화자이면 록 메뉴의 접근을 허가하고, 등록된 화자가 아니면 록 메뉴 접근을 허가하지 않도록 하는 제6단계(S46,S47)로 이루어진다.
또한 도 8은 본 발명 화자인식 모듈을 구비한 디지털 티브이 수신기의 화자인식 방법에 대한 제2실시예로서, 이에 도시한 바와같이, 사용자에 의한 채널 절환 또는 새로운 프로그램 전송시 EIT에 의한 해당 프로그램에 대한 등급정보와 록메뉴를 비교하는 제1단계(S51,S52)와, 상기에서 새로운 프로그램이 록(LOCK)이 걸려있지 않으면 그대로 프로그램을 출력하고, 록이 걸려 있게 되면 비디오와 오디오를 뮤트시키는 제2단계(S53,S54)와, 상기에서 비디오 및 오디오 뮤트 후 사용자 음성을 받아들여 화자 인식을 수행하는 제3단계(S56)와, 상기에서 수행하여 인식한 화자가 등록된 화자이면 비디오 및 오디오 뮤트를 해제시켜 출력해주고, 등록된 화자가 아니면 비디오와 오디오 출력을 정지시키는 제4단계(S58)로 이루어진다.
이와같이 구성된 본 발명의 동작 및 작용 효과에 대하여 상세히 설명하면 다음과 같다.
튜너(101)는 안테나로 부터 신호를 입력받아 검파 및 오류정정한 트랜스포트 신호열을 패킷 분리기(102)로 제공하면, 상기 그러면 상기 패킷 분리기(102)는 트랜스포트 신호열을 역다중화시켜 영상 신호열, 음성 신호열, 부가정보 신호열로 분리한 후 출력한다.
이에 상기 음성 신호열은 오디오 디코더(103)에 의해 신장된 후 오디오 디지털/아날로그 변환기(111)를 거쳐 아날로그 음성신호로 변환되어 스피커의 L,R로 제공하여 음성을 출력한다.
그리고 영상 신호열은 비디오 디코더(104)에 의해 신장된 후 엔티에스씨 엔코더(106)로 출력한다.
이때 마이크로 컴퓨터(108)는 패킷 분리기(102)에서 분리된 부가정보를 읽어와 분석 및 조합 과정을 거쳐 시청자에게 제공될 수 정보로 데이터 베이스화한 후 램(110)에 저장해두고 필요할 때 읽어들여 사용한다.
그리고, 마이크로 컴퓨터(108)는 사용자 인터페이스(112)로 부터 키 입력에 대해서 대응하는 OSD정보를 롬(109)으로 읽어들여 OSD 처리기(107)로 전송하면, 상기 OSD 처리기(107)는 OSD 정보를 OSD 영상으로 처리하여 스위치(105)로 출력한다.
이와같은 동작을 수행하는 디지털 티브이 수신기에서 현재 일반저으로 사용되는 비밀번호 입력방식 대신 화자인식으로 대체하여 사용하고자 하는데, 이에 대하여 살펴보면 다음과 같다.
사용자가 음성 입력부(113)를 통해 음성을 입력하면, 이를 화자인식 모듈(114)에서 음성을 입력받아 도 4에 도시한 과정을 수행한다.
즉, 먼저 사용자의 음성을 입력받는다.(S11)
상기 사용자의 음성이 들어오면, 그 음성의 크기를 줄이면서 사용자의 음성특성을 잘 나타낼 수 있는 특징으로 추출한다.(S12)
이렇게 추출한 사용자의 음성특징과 미리 등록되어 있는 사용자들의 모델(파라미터)을 비교한다.(S13)
비교시 사용자와 미리 등록되어 있는 사용자들의 모델의 유사성을 계산하여 가장 일치하는 모델을 하나 찾아 선택한다.(S14)
그런다음 상기에서 선택한 모델의 값과 미리 정해진 드레쉬홀드(Threshold)를 비교하여(S15), 상기 드레쉬홀드 보다 높게되면 이는 인식이 제대로 되었음을 허가하고(S16), 상기 드레쉬홀드 보다 낮게되면 이는 인식이 제대로 되지 않았다고 판단하여 불가판정을 내린다.(S17)
이렇게 허가 및 불가판정을 마이크로 컴퓨터(108)로 제공하면, 상기 마이크로 컴퓨터(108)는 그에따른 동작을 수행하는데 이에 대하여는 뒤에서 살펴보기로 한다.
상기에서와 같이 동작하는 화자인식 모듈이 구비된 디지털 티브이 수신기를 출하할 경우 사용자가 등록할 수 있도록 있도록 하는데, 이에 대하여 도 5에 의거하여 살펴보자.
초기 출하시에는 록 오프(Lock off)시켜 출력하여 화자인식기능을 사용할 초기 사용자들을 등록할 수 있도록 한 후(S21) 초기 사용자의 음성을 입력받는다. (S22)
이렇게 사용자의 음성을 받아 화자인식 알고리즘에 따라 사용자의 특성을 잘 나타내면서 크기를 최소화할 수 있는 파라미터(모델)를 뽑게 되며, 이를 저장하게 된다.(S23)
이와같이 파라미터(모델)를 뽑는 과정을 도 6에 상세히 나타내고 있는데, 모델을 추정하기 위해서 사용하는 방법은 통계적인 램덤 과정(Random Process)에 기초를 둔 패턴 매칭방법(Pattern Matching Method)을 사용한다.
즉, 초기에 모델을 초기화(S31)한 후 특징추출되어 들어온 입력값에 좀더 일치하는 모델을 찾아가는 과정인 REESTIMATION 과정을 거치게 된다. 통계적인 재추정방법으로 대표적인 방법의 예로는 Baum-welch 알고리듬과 Segmental k-means 알고리듬이 있다. 특정 기준에 맞추어 재추정 과정을 종료시키게 되면 모델을 저장하게 된다.(S33)
다시 도 5에서 사용자의 음성으로 부터 특징을 나타내는 파라미터를 추정하여 저장(S23)한 후 록을 건다(Lock on).(S24)
이후부터는 화자인식 모듈(114)을 거쳐 프로그램에 따라 사용자를 선별하면 된다.
출하모드에서 출하시 초기 세팅에만 적용되는 모드이므로, 모든 처리가 끝나면 일반 사용자 모드로 전환한다.(S25)
이후에 일반 사용자 모드에 대하여 본 발명에서 두가지 방법으로 화자인식을 수행하는데, 먼저 도 7에 의거하여 화자를 인식하고 그 인식여부에 따라 록 메뉴(LOCK MENU)의 접근여부를 판단하는 과정에 대하여 살펴보자.
먼저, 사용자가 사용자 인터페이스(112)를 통해 록 메뉴에 접근하기 위한 키를 선택하면, 이를 인식한 마이크로 컴퓨터(108)는 부가정보를 저장해 둔 롬(109)으로 읽어들여 OSD처리기(107)로 출력하여 엔티에스씨 엔코더(106)를 통해 CRT로 디스플레이되도록 한다.
그러면 상기 마이크로 컴퓨터(108)는 티브이 스피커 출력에 의한 사용자 음성입력의 오염을 막기위해 오디오를 뮤트시킨다.(S42)
이후에 OSD나 스피커를 통해 사용자에게 음성을 입력하라고 요구한다.
이렇게 하여 사용자가 음성 입력부(113)를 통해 음성을 입력하면, 마이크로 컴퓨터(108)는 그 음성을 화자인식 모듈(114)로 전송한다.(S43)
음성을 입력받은 다음 뮤트시켰던 오디오 뮤트를 해제시킨다(S44)
상기 화자인식 모듈(114)은 앞에서 설명한 도 4의 과정을 거쳐 등록된 화자인지 아닌지를 검색(S45)하여, 마이크로 컴퓨터(108)로 전송하여 주면, 상기 마이크로 컴퓨터(108)는 등록된 화자인지 아닌지를 판단한다.(S46)
판단 결과, 등록된 화자인 경우 록 메뉴에 접근할 수 있도록 허가를 내주고(S47), 등록된 화자가 아닌 경우 록 메뉴에 접근할 수 없도록 허가를 내주지 않는다.(S48)
그런데, 도 7의 동작만으로는 사용자가 불편을 느끼게 된다.
예를 들어 미성년자 보호를 위해서는 록 메뉴를 자주 변경해야 되고, 사용자가 실수로 메뉴 변경을 잊어버려 미성년자들이 시청해서는 안될 프로그램에 접근가능할 수 있다.
메뉴의 잦은 변경에 부담을 느끼는 사용자들을 위해 메뉴에서는 대부분의 등급값을 오프시키고 도 8에 도시한 동작을 사용할 수 있다.
즉, 기존 채널에서 프로그램이 새로 시작하거나 사용자에 의해 채널이 절환도리 경우(S51), EIT에 의한 해당 프로그램에 대한 등급정보와 록 메뉴에 설정된 값을 비교한다.(S52)
비교 결과, 록이 걸려있으면 이는 미성년자들이 시청해서는 안되는 프로그램이므로 화자를 알아보기 위하여 오디오 및 비디오를 출력을 뮤트시키고, 사용자의 음성을 요구한다.(S54)
사용자가 음성 입력부(113)를 통해 음성을 입력하면, 그 음성을 화자인식 모듈(114)이 입력받는다.(S55)
이에 상기 화자인식 모듈(114)이 화자를 인식하여 등록된 화자인지 아닌지를 검색하여 마이크로 컴퓨터(108)로 알려준다.(S56)
그러면 상기 마이크로 컴퓨터(108)는 등록된 화자이면 오디오와 비디오 신호를 출력해주고(S58), 등록된 화자가 아닌 경우에는 오디오와 비디오 신호의 출력을 내보내지 않도록 한다.
이상에서와 같은 방법을 사용하게 되면 불편없이 미성년자들이 시청해서는 안되는 프로그램을 시청할 수 없게 해준다.
이상에서 상세히 설명한 바와같이 본 발명은 디지털 티브이 수신기에서 록 메뉴를 선택하기 위한 방법으로 기존의 비밀번호 설정기능 대신 화자인식으로 대체함으로써, 좀더 안전하고 관리하기 편하며, 사용하기 용이하도록 한 효고가 있다.

Claims (4)

  1. 튜너를 통해 전달되는 트랜스포트 신호열을 영상, 음성, 부가정보 신호열로 분리하는 패킷 분리기와, 상기에서 분리된 음성 및 영상을 신장시켜 스피커 및 CRT로 출력하는 오디오/비디오 디코더 및 엔티에스씨 엔코더와, 사용자의 명령을 전달하는 사용자 인터페이스로 부터의 키 입력에 대응하는 OSD정보를 엔티에스씨 엔코더로 출력하는 OSD 처리기로 이루어진 티브이 수신기에 있어서, 사용자의 음성을 입력하기 위한 음성 입력부와, 상기 음성 입력부를 통해 입력되는 사용자의 음성 으로 부터 추출한 특징값과 미리 등록되어 있는 화자를 비교하여 등록되어 있는지의 여부를 검색하는 화자인식 모듈과, 상기 화자인식 모듈에서 검색한 결과에 따라 오디오 및 비디오 신호의 출력여부를 결정하고, 그에따른 제어동작을 수행하기 위한 제어부를 포함한 것을 특징으로 하는 화자인식 모듈을 구비한 디지털 티브이 수신기.
  2. 사용자의 록(LOCK) 메뉴 접근시 오디오를 뮤트시킨 후 사용자 음성을 받아들이는 제1단계와, 상기에서 사용자 음성을 받아들이고 다시 오디오 뮤트를 해제하는 제2단계와, 상기에서 오디오 뮤트 해제 후 받아들인 사용자 음성특징을 추출하여 화자를 인식하는 제3단계와, 상기에서 인식된 화자가 미리 등록되어 있는 화자인지를 검색하는 제4단계와, 상기에서 등록된 화자이면 록 메뉴의 접근을 허가하고 등록된 화자가 아니면 록 메뉴 접근을 허가하지 않도록 하는 제4단계로 이루어진 것을 특징으로 하는 화자인식 모듈을 구비한 디지털 티브이 수신기의 화자인식 방법.
  3. 제2항에 있어서, 화자 인식은 사용자의 음성특징을 추출하는 제1과정과, 상기에서 추출된 특징값과 미리 등록된 화자들과 비교하여 유사정도가 가장높은 모델을 선정하는 제2과정과, 상기에서 선정한 모델의 유사정도와 미리 정해진 드레쉬홀드값을 비교하여 정해진 드레쉬홀드값보다 높은 경우만 제대로 인식했음을 허가하는 제3과정으로 이루어진 것을 특징으로 하는 화자인식 모듈을 구비한 디지털 티브이 수신기의 화자인식 방법.
  4. 사용자에 의한 채널 절환 또는 새로운 프로그램 전송시 EIT(Event Information Table)의 해당 프로그램에 대한 등급정보와 록 메뉴를 비교하는 제1단계와, 상기에서 새로운 프로그램이 록(LOCK)이 걸려있지 않으면 그대로 프로그램을 출력하고, 록이 걸려 있게 되면 비디오 및 오디오를 뮤트시키는 제2단계와, 상기에서 비디오 및 오디오 뮤트 후 사용자 음성을 받아들여 화자인식을 수행하는 제3단계와, 상기에서 인식된 화자가 등록되어 있으면 뮤트를 해제시켜 비디오 및 오디오를 출력하고, 등록되어 있지 않으면 비디오 및 오디오 출력을 정지시키는 제4단계로 이루어진 것을 특징으로 하는 화자인식 모듈을 구비한 디지털 티브이 수신기의 화자인식 방법.
KR1019990058569A 1999-12-17 1999-12-17 화자인식 모듈을 구비한 디지털 티브이 수신기 및 그의화자인식 방법 KR100311414B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1019990058569A KR100311414B1 (ko) 1999-12-17 1999-12-17 화자인식 모듈을 구비한 디지털 티브이 수신기 및 그의화자인식 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1019990058569A KR100311414B1 (ko) 1999-12-17 1999-12-17 화자인식 모듈을 구비한 디지털 티브이 수신기 및 그의화자인식 방법

Publications (2)

Publication Number Publication Date
KR20010056900A KR20010056900A (ko) 2001-07-04
KR100311414B1 true KR100311414B1 (ko) 2001-10-12

Family

ID=19626580

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1019990058569A KR100311414B1 (ko) 1999-12-17 1999-12-17 화자인식 모듈을 구비한 디지털 티브이 수신기 및 그의화자인식 방법

Country Status (1)

Country Link
KR (1) KR100311414B1 (ko)

Also Published As

Publication number Publication date
KR20010056900A (ko) 2001-07-04

Similar Documents

Publication Publication Date Title
KR100601739B1 (ko) 텔레비젼 방송 수신 장치 및 방법과, 텔레비젼 방송 방법
KR100311479B1 (ko) 디지털 티브이의 채널제어 장치 및 방법
JP4838427B2 (ja) ブロードキャストプログラム、プログラムガイドおよびチャネル識別データを獲得し処理するためのシステム
US8284326B2 (en) Method and apparatus for scanning channel
US20120304226A1 (en) Program guide apparatus acquiring program guide information and/or providing for program guide navigation using same
US20070028259A1 (en) Broadcasting signal receiving device and control method thereof
US8046789B2 (en) Broadcast receiving apparatus
US20040183947A1 (en) Apparatus and method for displaying signal strengths of every channel of digital broadcast receiver
JP2005524293A (ja) テレビジョンチャンネル視聴リスト中の全チャンネルを遮断又は視聴状態へ設定する方法
EP2768232B1 (en) Digital broadcast receiver and method of updating channel information
US20090044247A1 (en) Digital broadcasting receiving apparatus
JP4450022B2 (ja) デジタル放送受信装置
CA2564672C (en) Method and system for scanning video carrier channels of a television
KR100311414B1 (ko) 화자인식 모듈을 구비한 디지털 티브이 수신기 및 그의화자인식 방법
US20090195696A1 (en) Channel system and method
JP3931344B2 (ja) 電子番組ガイド情報処理方法
US20090201422A1 (en) Automatic input change based on remote control mode change
KR100947510B1 (ko) 홈 채널을 제공하는 방법 및 장치
US20090007180A1 (en) Method for tuning to preferred channel and video receiving apparatus using the same
JP4666099B2 (ja) 情報処理装置、および情報処理方法
KR100647365B1 (ko) 디지털 텔리비전의 자동 음향 조절 장치 및 방법
KR100822436B1 (ko) 디지털 방송 수신기의 장르별 시청시간 제한 방법
KR100440897B1 (ko) 디지털텔레비젼의지문인식시스템을이용한시청제한방법
US20100053460A1 (en) Broadcast reception apparatus
JP4554624B2 (ja) 情報処理装置、および情報処理方法

Legal Events

Date Code Title Description
A201 Request for examination
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20120827

Year of fee payment: 12

FPAY Annual fee payment

Payment date: 20130823

Year of fee payment: 13

FPAY Annual fee payment

Payment date: 20140822

Year of fee payment: 14

LAPS Lapse due to unpaid annual fee