KR101606170B1 - Iptv 방송 시스템, 서버 및 발성목록 생성 장치 - Google Patents

Iptv 방송 시스템, 서버 및 발성목록 생성 장치 Download PDF

Info

Publication number
KR101606170B1
KR101606170B1 KR1020090088629A KR20090088629A KR101606170B1 KR 101606170 B1 KR101606170 B1 KR 101606170B1 KR 1020090088629 A KR1020090088629 A KR 1020090088629A KR 20090088629 A KR20090088629 A KR 20090088629A KR 101606170 B1 KR101606170 B1 KR 101606170B1
Authority
KR
South Korea
Prior art keywords
iptv
list
unit
iptv broadcast
voice
Prior art date
Application number
KR1020090088629A
Other languages
English (en)
Other versions
KR20110030947A (ko
Inventor
왕지현
정의석
강병옥
Original Assignee
한국전자통신연구원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한국전자통신연구원 filed Critical 한국전자통신연구원
Priority to KR1020090088629A priority Critical patent/KR101606170B1/ko
Publication of KR20110030947A publication Critical patent/KR20110030947A/ko
Application granted granted Critical
Publication of KR101606170B1 publication Critical patent/KR101606170B1/ko

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/16Analogue secrecy systems; Analogue subscription systems
    • H04N7/173Analogue secrecy systems; Analogue subscription systems with two-way working, e.g. subscriber sending a programme selection signal
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/14Speech classification or search using statistical models, e.g. Hidden Markov Models [HMMs]

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Probability & Statistics with Applications (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Abstract

본 발명은 IPTV(Internet Protocol Television) 방송 시스템, 서버 및 발성목록 생성 장치에 대하여 개시한다. 본 발명의 일면에 따른 IPTV 방송의 발성목록 생성 장치는, 음성인식을 통해 IPTV 방송 서비스를 제공하기 위한 하나 또는 그 이상의 발성어 생성 패턴을 저장하는 패턴 데이터베이스; 상기 발성어 생성 패턴을 이용하여 사용자의 음성 명령에 대응하는 음성인식용 발성어의 발성목록을 생성하는 발성목록 생성부; 상기 IPTV 방송정보데이터로부터 추출형 핵심어를 추출하는 구조정보 추출부; 상기 IPTV 방송정보데이터로부터 사전형 핵심어를 추출하는 비구조정보 추출부; 및 상기 각각 추출된 핵심어를 사용자의 발음에 가까운 자연스러운 발성어로 가공하여 상기 발성목록 생성부에 제공하는 발성어 정규화부를 포함하는 것을 특징으로 한다.
IPTV 방송 서비스, 음성 인식 기술, 발성어 생성 패턴, IPTV, 인터넷 TV

Description

IPTV 방송 시스템, 서버 및 발성목록 생성 장치{Internet Protocol Television Broadcasting System, Server and Apparatus for Generating Lexicon}
본 발명은 IPTV(Internet Protocol Television) 방송 서비스에 관한 것으로서, 구체적으로는 사용자의 음성을 인식하여 그에 대응하는 IPTV 방송 서비스를 제공할 수 있는 IPTV 방송 시스템, 서버 및 발성목록 생성 장치에 관한 것이다.
본 발명은 지식경제부의 IT성장동력핵심기술개발사업의 일환으로 수행한 연구로부터 도출된 것이다[과제관리번호: 2006-S-036-04, 과제명: 신성장동력산업용 대용량 대화형 분산 처리 음성인터페이스 기술개발].
디지털 기술이 발전함에 따라, TV을 통한 광대역 통합망(BcN : Broadband Convergence Network)을 통한 방송 서비스가 늘고 있는 추세이며 특히, IP 기반 통신망에 연결된 TV를 통해 공중파, 유선, 지상파, 영화, 음악, 양방향 퀴즈쇼, TV 뱅킹, 인터넷 검색 등의 단방향/양방향 서비스를 제공할 수 있는 IPTV 방송 서비스가 주목받고 있다.
IPTV 방송 서비스에서, 제공자는 헤드 엔드(Head-End)를 통해 사용자가 선택한 채널의 콘텐츠를 전송하며, 댁내 사용자는 인터넷 접속가능한 셋탑 박스(STB; Set-Top Box)와 그에 연결된 TV를 통해 IPTV 방송 서비스를 제공받을 수 있다.
종래의 TV는 사용자 조작의 편의를 위해 고작 리모컨을 제공하였지만, IPTV는 음성 인식 기술을 접목하여 특정 메뉴 선택, 특정 명령 입력, 특정 채널 시청 요구나, 콘텐츠 선택 등을 사용자 음성을 인식하여 조작할 수 있는 편의를 제공하고 있다.
이러한 음성 인식 시스템은 발음의 형태에 따라 고립어 인식 방법과 연속어 인식 방법을 적용한다.
먼저, 휴대폰 음성 다이얼링(Voice Dialing) 등에 사용되는 고립어 인식 방법은 각 단어를 끊어서 읽고, 단어 앞뒤에 상당한 묵음 구간이 존재하여 단어의 처음과 끝을 파악하기 쉽고 인식률도 높은 장점이 있다.
그리고, 연속어 인식 방법은 문당 단위로 음성을 인식하고, 평상시의 발성 문장을 인식하며, 각 문장은 특별히 단어 사이의 묵음을 추가하지 않는다. 따라서, 연속어 인식 방식은 한 단어의 특성이 인접한 단어의 발음으로 인해 영향을 받는 조음 효과(Coarticulation Effect) 때문에 음성 인식이 다소 어렵다.
때문에, 국내외 대부분의 음성 인식 시스템은 한정된 응용 범위 내에서 인식성능이 높은 고립어 인식 방법을 채택하고 있다. 그런데, 고립어 인식 방법은 고립어 인식을 위해 인식할 어휘를 사전에 미리 준비해야 하여 이를 효과적으로 준비할 수 있는 방안이 필요하다.
전술한 문제점을 해결하기 위하여, 본 발명의 목적은 다양한 발성 형식에 맞추어 음성인식을 위한 발성어의 발성목록을 생성할 수 있는 IPTV 방송 시스템, 서버 및 발성목록 생성 장치를 제공함에 있다.
본 발명의 일면에 따른 IPTV 방송의 발성목록 생성 장치는, 음성인식을 통해 IPTV 방송 서비스를 제공하기 위한 하나 또는 그 이상의 발성어 생성 패턴을 저장하는 패턴 데이터베이스; 상기 발성어 생성 패턴을 이용하여 사용자의 음성 명령에 대응하는 음성인식용 발성어의 발성목록을 생성하는 발성목록 생성부; 상기 IPTV 방송정보데이터로부터 추출형 핵심어를 추출하는 구조정보 추출부; 상기 IPTV 방송정보데이터로부터 사전형 핵심어를 추출하는 비구조정보 추출부; 및 상기 각각 추출된 핵심어를 사용자의 발음에 가까운 자연스러운 발성어로 가공하여 상기 발성목록 생성부에 제공하는 발성어 정규화부를 포함하는 것을 특징으로 한다.
본 발명의 다른 면에 따른 IPTV 방송 시스템은, 사용자 음성 명령에 따른 IPTV 방송 서비스를 제공하도록, 사용자의 음성 명령에 대응하는 하나 또는 그 이상의 발성어를 포함하는 발성목록을 생성 및 제공하는 IPTV 방송 서버; 및 사용자 음성 명령을 인식하고 상기 발성목록을 이용하여 인식한 상기 음성 명령을 해석 및 처리하는 IPTV 셋탑 장치를 포함하는 것을 특징으로 한다.
본 발명의 또 다른 면에 따른 IPTV 방송 서버는, IPTV 방송 데이터를 저장하는 제1 데이터베이스; 상기 IPTV 방송 데이터를 이용하여 사용자 명령에 대응하는 발성목록을 생성하는 발성목록 생성부; 생성된 상기 발성목록을 저장하는 제2 데이터베이스; 상기 발성목록을 이용하여 인식된 음성을 해석하는 명령어 해석부; 해석 된 상기 음성에 대응하는 IPTV 방송 데이터를 검색하거나, 해석된 상기 음성에 대응하는 IPTV 방송의 애플리케이션을 실행하는 명령 처리부; 및 상기 검색된 IPTV 방송 데이터 또는 상기 애플리케이션의 실행 결과를 댁내 장치로 전송하는 전송부를 포함하는 것을 특징으로 한다.
본 발명에 따르면, 발성어 유형을 자세히 분류 및 정의하고, 각 유형을 고려하여 발성어를 생성함으로써, 사용자의 다양한 발성에 대응하는 IPTV 음성인식을 위한 발성목록을 제공할 수 있는 효과가 있다.
전술한 바와 같이, 근래의 IPTV 방송은 키보드와 같은 터치 형태의 인터페이스뿐만 아니라, 음성 인식용 인터페이스를 함께 제공하고 있다. 효과적인 음성 인식용 인터페이스를 제공하기 위하여, 본 발명은 텍스트 기반으로 제작된 IPTV 방송의 방송정보데이터로부터 발성 어휘에 관련된 발성어를 추출 및 분류하여 사용자의 다양한 발성에 대응하는 발성목록을 생성하여 제공한다.
이해를 돕기 위하여, 본 발명의 구성을 설명하기에 앞서 본 발명에 의해 생성되는 다양한 음성 인식을 위한 발성목록을 구성하는 발성어에 대하여 설명한다.
발성어는 그 내용에 따라 기기조작 명령어, 메뉴조작 명령어, 콘텐츠 핵심어, 단일형 영역주제어, 복합형 영역주제어 및 제약형 영역주제어 등이 있고, 그 형식에 따라 단일 발성어와 자연어 발성어 등이 있으며, 이하 각 발성어에 대하여 간략히 설명한다.
기기조작 명령어는 IPTV 셋탑 장치를 조작하는 명령어로서, 예컨대 'Turn On', '전원 꺼', '볼륨 올려', '볼륨 4칸 아래로' 등이다.
메뉴조작 명령어는 IPTV 방송 서비스의 사용자 인터페이스(UI: User Interface)를 조작하여 메뉴 전환 또는 콘텐츠 요청 등을 수행하는 애플리케이션 수행 명령어로서, 예컨대 '상위 메뉴로', '마이홈으로', '최신 영화 순으로', '가장 싼 가격 순으로' 등이다.
콘텐츠 핵심어는 사전형 핵심어와 추출형 핵심어로 구분되며, IPTV 방송용 콘텐츠의 정보를 기술하는 IPTV 방송정보데이터로부터 추출되는 문자열이다.
먼저, 사전형 핵심어는 IPTV 방송정보데이터로부터 추출된 단일명사로 구성된 단어이며, 예컨대 '이효리', '뿡뿡이', '삼성 코엑스' 등의 인명, 지명, 조직명 등을 나타내는 고유명사나, 'HIV(AIDS)', '영장실질심사제' 등과 같은 전문용어를 포함한다.
그 다음으로, 추출형 핵심어는 IPTV 방송정보데이터로부터 추출한 본제목이나 부가정보(예컨대, 모델명, 회차 정보, 예고편 등)이며, 예컨대 IPTV 방송정보데이터가 "<괜찮아, 울지마> 예고편"인 경우 추출형 핵심어는 '괜찮아 울지마'나 '예고편'일 수 있고, "12회 VJ네트워크 - 아차산, 이천한우농장, 충주시"인 경우는 제목인 'VJ 네트워크', 회차 정보인 '12회'일 수 있으며, "캐논 DSLR EOS-500D"인 경우는 모델명인 'EOS-500D'일 수 있다.
단일형 영역주제어(또는, 영역주제어)는 VOD콘텐츠뿐만 아니라, 쇼핑이나 날씨와 같은 정보서비스 등에서 빈번하게 사용되는, 분류를 위하여 사용되는 분류어, 특징을 설명하는 용어, 특정영역에서 자주 사용되는 용어 등이다. 예컨대, 쇼핑영역에서 '가전기기', '가구', '도서', '사무용품' 등의 분류어, VOD 콘텐츠의 '액션', '드라마', 'SF' 등과 같은 장르어, 날씨영역의 '최고온도', '최저온도', '습도', '강수량' 등이다.
복합형 영역주제어는 2개 이상의 단일형 영역주제어의 결합, 또는 2개 이상의 명사들과 단일형 영역주제어의 결합으로 구성되며, 예컨대 '판타지 영화', '스릴러 영화' 또는, '다음주 날씨', '내일 주가동향', '오늘 상영프로' 등이다.
제약형 영역주제어는 콘텐츠를 검색하기 위하여 사용되며, 검색할 대상을 제약 한정하기 위한 수식어를 사용한다. 즉, 수식어와 영역주제어의 결합으로 구성되며, 수식어는 관형어구(예컨대, 동사+관형형어미 등)로 구성될 수 있다. 예컨대, '가족이 볼만한 영화, '최근에 개봉한 영화', '가장 가까운 지하철역', '가장 싼 배드민턴 라켓' 등일 수 있다.
단일어 발성어는 서술어가 아니라 명사로 끝나는 발성어이며, 자연어 발성어는 서술어(동사+종결형 어미)인 문장형태로 구성된 발성어이다.
이와 같이, 본 발명은 이러한 다양한 유형의 발성어들을 조합하여 효과적으로 발성목록을 생성할 수 있는 발성목록 생성 장치와, 발성목록 생성 장치를 적용한 IPTV 방송 서버 및 IPTV 방송 시스템에 대한 것이다. 이하, 도면을 참조하여 본 발명의 기술적 특징에 대하여 보다 상세히 설명한다.
이하, 도 1을 참조하여 본 발명의 실시예에 따른 IPTV 방송의 발성목록 생성 장치에 대하여 설명한다. 도 1은 본 발명의 실시예에 따른 IPTV 방송의 발성목록 생성 장치를 도시한 구성도이다.
도 1에 도시된 바와 같이, IPTV 방송의 발성목록 생성 장치(240)는 발성어생성패턴 데이터베이스(111) 및 발성목록 생성부(110)를 포함한다.
발성어생성패턴 데이터베이스(111)는 음성인식을 통해 IPTV 방송 서비스를 제공하기 위한 음성인식용 발성목록을 생성하기 위한 하나 또는 그 이상의 발성어 생성 패턴을 저장한다. 여기서, 각 발성어 생성 패턴은 다양한 종류의 발성어 즉, 기기조작 명령어, 메뉴조작 명령어, 콘텐츠 핵심어, 단일형 영역주제어, 복합형 영역주제어나, 제약형 영역주제어 등을 고려하여 결정될 수 있다.
여기서, 발성어생성패턴 데이터베이스(111)는 음성인식을 통하여 IPTV 방송 서비스를 제공하기 위하여 IPTV 방송 서비스에 새로운 서비스가 부가되면, 새로운 서비스의 발성어 생성 패턴을 더 포함하도록 업데이트된다.
발성목록 생성부(110)는 발성어생성패턴 데이터베이스(111)에 저장된 발성어 생성 패턴에 하나 또는 그 이상의 발성어를 적용하여 IPTV 방송정보데이터로부터 인식한 사용자의 음성 명령에 대응하는 다수의 발성목록을 생성한다. 즉, 발성목록 생성부(110)는 발성어 생성 패턴에 따라 하나 또는 그 이상의 발성어를 포함시켜, IPTV 방송 데이터를 검색하고자하는 사용자의 다양한 음성 명령에 대응하는 발성목록을 생성할 수 있다.
여기서, 사용자의 음성 명령은 기기조작 명령어, 메뉴조작 명령어, 콘텐츠 핵심어, 단일형 영역주제어, 복합형 영역주제어나, 제약형 영역주제어 등에 관련된 것이다.
이하, 하기의 표 1을 참조하여 발성어생성패턴 데이터베이스(111)에 저장된 발성어 생성 패턴에 대하여 설명한다. 여기서, 하기의 표 1은 BNF(Backus Naur Form)문법으로 정의된 발성어 생성 패턴이다.
Figure 112009057607862-pat00001
발성어 생성 패턴은 표 1과 같이 1개 이상의 Term으로 구성되며(가), Term은 비단말텀(NonTerminalTerm), 단말텀(TerminalTerm) 및 변수 중 어느 하나일 수 있다(나).
여기서, 비단말텀은 시작문자인 "<"와, 종료문자인 ">" 사이에 존재하는 또 다른 발성어 생성 패턴이 기술된 파일 명칭이며(다), 단말텀은 시작문자인 " ' "와, 종료문자인 " ' " 사이에 존재하는 발성어문자열일 수 있다(라). 또한, 변수는 IPTV 방송정보데이터로부터 추출된 콘텐츠 핵심어로 구성된 문자열일 수 있으며(마), 반복자는 Term뒤에 포함된 '+', '*', '?'인데, '+'는 동일한 Term이 1번 이상 반복될 수 있다는 의미이며, '*'는 동일한 Term이 생략되거나, 1번 이상 반복될 수 있다는 의미이며, '?'는 동일한 Term이 생략되거나, 1번 사용된다는 의미이다(바).
이하, 하기의 표 2를 참조하여 실제로 사용될 수 있는 발성어 생성 패턴의 예에 대하여 설명한다. 표 2는 본 발명의 실시예에 따른 발성어 생성 패턴의 예시이다.
Figure 112009057607862-pat00002
표 2의 발성어 생성 패턴은 각각 '영화발성목록.txt'의 내용과 같으며, '배우명.txt', '장르명.txt', IPTV 방송정보데이터로부터 추출한 콘텐츠 핵심어 등을 참조한다.
발성목록 생성부(110)는 '영화발성목록.txt'에 기재된 발성어 생성 패턴을 이용하여 하기의 표 3과 같은 발성목록을 생성할 수 있다.
Figure 112009057607862-pat00003
표 3의 VJ네트워크 12회, VJ네트워크는 "12회 VJ네트워크 - 아차산, 이천한우농장"라는 IPTV 방송정보데이터로부터 추출한 콘텐츠 핵심어를 표 2의 4행 $본제목 $회차, 5행 $본제목에 맵핑한 것이다. 즉, 발성목록 생성부(110)는 (차), (카)에 본제목인 'VJ네트워크'와, 회차인 '12회'를 맵핑하여 표 3과 같은 발성목록을 생성할 수 있다.
발성목록 생성부(110)는 표 1 내지 3에 의해 예시된 방법으로 기기조작 명령어, 메뉴조작 명령어, 단일형 영역주제어, 복합형 영역주제어나, 제약형 영역주제어 등의 발성어를 하나 이상 포함시켜 발성목록을 생성할 수 있다.
한편, IPTV 방송의 발성목록 생성 장치(240)는 사용자의 음성 명령이 콘텐츠 핵심어에 관련된 것일 때, IPTV 방송정보데이터로부터 추출형 핵심어와 사전형 핵심어를 각각 추출하는 구조정보 추출부(120)와 비구조정보 추출부(130) 및 각각 추출된 핵심어를 사용자의 발음에 가까운 자연스러운 발성어로 가공하여 발성목록 생성부(110)에 제공하는 발성어 정규화부(140)를 더 포함한다. 이하, 각 부에 대하여 설명한다.
구조정보 추출부(120)는 IPTV 방송정보데이터에 소정기호가 포함될 때나 HTML 등의 마크업(Mark-up) 언어형식일 때 등에, IPTV 방송정보데이터로부터 정규 표현식(Regular Expression)이나 패턴규칙 등의 규칙(121)을 파악하고, 파악된 규칙을 이용하여 IPTV 방송정보데이터로부터 본제목이나 부가정보를 추출한다.
예컨대, 구조정보 추출부(120)는 VOD 콘텐츠에 대한 IPTV 방송정보데이터가 "<괜찮아, 울지마> 예고편"인 경우, '<'와 '>'라는 기호문자의 규칙(121)을 파악하고, 본제목인 '괜찮아 울지마'와 부가정보인 '예고편'를 추출할 수 있다.
비구조정보 추출부(130)는 IPTV 방송정보데이터에 포함된 고유명사나 전문용어를 추출한다. 즉, 비구조정보 추출부(130)는 고유명사나 전문용어를 포함하는 사전(131)으로부터 IPTV 방송정보데이터에 포함된 문자열이 존재하는지를 확인하고, 존재하는 것으로 확인되면 이를 추출한다. 그런데, IPTV 방송정보데이터는 "EBS 방귀대장뿡뿡이"와 같이, 일반적인 사전에 등록되어 있지 않은 인명이나, 캐릭터 명이 존재할 것이므로, 콘텐츠의 방송정보데이터가 등록되지 않은 고유명사를 포함할 경우, 등록되지 않은 고유명사를 발성목록 생성부(110)의 관리자, IPTV 방송서비스 관련자 및 콘텐츠 생성자 등에 의해 사전(131)에 등록하는 절차가 필요할 수 있다.
발성어 정규화부(140)는 구조정보 추출부(120) 및 비구조정보 추출부(130)에 의하여 추출된 본제목, 부가정보, 고유명사나, 전문용어 등을 기설정된 규칙에 따라 사용자의 음성 명령에 가까운 형태로 변환한다.
예컨대, 발성어 정규화부(140)는 "MR. 후아유"라는 IPTV 방송정보데이터로부터 추출된 'MR'를 사용자의 음성 명령에 가까운 '미스터'로 변환하고, "김관장VS김관장VS김관장"이라는 IPTV 방송정보데이터로부터 추출된 'VS'를 '대'로 변환하며, "ST. ELMO'S FILE"라는 IPTV 방송정보데이터로부터 추출된 'ST'를 '세인트'로 변환하며, "9회말2아웃"이라는 IPTV 방송정보데이터로부터 추출된 '9회말2아웃'을 '구회말투아웃'으로 변환할 수 있다.
이하, 도 2를 참조하여 본 발명의 실시예에 따른 IPTV 방송의 발성목록 생성 장치(240)가 적용된 IPTV 방송 시스템에 대하여 설명한다. 도 2는 본 발명의 실시예에 따른 IPTV 방송 시스템을 도시한 구성도이다.
도 2에 도시된 바와 같이, 본 발명의 실시예에 따른 IPTV 방송 시스템(20)은 IPTV 방송 서버(200) 및 IPTV 셋탑 장치(300)를 포함한다.
IPTV 방송 서버(200)는 인식한 음성에 따른 IPTV 방송 서비스를 제공하도록, 사용자의 음성 명령에 대응하는 하나 또는 그 이상의 발성어를 포함하는 발성목록을 생성 및 제공하며, 방송데이터 데이터베이스(211), 정보데이터 데이터베이스(212), 관리부(250), 발성목록 생성부(240), 명령어 해석부(230), 검색부(220), 애플리케이션 수행부(260) 및 전송부(270)를 포함한다. 이하, IPTV 방송 서버(200)의 각 구성요소에 대하여 설명한다.
방송데이터 데이터베이스(211)는 IPTV 방송 서비스를 위한 IPTV 방송 데이터(예컨대, 콘텐츠 및 VOD 파일 등)들을 저장하며, 정보데이터 데이터베이스(212)는 IPTV 방송정보데이터(예컨대, 콘텐츠의 타이틀 등)를 저장한다.
관리부(250)는 IPTV 방송 데이터 및 방송정보데이터를 저장하고 관리하며, IPTV 방송에 신규 서비스 또는 콘텐츠가 부가될 때 방송데이터 데이터베이스(211) 및 정보데이터 데이터베이스(212)를 업데이트한다. 이때, 관리부(250)는 IPTV 방송 데이터 및 방송정보데이터를 저장날짜, 시간, 콘텐츠의 종류, 소스나, 제작자 정보 등으로 필드를 나눠 관리할 수 있다.
발성목록 생성부(240)는 인식한 음성에 따른 IPTV 방송 서비스를 제공하도록, 하나 또는 그 이상의 발성어를 포함시켜 발성목록을 생성하고, 생성된 발성목록을 발성목록 데이터베이스(241)에 저장한다. 그런데, 방송데이터는 지속적으로 새롭게 업데이트되나, 발성목록 데이터베이스(241)의 저장공간은 한정적이므로, 발성목록 생성부(240)(또는, 관리부(250))는 발성목록과 방송정보데이터를 연관지어 저장함으로써, 발성목록 데이터베이스(241)의 사용되지 않는 발성목록을 삭제하는 등의 관리를 수행할 수 있다.
발성목록 생성부(240)는 전술한 표 1 내지 3의 방법을 통하여 발성목록을 생성할 수 있으며, 생성된 발성목록을 실시간 또는 주기적으로 IPTV 셋탑 장치(300)로 전송하여 IPTV 셋탑 장치(300)가 새로운 IPTV 방송을 인지하도록 한다.
명령어 해석부(230)는 하나 또는 그 이상의 발성목록을 이용하여 인식된 사용자 음성 명령을 해석한다. 즉, 명령어 해석부(230)는 IPTV 셋탑 장치(300)로부터 사용자 음성 명령에 대응하는 문자열을 수신 및 해석하고, 해석된 명령이 IPTV 방송 데이터 검색을 요청하는 명령이면 검색부(220)로 전달하고, IPTV 방송의 애플리케이션 실행을 요청하는 명령이면 애플리케이션 수행부(260)로 전달한다. 여기서, 애플리케이션은 인터넷 검색, 홈쇼핑 검색, 구매, 날씨 조회, 주식 조회, 증권 조회 등에 관련된 것일 수 있다.
검색부(220)는 명령어 해석부(230)로부터 IPTV 방송 데이터 검색을 요청하는 명령을 전달받아 방송데이터 데이터베이스(211)로부터 해석된 음성 명령에 대응하는 IPTV 방송 데이터를 검색한다.
애플리케이션 수행부(260)는 명령어 해석부(230)로부터 IPTV 방송의 애플리케이션 실행을 요청하는 명령을 전달받아, 해석된 명령에 대응하는 IPTV 방송의 애플리케이션을 실행한다. 상세하게는, 애플리케이션 수행부(260)는 애플리케이션 데이터베이스(261)에 저장된 다수의 애플리케이션을 실행하고, 애플리케이션 실행 결과를 전송부(270)로 전달한다.
예컨대, 애플리케이션 수행부(260)는 수신한 문자열이 "가장 싼 배드민턴 라켓"이면, 이를 SQL문으로 만들어 애플리케이션 데이터베이스(261)에 저장된 쇼핑 데이터 중에서 배드민턴 라켓 상품을 정렬하고, 그로부터 가장 가격이 낮은 배드민턴 라켓을 검색하여 IPTV 셋탑 장치(300)에 제공할 수 있다.
또는, 수신한 문자열이 "오늘 대전지역 날씨"이면, SQL문을 이용하여 애플리케이션 데이터베이스(261)에 저장된 날씨정보에 대해 날짜 필드와 지역 필드에 각각 오늘 날짜와 대전 지역을 입력하고, 날씨정보를 검색하여 IPTV 셋탑 장치(300)에 제공할 수 있다.
전송부(270)는 검색부(220)에 의하여 검색된 IPTV 방송 데이터 또는 애플리케이션 수행부(260)의 애플리케이션 실행에 따른 결과(예컨대, UI 메뉴)를 IPTV 셋탑 장치(300)로 전송한다.
한편, IPTV 방송 서버(200)의 검색부(220)와 애플리케이션 수행부(260)는 별개의 구성요소로 구분되지 않고, 데이터 검색 또는 애플리케이션 실행을 수행하는 처리부(미도시)로 병합되어 구성될 수 있음은 물론이다. 이하, IPTV 셋탑 장치(300)에 대하여 설명한다.
IPTV 셋탑 장치(300)는 사용자 음성 명령을 인식하고 상기 하나 또는 그 이상의 발성목록을 이용하여 인식한 음성 명령을 해석 및 처리하며, 발성목록 데이터베이스(310), 음성 인식부(320), 명령어 해석부(330), 제어부(340) 및 표시부(350)를 포함한다.
발성목록 데이터베이스(310)는 IPTV 방송 서버(200)로부터 하나 또는 그 이상의 발성목록을 제공받아 저장한다. 이때, 발성목록 데이터베이스(310)는 새로운 IPTV 방송 또는 그 서비스에 대한 발성목록을 IPTV 방송 서버(200)로부터 실시간 또는 주기적으로 제공받는다.
음성 인식부(320)는 사용자 음성 명령을 인식하고, 하나 또는 그 이상의 발성목록을 이용하여 음성 명령을 문자열로 변환한다.
명령어 해석부(330)는 음성 인식부(320)로부터 전달받은 문자열이 기기조작 명령어인지를 확인하고, 기기조작 명령어가 아니면 문자열에 대응하는 IPTV 방송 서비스를 요청한다. 그러면, IPTV 방송 서버(200)의 명령어 해석부(330)가 문자열을 수신하고, IPTV 방송 데이터를 요청하는 명령어인지, IPTV 방송의 애플리케이션의 수행을 요청하는 명령인지를 해석하고, 해석결과에 따라 검색부(220) 또는 애플리케이션 수행부(260)로 해석된 명령을 전달한다.
제어부(340)는 명령어 해석부(330)로부터 기기조작 명령어를 전달받으면, 그에 따라 IPTV 셋탑 장치(300)의 동작을 제어한다. 이때, 기기조작 명령어는 전술한 바와 같이 IPTV 셋탑 장치를 조작하는 명령어로서, 예컨대 'Turn On', '전원 꺼', '볼륨 올려', '볼륨 4칸 아래로' 등이다.
표시부(350) 명령어 해석부(330)의 요청에 따라 검색되거나, 애플리케이션의 실행에 따라 제공되는 IPTV 방송 서비스를 표시한다. 이러한, 방식으로 본 발명은 음성인식에 따른 IPTV 방송 서비스를 제공할 수 있다.
이상, 본 발명의 구성에 대하여 첨부 도면을 참조하여 상세히 설명하였으나, 이는 예시에 불과한 것으로서, 본 발명이 속하는 기술분야에 통상의 지식을 가진자라면 본 발명의 기술적 사상의 범위 내에서 다양한 변형과 변경이 가능함은 물론이다. 따라서 본 발명의 보호 범위는 전술한 실시예에 국한되어서는 아니되며 이하의 특허청구범위의 기재에 의하여 정해져야 할 것이다.
도 1은 본 발명의 실시예에 따른 IPTV 방송의 발성목록 생성 장치를 도시한 구성도.
도 2는 본 발명의 실시예에 따른 IPTV 방송 시스템을 도시한 구성도.

Claims (10)

  1. 음성인식을 통해 IPTV(Internet Protocol Television) 방송 서비스를 제공하기 위한 하나 또는 그 이상의 발성어 생성 패턴을 저장하는 패턴 데이터베이스;
    상기 발성어 생성 패턴을 이용하여 사용자의 음성 명령에 대응하는 음성인식용 발성어의 발성목록을 생성하는 발성목록 생성부;
    IPTV 방송정보데이터로부터 추출형 핵심어를 추출하는 구조정보 추출부;
    상기 IPTV 방송정보데이터로부터 사전형 핵심어를 추출하는 비구조정보 추출부; 및
    상기 각각 추출된 핵심어를 사용자의 발음에 가까운 자연스러운 발성어로 가공하여 상기 발성목록 생성부에 제공하는 발성어 정규화부
    를 포함하는 IPTV 방송의 발성목록 생성 장치.
  2. 제1항에 있어서,
    상기 발성목록은 콘텐츠 핵심어, 기기조작 명령어, 메뉴조작 명령어, 단일형 영역주제어, 복합형 영역주제어나, 제약형 영역주제어를 포함하는 발성어를 하나이상 포함하여 구성되며,
    상기 콘텐츠 핵심어는, IPTV 방송정보데이터에 포함된 문자열로부터 구성되는 것인 IPTV 방송의 발성목록 생성 장치.
  3. 삭제
  4. 제1항에 있어서, 상기 패턴 데이터베이스는,
    상기 IPTV 방송 서비스에 새로운 서비스가 부가되면, 상기 새로운 서비스에 대한 발성어 생성 패턴을 더 포함하도록 업데이트되는 것인 IPTV 방송의 발성목록 생성 장치.
  5. 사용자 음성 명령에 따른 IPTV(Internet Protocol Television) 방송 서비스를 제공하도록, 사용자의 음성 명령에 대응하는 하나 또는 그 이상의 발성어를 포함하는 발성목록을 생성 및 제공하는 IPTV 방송 서버; 및
    사용자 음성 명령을 인식하고 상기 발성목록을 이용하여 인식한 상기 음성 명령을 해석 및 처리하는 IPTV 셋탑 장치를 포함하되,
    상기 IPTV 방송 서버는,
    IPTV 방송정보데이터로부터 추출형 핵심어를 추출하는 구조정보 추출부;
    상기 IPTV 방송정보데이터로부터 사전형 핵심어를 추출하는 비구조정보 추출부; 및
    상기 각각 추출된 핵심어를 사용자의 발음에 가까운 자연스러운 발성어로 가공하는 발성어 정규화부; 를 포함하여 상기 발성목록을 생성하는 것
    인 IPTV 방송 시스템.
  6. 제5항에 있어서, 상기 IPTV 셋탑 장치는,
    상기 발성목록을 제공받아 저장하는 발성목록 데이터베이스;
    상기 사용자 음성 명령을 인식하고, 상기 발성목록을 이용하여 상기 음성 명령을 문자열로 변환하는 음성 인식부;
    상기 문자열이 기기조작 명령어인지를 확인하고, 기기조작 명령어가 아니면 상기 IPTV 방송 서버로 상기 문자열에 대응하는 IPTV 방송 서비스를 요청하는 명령어 해석부;
    상기 기기조작 명령어에 따라 상기 IPTV 셋탑 장치의 동작을 제어하는 제어부; 및
    상기 요청에 따라 제공되는 IPTV 방송 서비스를 표시하는 표시부
    를 포함하는 것인 IPTV 방송 시스템.
  7. 제5항에 있어서, 상기 IPTV 방송 서버는,
    IPTV 방송 데이터를 저장하는 방송데이터 데이터베이스;
    상기 인식한 음성에 따른 IPTV 방송 서비스를 제공하도록 상기 하나 또는 그 이상의 발성어를 포함하는 발성목록을 생성하는 발성목록 생성부;
    상기 발성목록을 이용하여 상기 인식된 음성 명령을 해석하는 명령어 해석부;
    상기 데이터베이스로부터 상기 해석된 음성 명령에 대응하는 IPTV 방송 데이터를 검색하는 검색부;
    상기 해석된 음성 명령에 대응하는 IPTV 방송의 애플리케이션을 실행하는 실행부; 및
    상기 검색된 IPTV 방송 데이터 또는 상기 애플리케이션 실행에 따른 결과를 상기 IPTV 셋탑 장치로 전송하는 전송부
    를 포함하는 것인 IPTV 방송 시스템.
  8. IPTV(Internet Protocol Television) 방송 데이터를 저장하는 제1 데이터베이스;
    상기 IPTV 방송 데이터를 이용하여 사용자 명령에 대응하는 발성목록을 생성하는 발성목록 생성부;
    생성된 상기 발성목록을 저장하는 제2 데이터베이스;
    상기 발성목록을 이용하여 인식된 음성을 해석하는 명령어 해석부;
    해석된 상기 음성에 대응하는 IPTV 방송 데이터를 검색하거나, 해석된 상기 음성에 대응하는 IPTV 방송의 애플리케이션을 실행하는 명령 처리부;
    상기 검색된 IPTV 방송 데이터 또는 상기 애플리케이션의 실행 결과를 댁내 장치로 전송하는 전송부;
    상기 IPTV 방송 데이터로부터 추출형 핵심어를 추출하는 구조정보 추출부;
    상기 IPTV 방송 데이터로부터 사전형 핵심어를 추출하는 비구조정보 추출부; 및
    상기 각각 추출된 핵심어를 사용자의 발음에 가까운 자연스러운 발성어로 가공하여 상기 발성목록 생성부에 제공하는 발성어 정규화부;
    를 포함하는 IPTV 방송 서버.
  9. 제8항에 있어서, 상기 발성목록 생성부는,
    IPTV 방송을 위한 비구조 데이터 및 구조 데이터 중 적어도 하나를 포함하는 발성어 생성 패턴을 이용하여 상기 발성목록을 생성하는 것인 IPTV 방송 서버.
  10. 제8항에 있어서, 상기 제2 데이터베이스는,
    상기 제1 데이터베이스와 연관지어 저장되는 것인 IPTV 방송 서버.
KR1020090088629A 2009-09-18 2009-09-18 Iptv 방송 시스템, 서버 및 발성목록 생성 장치 KR101606170B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020090088629A KR101606170B1 (ko) 2009-09-18 2009-09-18 Iptv 방송 시스템, 서버 및 발성목록 생성 장치

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020090088629A KR101606170B1 (ko) 2009-09-18 2009-09-18 Iptv 방송 시스템, 서버 및 발성목록 생성 장치

Publications (2)

Publication Number Publication Date
KR20110030947A KR20110030947A (ko) 2011-03-24
KR101606170B1 true KR101606170B1 (ko) 2016-04-01

Family

ID=43936314

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020090088629A KR101606170B1 (ko) 2009-09-18 2009-09-18 Iptv 방송 시스템, 서버 및 발성목록 생성 장치

Country Status (1)

Country Link
KR (1) KR101606170B1 (ko)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106919361A (zh) * 2017-02-13 2017-07-04 北京优炫软件股份有限公司 一种语音提醒方法及装置

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009080579A (ja) * 2007-09-25 2009-04-16 Toshiba Corp 検索装置、方法及びプログラム

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009080579A (ja) * 2007-09-25 2009-04-16 Toshiba Corp 検索装置、方法及びプログラム

Also Published As

Publication number Publication date
KR20110030947A (ko) 2011-03-24

Similar Documents

Publication Publication Date Title
KR101289081B1 (ko) 음성 인터페이스를 이용한 iptv 시스템 및 서비스 방법
US8620658B2 (en) Voice chat system, information processing apparatus, speech recognition method, keyword data electrode detection method, and program for speech recognition
JP3923513B2 (ja) 音声認識装置および音声認識方法
US10631057B2 (en) System and method for natural language driven search and discovery in large data sources
KR100764174B1 (ko) 음성 대화 서비스 장치 및 방법
US6324512B1 (en) System and method for allowing family members to access TV contents and program media recorder over telephone or internet
US9123335B2 (en) System apparatus circuit method and associated computer executable code for natural language understanding and semantic content discovery
US20220044668A1 (en) Translating between spoken languages with emotion in audio and video media streams
KR101359715B1 (ko) 모바일 음성 웹 제공 방법 및 장치
JP3554262B2 (ja) テレビジョン及びマルチメディアの検索及び要求に対して自然言語のモダリティーを可能にする汎用遠隔制御
WO2018021237A1 (ja) 音声対話装置、音声対話方法、および記録媒体
KR20100067174A (ko) 음성 인식을 이용한 메타데이터 검색기, 검색 방법, iptv 수신 장치
KR20080068844A (ko) 텍스트 메타데이터를 갖는 음성문서의 인덱싱 및 검색방법, 컴퓨터 판독가능 매체
KR102246893B1 (ko) 대화형 시스템, 이의 제어 방법, 대화형 서버 및 이의 제어 방법
JP2001142481A (ja) 音声/ビデオ装置用の制御システム及び音声/ビデオ構成を制御するための統合アクセスシステム
US11837221B2 (en) Age-sensitive automatic speech recognition
KR20080052279A (ko) 실생활 정보제공 대화형 tv 에이전트 서비스 방법 및장치
US20150371627A1 (en) Voice dialog system using humorous speech and method thereof
JP4100243B2 (ja) 映像情報を用いた音声認識装置及び方法
KR102261539B1 (ko) 지능형 한국 문화 플랫폼 서비스 제공 시스템
JP2007249907A (ja) 知識メタデータ生成装置及び知識メタデータ生成プログラム
KR101606170B1 (ko) Iptv 방송 시스템, 서버 및 발성목록 생성 장치
US11922931B2 (en) Systems and methods for phonetic-based natural language understanding
KR101001618B1 (ko) 음성 인식 정보 생성 장치 및 음성 인식 정보 생성 방법, 이를 이용한 방송 서비스 방법
JP2021144633A (ja) ユーザの関心度に応じて対話内容を切り替える対話装置、プログラム及び方法

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
LAPS Lapse due to unpaid annual fee