KR20050023941A - 음성 인식 및 화자 인식을 통한 개별화된 서비스를제공하는 a/v 장치 및 그 방법 - Google Patents

음성 인식 및 화자 인식을 통한 개별화된 서비스를제공하는 a/v 장치 및 그 방법 Download PDF

Info

Publication number
KR20050023941A
KR20050023941A KR1020030061511A KR20030061511A KR20050023941A KR 20050023941 A KR20050023941 A KR 20050023941A KR 1020030061511 A KR1020030061511 A KR 1020030061511A KR 20030061511 A KR20030061511 A KR 20030061511A KR 20050023941 A KR20050023941 A KR 20050023941A
Authority
KR
South Korea
Prior art keywords
voice
user
input
command
recognition
Prior art date
Application number
KR1020030061511A
Other languages
English (en)
Inventor
최승억
정선화
명인식
이정봉
Original Assignee
삼성전자주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 삼성전자주식회사 filed Critical 삼성전자주식회사
Priority to KR1020030061511A priority Critical patent/KR20050023941A/ko
Priority to JP2004188859A priority patent/JP2005078072A/ja
Priority to EP04254257A priority patent/EP1513136A1/en
Priority to US10/899,052 priority patent/US20050049862A1/en
Priority to CNB2004100740661A priority patent/CN1300765C/zh
Publication of KR20050023941A publication Critical patent/KR20050023941A/ko

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04QSELECTING
    • H04Q9/00Arrangements in telecontrol or telemetry systems for selectively calling a substation from a main station, in which substation desired apparatus is selected for applying a control signal thereto or for obtaining measured values therefrom
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command

Abstract

본 발명은 리모컨의 무선 마이크를 통해 사용자의 음성이 입력되면 상기 입력된 음성 신호에 대한 음성 인식 및 화자 인식을 수행하고, 입력된 명령어에 대한 판단을 수행하여 해당 사용자의 개별화된 서비스를 제공하는 A/V 장치로 구성되며, 사용자가 리모컨의 무선 마이크를 통해 음성을 입력하는 단계와, 상기 음성이 입력되면 입력된 음성과 음성을 입력한 화자를 인식하는 단계와, 상기 입력된 음성을 기초로 명령어를 판단하는 단계 및 상기 판단 결과에 따른 서비스를 제공하는 단계를 포함하는 것을 특징으로 한다.

Description

음성 인식 및 화자 인식을 통한 개별화된 서비스를 제공하는 A/V 장치 및 그 방법{AUDIO/VIDEO APPARATUS AND METHOD FOR PROVIDING PERSONALIZED SERVICES THROUGH VOICE RECOGNITION AND SPEAKER RECOGNITION}
본 발명은 음성 인식 및 화자 인식을 통한 개별화된 서비스를 제공하는 A/V 장치 및 방법에 관한 것으로서, 특히 사용자의 음성이 입력되면 음성 인식 및 화자 인식을 동시에 수행하고, 화자 인식에 따른 개별화된 서비스를 제공하는 음성 인식 및 화자 인식을 통한 개별화된 서비스를 제공하는 A/V 장치 및 방법에 관한 것이다.
종래에는 개별화된 서비스를 제공받기 위해서, 사용자가 화자 인식 모드를 선택한 후 이미 등록해 놓은 암호(입력어)를 발성하여 사용자 인식을 수행하고, 그 다음 원하는 서비스를 제공받기 위해 해당 명령어를 발성함으로써, 개별화된 서비스를 제공 받았다.
따라서, 사용자는 화자 인식을 위한 암호 입력 과정과, 음성 인식을 위한 명령어 입력 과정이라는 2단계 과정을 수행해야만 개별화된 서비스를 제공받을 수 있어 2단계 과정을 수행해야 하는 번거로움이 있었으며, 또한 화자 인식을 위한 입력어(암호)와 음성 인식을 위한 입력어(명령어)가 서로 다르게 적용되어 각각의 입력어를 항상 암기하고 있어야 하는 불편함이 있다.
또한, 다른 사용자가 개인화된 서비스를 제공 받고자 할 경우에, "사용자 전환"이라는 명령어를 입력한 후 화자 인식 및 음성 인식을 수행해야 하는 번거로움이 있다.
본 발명은 상기한 문제점을 해결하기 위하여 안출된 것으로서, 본 발명의 목적은 사용자의 음성이 입력되면 음성 인식 및 화자 인식을 동시에 수행함으로써, 별도의 사용자 인식 과정을 수행하지 않아도 되는 음성 인식 및 화자 인식을 통한 개별화된 서비스를 제공하는 A/V 장치 및 방법을 제공하는 것이다.
본 발명의 다른 목적은 음성 인식 및 화자 인식에 사용되는 입력어(명령어)를 동일하게 적용 함으로써, 원하는 서비스를 빠르게 제공 받을 수 있는 음성 인식 및 화자 인식을 통한 개별화된 서비스를 제공하는 A/V 장치 및 방법을 제공하는 것이다.
상기 목적을 달성하기 위하여 본 발명은, 리모컨의 무선 마이크를 통해 사용자의 음성이 입력되면 상기 입력된 음성 신호에 대한 음성 인식 및 화자 인식을 수행하고, 입력된 명령어에 대한 판단을 수행하여 해당 사용자의 개별화된 서비스를 제공하는 A/V 장치로 구성된다.
또한, 상기 A/V 장치는 상기 음성 입력부를 통해 입력된 음성을 인식하는 음성 인식부와, 상기 음성 입력부를 통해 입력된 음성을 기초로 사용자를 인식하는 화자 인식부와, 상기 음성 인식부가 인식한 음성이 어떠한 명령어 인지를 판단하는 판단부와, 상기 사용자 정보, 음성 정보, 사용자의 개별화된 서비스 정보 및 명령어를 저장하는 데이터베이스 및 상기 데이터베이스에서 상기 인식된 명령어 및 사용자의 개별화된 서비스 정보에 해당하는 서비스를 검색하는 서비스 검색부를 포함하는 것을 특징한다.
그리고, 사용자가 리모컨의 무선 마이크를 통해 음성을 입력하는 단계와, 상기 음성이 입력되면 입력된 음성과 음성을 입력한 화자를 인식하는 단계와, 상기 입력된 음성을 기초로 명령어를 판단하는 단계 및 상기 판단 결과에 따른 서비스를 제공하는 단계를 포함하는 것을 특징으로 한다.
이하, 본 발명의 바람직한 실시예를 첨부된 도면을 참조하여 상세히 설명한다.
도 1은 본 발명에 따른 음성 인식 및 화자 인식을 통한 개별화된 서비스를 제공하는 A/V 장치를 개략적으로 나타낸 도면으로서, A/V 장치(200)는 음성 인식부(210), 화자 인식부(220), 제어부(230), 판단부(240), 서비스 검색부(250) 및 데이터베이스(260)로 구성된다.
A/V 장치(200)는 리모컨(100)의 무선 마이크를 통해 사용자의 음성이 입력되면 상기 입력된 음성 신호에 대한 음성 인식 및 화자를 인식하고, 입력된 명령어에 대한 판단을 수행하여 해당 사용자의 개별화된 서비스를 제공한다.
음성 인식부(210)는 리모컨(100)에 구비된 음성 입력부(110)를 통해 입력된 음성을 인식하는 것으로서, 사용자가 입력한 명령어를 인식한다.
화자 인식부(220)는 음성 입력부(110)를 통해 입력된 음성을 기초로 화자를 인식하는 것으로서, 데이터베이스(260)에 저장된 사용자의 음성 정보를 통해 음성을 입력한 사용자를 인식한다.
판단부(240)는 음성 인식부(210)가 인식한 음성이 어떠한 명령어인지를 판단하는 것으로서, 즉 음성 인식부(210)가 인식한 명령어를 분석하여 사용자 정보가 필요한 명령어인지, 사용자 정보가 필요없는 명령어인지를 판단한다.
데이터베이스(260)는 사용자 정보, 음성 정보, 사용자의 개별화된 서비스 정보 및 발생 가능한 명령어들을 저장하는 것으로서, 음성 인식부(210) 및 화자 인식부(220)에서 인증 수행 시 저장된 명령어 및 해당 사용자의 정보를 제공한다. 여기서, 발생 가능한 명령어는 사용자에 의해 입력될 수 있는 모든 명령어를 말하며, 예를 들어 채널 검색을 위한 명령어, 채널 등록을 위한 명령어 및 채널 삭제를 위한 명령어 등으로 이해될 수 있다.
또한, 명령어는 사용자 인증 수행의 필요한 명령어와 그렇지 않은 명령어로 분리되어 저장되어 있다. 데이터베이스(260)에 저장된 명령어는 하기 도 3에서 자세히 설명한다.
서비스 검색부(250)는 판단부(240)의 판단 결과에 따라 데이터베이스(260)에서 해당 명령어에 따른 정보 및 사용자의 개별화된 서비스 정보를 검색하는 것으로서, 즉 판단부(240)의 판단 결과에 따른 해당 서비스를 검색한다.
제어부(230)는 서비스 검색부(250)가 검색한 서비스를 제공하는 것으로서, 즉 사용자가 입력한 명령어에 대한 해당 서비스를 제공한다. 여기서, 해당 서비스는 선호 채널의 방송 프로그램 디스플레이, 추천 프로그램의 정보 디스플레이, 선호 음악 재생 및 선택한 음악의 장르 재생 등으로 이해될 수 있다.
한편, 사용자의 음성은 리모컨(100)에 구비된 음성 입력부(110)를 통해 입력되며, 여기서 사용자의 음성 입력을 위하여 무선 마이크가 이용된다.
도 2는 본 발명에 따른 음성 인식 및 화자 인식을 통한 개별화된 서비스를 제공하는 방법을 개략적으로 나타낸 순서도로서, 먼저 사용자가 리모컨에 구비된 무선 마이크를 통해 음성을 입력하면(S100), 음성 입력부(110)는 무선 마이크를 통해 입력된 사용자 음성(명령어)을 음성 인식부(210)로 전송한다.
그 다음, 음성 입력부(110)가 전송한 명령어를 음성 인식부(210)가 인식함과 동시에 화자 인식부(220)는 입력된 음성을 통해 화자 인식을 수행한다(S110). 즉, 사용자가 입력한 명령어를 음성 인식부(210)가 인식을 하며, 이와 동시에 화자 인식부(220)가 입력된 음성을 통해 사용자에 대한 화자 인식을 한다. 여기서, 음성 인식부(210)는 입력된 명령어를 텍스트로 변환하여 판단부(240)로 전송하고, 화자 인식부(220)는 입력된 음성으로부터 특징 추출 및 분석을 수행한 후, 데이터베이스(260)에 저장된 사용자의 음성들 중에서 입력된 음성과 가장 근접한 음성 신호를 갖는 사용자의 음성을 검색하여 명령어를 입력한 사용자가 누구인지를 인식한다. 여기서, 화자 인식을 위해 사용자는 미리 사용자 등록 과정을 수행해야 하는데, 상기 사용자 등록을 통해 사용자의 특정 정보가 데이터베이스(260)에 등록되고, 이로써 음성을 통한 화자 인식을 수행할 수 있다. 그리고, 데이터베이스(260)에 등록되는 등록어는 개인화된 서비스를 필요로 하는 명령어들로 구성되며, 이로써 등록어와 명령어가 동일하게 적용되어 음성 인식과 화자 인식을 동시에 수행할 수 있다.
그 다음, 음성 인식부(210)가 인식한 명령어는 판단부(240)로 전송되고, 이에 판단부(240)는 음성 인식부(210)가 인식한 명령어를 분석한다(S120). 즉, 입력된 명령어가 어떤 동작의 수행을 명령하는 것인지를 분석하고, 분석된 명령어가 사용자 정보를 필요로 하는 사용자별로 개별화된 명령어인지 아니면 사용자 정보가 필요없는 일반적인 명령어인지를 판단한다. 여기서, 사용자별로 개별화된 명령어는 사용자의 취향 및 기호에 따라 사용자가 자주 입력하는 명령어로서, 선호 채널, 알림 예약, 알림 목록, 녹화 예약, 예약 목록, 녹화 목록, 추천 프로, 유료 채널 및 쇼핑 채널 등으로 이해될 수 있다. 그리고, 일반적인 명령어는 사용자의 취향 및 기호가 반영되지 않은 명령어로서, 뉴스, 드라마 및 스포츠 등으로 이해될 수 있다.
그 다음, 판단부(240)의 판단 결과 입력된 명령어가 개별화된 서비스를 요청하는 명령어인 경우(S130), 서비스 검색부(250)는 음성을 입력한 사용자가 데이터베이스(260)에 등록되어 화자 인식부(220)를 통해 화자 인식이된 사용자인지를 판단한다(S140).
만일, 판단 결과 음성을 입력한 사용자가 데이터베이스(260)에 등록되어 있는 사용자인 경우(S140), 사용자 별로 등록된 데이터베이스(260)에서 화자 인식부(220)가 인증한 사용자의 정보를 검색 및 추출한 후, 추출된 사용자 정보에 저장된 서비스 목록 중에서 사용자가 입력한 명령어에 해당하는 개별화된 서비스를 검색한다(S150, S160).
그 다음, 제어부(230)가 서비스 검색부(250)로부터 검색된 개인화된 서비스를 사용자에게 제공한다(S170).
한편, 판단 결과 음성을 입력한 사용자가 데이터베이스(260)에 등록되어 있는 사용자가 아닌 경우(S140), 서비스 검색부(250)는 A/V 장치에 기본적으로 설정되어 있는 기본 서비스를 제공하거나(S190, S200), 또는 사용자에게 등록된 개별화된 서비스가 없음을 통보하고 사용자 등록을 수행하도록 요청한다(S210). 여기서, 기본적인 서비스란 개별화된 서비스에 있어서 음성을 입력한 사용자에 대한 사용자 등록이 이루어지지 않아, 음성을 입력한 사용자에게 제공할 개별화된 서비스가 없을 경우 제공하는 A/V 장치에 디폴트로 설정된 서비스를 말하는 것으로서, 데이터베이스(260)에 등록되지 않은 사용자에게 임시적으로 제공하는 것이다. 예를 들어, 사용자가 '추천 프로그램'을 입력한 경우 판단부(240)는 입력된 명령어를 분석하고, 분석결과 사용자가 입력한 명령어가 개별화된 서비스를 요청하는 명령어라는 판단 결과를 서비스 검색부(250)로 전송하고, 이에 서비스 검색부(250)는 음성을 입력한 사용자가 데이터베이스(260)에 등록되어 있는 사용자인지를 판단한다.
그 다음, 판단 결과 명령어('추천 프로그램')를 력한 사용자가 데이터베이스(260)에 등록되어 있지 않은 사용자로 판단되면, 해당 사용자에게 제공할 개별화된 서비스가 존재하지 않기 때문에 A/V 장치에 디폴트로 설정된 서비스(예를 들어, MBC 9시 뉴스)를 제공해 준다.
한편, 판단부(240)의 판단 결과 입력된 명령어가 일반적인 서비스를 요청하는 명령어인 경우(S130), 서비스 검색부(250)는 입력된 명령어에 해당하는 일반적인 서비스를 데이터베이스(260)에서 검색하고(S180), 이후 제어부(230)가 서비스 검색부(250)로부터 검색된 서비스를 사용자에게 제공한다(S170).
한편, 다른 사용자가 리모컨에 구비된 무선 마이크를 통해 명령어를 입력할 경우, 해당 사용자의 음성 및 화자 인식을 수행하여 검색된 사용자 정보에 따른 개별화된 서비스를 제공한다.
도 3은 본 발명에 따른 개별화된 명령어 테이블을 나타낸 도면으로서, 도 3(a)는 영상 기기(디지털 TV) 사용시 입력될 수 있는 개별화된 명령어를 나타낸 표이고, 도3 (b)는 음향 기기(오디오, MP3 재생기, 또는 멀티미디어 재생기 등) 사용시 입력될 수 있는 개별화된 명령어를 나타낸 표이다.
먼저, 도 3(a)에 도시된 영상 기기 사용시 입력될 수 있는 개별화된 명령어를 나타낸 표를 살펴보자.
선호채널(Favorite channel)은 사용자가 자신이 좋아하는 채널들을 데이터베이스(260)에 등록해 놓은 것으로, 즉 사용자가 명령어로 '선호채널' 이라고 입력하면 데이터베이스(260)에 저장된 선호채널 목록 중 어느 하나의 채널이 화면에 제공된다.
알림(notify)예약은 사용자가 알림을 받고자 하는 임의의 프로그램에 대해서 방송 시작 전(후)에 방송의 시작을 알려주도록 설정하는 것으로, 즉 사용자가 해당 프로그램의 정보(방송시간, 채널 정보, 프로그램 제목 등)를 예약/입력하면, 해당 프로그램의 시작을 알려준다.
알림목록은 사용자가 알림 예약 해놓은 프로그램 목록들을 데이터베이스(260) 등록 및 보관하는 목록으로서, 즉 사용자가 명령어로 '알림목록' 이라고 입력하면 등록된 알람 목록이 화면에 제공된다. 여기서, 해당 사용자의 요구에 따라 목록의 조작 및 가공이 가능하다.
녹화예약은 사용자가 보고자 하는 프로그램을 녹화 예약하는 것으로, 즉 사용자가 해당 프로그램의 정보(방송시간, 채널 정보, 프로그램 제목 등)를 입력하면, 설정된 시간에 해당 방송을 녹화해 준다.
예약목록은 사용자가 녹화 예약 및 알림 예약해 놓은 프로그램 목록들을 데이터베이스(260)에 등록 및 보관하는 목록으로서, 즉 사용자가 명령어로 '예약목록' 이라고 입력하면 등록된 예약 목록이 화면에 제공된다. 여기서, 해당 사용자의 요구에 따라 목록의 조작 및 가공이 가능하다.
녹화목록은 녹화된 프로그램 목록들을 데이터베이스(260)에 등록 및 보관하는 목록으로서, 즉 사용자가 명령어로 '녹화목록' 이라고 입력하면 등록된 녹화 목록이 화면에 제공된다. 여기서, 사용자의 필요에 따라서 프로그램이 재생되거나 삭제될 수 있다.
추천프로(Recommend program)은 사용자와 유사한 취향을 가진 다른 사람들이 추천한 프로그램에 대한 정보를 컨텐츠 제공 업체나 방송사로부터 제공받아 등록해 놓은 것으로, 즉 사용자가 명령어로 '추천프로' 라고 입력하면 사용자에게 추천된 프로그램 및 관련 정보가 제공된다.
유료채널(Pay Per View)은 사용자가 유료 채널을 탐색하거나 시청할 때, 사용자 식별(화자 인식)을 통해 개인정보에 따라 시청가능 여부를 판단하여, 시청 가능한 해당 정보를 제공한다.
성인채널(Adult channel)은 연령 제한이 있는 채널을 탐색하거나 시청할 때, 사용자 식별(화자 인식)을 통해 개인정보에 따라 시청가능 여부를 판단하여, 시청 가능한 사용자인 경우에만 해당 정보를 제공한다.
쇼핑채널(Shopping channel)은 TV 상거래를 수행하려고 할 때, 사용자 식별(화자 인식)을 통해 개인정보에 따라 상거래 이용가능 여부를 판단하여, 이용 가능한 사용자인 경우에만 해당 정보를 제공한다.
도 3(b)에 도시된 음향 기기 사용시 입력될 수 있는 개별화된 명령어를 나타낸 표를 살펴보자.
재생(Play)은 사용자 식별(화자 인식)을 통해 발성한 사용자의 프로필 정보에 따라 개인화된 노래 목록들을 재생 주는 것으로, 즉 사용자가 명령어로 '재생'이라고 입력하면 재생 목록에 등록된 노래를 재생해 준다.
장르별 선택은 가요, 재즈, 클래식, 팝 등 장르별로 개인화된 서비스를 제공하는 것으로, 즉 사용자가 명령어로 여러 장르중 하나(예를 들어, 가요)를 입력하면, 해당 장르(가요)의 음악을 재생 해준다.
선호곡(Favorite song list)은 사용자가 자신이 좋아하는 노래들을 데이터베이스(260)에 등록해 놓은 것으로, 즉 사용자가 명령어로 '선호곡'이라고 입력하면 등록된 선호곡이 재생된다.
한편, 사용자는 상기에서 설명한 명령어 이외에 다른 명령어를 입력 및 등록할 수 있다.
도 4는 본 발명에 따른 음성 인식 및 화자 인식을 통한 개별화된 서비스를 제공하는 방법의 일 실시예를 나타낸 도면으로서, 먼저 사용자가 스포츠 뉴스 채널을 시청하던 중 리모컨에 구비된 무선 마이크에 '선호 채널'이라고 말하면, 음성 입력부(110)는 사용자가 입력한 '선호 채널'이라는 명령어를 음성 인식부(210)로 전송한다.
그 다음, 음성 인식부(210)는 입력된 '선호 채널'이라는 명령어를 인식하고, 이와 동시에 화자 인식부(220)는 입력된 음성을 통해 화자 인식을 수행한다.
그 다음, 음성 입력부(210)는 판단부(240)에 입력된 명령어('선호 채널')를 전송하고, 판단부(240)는 전송된 명령어를 분석한다. 여기서, 판단부(240)는 명령어를 분석함으로써, 전송된 명령어가 '선호 채널'을 청하는 명령어이며, 분석된 '선호 채널'이라는 명령어가 사용자 정보를 필요로 하는 개별화된 명령어라는 것을 서비스 검색부(250)로 전송한다.
이에, 서비스 검색부(250)는 화자 인식부(220)가 인식한 사용자에 해당하는 사용자 정보를 데이터베이스(260)에서 추출하고, 추출된 사용자 정보에 저장된 서비스 목록 중에서 '선호 채널' 목록을 검색한다.
그 다음, 제어부(230)가 검색된 선호 채널(예를 들어, '야인시대')을 사용자에게 제공한다.
한편, 사용자가 '야인시대'를 시청하다가 다시 '선호채널'이라고 명령어를 입력하면 선호 채널 목록들 중 '야인시대'와 가장 근접한 번호를 갖는 '한밤의 TV 연예'로 채널이 변경된다(도4에 도시된 테이블 참조).
또한, 사용자가 '야인시대'를 시청하다가 아래로(또는 위로)라고 명령어를 입력하면 아래 등록되어 있는 '한밤의 TV 연예' 채널로 화면이 변경된다.
도 5는 본 발명에 따른 음성 인식 및 화자 인식을 통한 개별화된 서비스를 제공하는 방법의 다른 실시예를 나타낸 도면으로서, 다수의 사용자가 음성 입력을 통해 원하는 채널의 서비스를 제공 받은 과정을 나타낸 것이다.
먼저, 사용자가 TV를 시청하던 중 리모컨에 구비된 무선 마이크에 '선호채널'이라고 말하면, 음성 인식부(210) 및 화자 인식부(220)는 입력된 '선호채널'이라는 명령어를 통해 음성 인식 및 화자 인식을 수행한다.
그 다음, 판단부(240)는 입력된 명령어를 분석하여 사용자가 원하는 서비스가 무엇인지를 판단하고, 판단 결과 입력된 명령어가 개별화된 서비스를 요청하는 '선호채널'이라는 것을 서비스 검색부(250)로 전송한다.
이에, 서비스 검색부(250)는 사용자의 데이터베이스(260)에 저장된 서비스 목록 중에서 '선호채널' 목록을 검색하여 해당 채널(예를 들어, 개그 콘서트)을 사용자에게 제공해 준다.
이 후, 다른 사용자가 리모컨에 구비된 무선 마이크에 '선호채널'이라고 말하면, 음성 인식부(210) 및 화자 인식부(220)는 입력된 '선호채널'이라는 명령어를 통해 음성 인식 및 화자 인식을 수행는데, 이때 화자 인식을 통해 명령어를 입력한 사용자가 동일한 사용자가 아니라는 것을 판단한다.
그 다음, 판단부(240)는 사용자가 입력한 명령어를 분석하여 분석된 결과를 서비스 검색부(250)로 다시 전송하고, 서비스 검색부(250)는 해당 사용자의 데이터베이스(260)에 저장된 서비스 목록 중에서 '선호채널' 목록을 검색하여 해당 채널(예를 들어, 여름 향기)을 사용자에게 제공해 준다.
본 발명의 바람직한 또 다른 실시예로 사용자가 오디오를 통해 음악을 들을 경우를 설명하면, 먼저 사용자가 오디오 리모컨에 구비된 무선 마이크에 '재즈'라는 명령어를 입력하면, 음성 입력부(110)는 사용자가 입력한 '재즈'라는 명령어를 음성 인식부(210)로 전송한다.
그 다음, 음성 입력부(210)는 입력된 '재즈'라는 명령어를 인식하고, 이와 동시에 화자 인식부(220)는 입력된 음성을 통해 사용자에 대한 화자 인식을 수행한다.
그 다음, 음성 입력부(210)는 판단부(240)에 입력된 명령어(재즈)를 전송하고, 판단부(240)는 전송된 명령어를 분석한다. 여기서, 판단부(240)는 명령어(재즈)를 분석하여 서비스 검색부(250)로 전송한다.
이에, 서비스 검색부(250)는 화자 인식부(220)가 인식한 사용자에 해당하는 사용자 정보를 데이터베이스(260)에서 추출하고, 추출된 사용자 정보에 저장된 음악 장르 중에서 '재즈'를 검색하여 재생시킨다.
이상에서 본 발명에 대하여 상세히 기술하였지만, 본 발명이 속하는 기술 분야에 있어서 통상의 지식을 가진 사람이라면, 첨부된 청구범위에 정의된 본 발명의 정신 및 범위를 벗어나지 않으면서 본 발명을 여러 가지로 변형 또는 변경하여 실시할 수 있음은 자명하며, 따라서 본 발명의 실시예에 따른 단순한 변경은 본 발명의 기술을 벗어날 수 없을 것이다.
상기한 바와 같이 이루어진 본 발명에 따르면, 무선 마이크를 통해 사용자 음성 입력시, 음성 인식 및 화자 인식을 동시에 수행함으로써, 별도의 사용자 인식 과정을 수행하지 않고 개인화된 서비스를 검색해 주어 빠르게 원하는 서비스를 제공받을 수 있는 효과가 있다.
또한, 음성 인식 및 화자 인식에 사용되는 입력어(명령어)를 동일하게 적용 함으로써, 사용자는 인증 수행을 위한 입력어를 암기하지 않아도 되며, 음성 인식과 화자 인식을 위한 별도의 장치를 구비하지 않아도 되는 효과가 있다.
도 1은 본 발명에 따른 음성 인식 및 화자 인식을 통한 개별화된 서비스를 제공하는 A/V 장치를 개략적으로 나타낸 도면.
도 2는 본 발명에 따른 음성 인식 및 화자 인식을 통한 개별화된 서비스를 제공하는 방법을 개략적으로 나타낸 순서도.
도 3은 본 발명에 따른 명령어 테이블을 나타낸 도면.
도 4는 본 발명에 따른 음성 인식 및 화자 인식을 통한 개별화된 서비스를 제공하는 방법의 일 실시예를 나타낸 도면.
도 5는 본 발명에 따른 음성 인식 및 화자 인식을 통한 개별화된 서비스를 제공하는 방법의 다른 실시예를 나타낸 도면.
<도면의 주요 부분에 관한 부호의 설명>
100 : 리모컨 110 : 음성 입력부
200 : A/V 장치 210 : 음성 인식부
220 : 화자 인식부 230 : 제어부
240 : 판단부 250 : 서비스 제공부
260 : 데이터베이스

Claims (8)

  1. 리모컨의 무선 마이크를 통해 사용자의 음성이 입력되면 상기 입력된 음성 신호에 대한 음성 인식 및 화자 인식을 수행하고, 입력된 명령어에 대한 판단을 수행하여 해당 사용자의 개별화된 서비스를 제공하는 A/V 장치.
  2. 제 1항에 있어서,
    상기 리모컨은 사용자의 음성을 입력받는 음성 입력부를 포함하는 것을 특징으로 하는 A/V 장치.
  3. 제 1항에 있어서,
    상기 A/V 장치는,
    상기 음성 입력부를 통해 입력된 음성을 인식하는 음성 인식부;
    상기 음성 입력부를 통해 입력된 음성을 기초로 사용자를 인식하는 화자 인식부; 및
    상기 음성 인식부가 인식한 음성이 어떠한 명령어 인지를 판단하는 판단부를 포함하는 것을 특징으로 하는 음성 인식 및 화자 인식을 통한 개별화된 서비스 제공 장치.
  4. 제 1항 또는 3항에 있어서,
    상기 사용자 정보, 음성 정보, 사용자의 개별화된 서비스 정보 및 명령어를 저장하는 데이터베이스; 및
    상기 데이터베이스에서 상기 인식된 명령어 및 사용자의 개별화된 서비스 정보에 해당하는 서비스를 검색하는 서비스 검색부를 더 포함하는 것을 특징으로 하는 음성 인식 및 화자 인식을 통한 개별화된 서비스 제공 장치.
  5. 제 1항에 있어서,
    사용자의 음성 인식과 화자 인식을 동시에 수행하는 것을 특징으로 하는 음성 인식 및 화자 인식을 통한 개별화된 서비스 제공 장치.
  6. 사용자가 리모컨의 무선 마이크를 통해 음성을 입력하는 단계;
    상기 음성이 입력되면 입력된 음성과 음성을 입력한 화자를 인식하는 단계;
    상기 입력된 음성을 기초로 명령어를 판단하는 단계; 및
    상기 판단 결과에 따른 서비스를 제공하는 단계를 포함하는 것을 특징으로 하는 음성 인식 및 화자 인식을 통한 개별화된 서비스를 제공하는 방법.
  7. 제 6항에 있어서,
    상기 입력된 음성을 기초로 명령어를 판단하는 단계는,
    상기 입력된 음성이 어떠한 명령어 인지를 판단하는 단계;
    상기 판단 결과 개별화된 서비스를 요청하는 명령어인 경우, 데이터베이스에 저장된 사용자 별 서비스 정보를 이용하여 해당 서비스를 검색하는 단계; 및
    상기 판단 결과 개별화된 서비스를 요청하는 명령어가 아닌 경우, 입력된 명령어에 따른 서비스를 검색하는 단계를 포함하는 것을 특징으로 하는 음성 인식 및 화자 인식을 통한 개별화된 서비스를 제공하는 방법.
  8. 제 6항에 있어서,
    상기 음성 인식 및 사용자 인식에 사용되는 명령어가 동일하게 적용되는 것을 특징으로 하는 음성 인식 및 화자 인식을 통한 개별화된 서비스를 제공하는 방법.
KR1020030061511A 2003-09-03 2003-09-03 음성 인식 및 화자 인식을 통한 개별화된 서비스를제공하는 a/v 장치 및 그 방법 KR20050023941A (ko)

Priority Applications (5)

Application Number Priority Date Filing Date Title
KR1020030061511A KR20050023941A (ko) 2003-09-03 2003-09-03 음성 인식 및 화자 인식을 통한 개별화된 서비스를제공하는 a/v 장치 및 그 방법
JP2004188859A JP2005078072A (ja) 2003-09-03 2004-06-25 音声認識及び話者認識を通じて個別化されたサービスを提供するav装置及びその方法
EP04254257A EP1513136A1 (en) 2003-09-03 2004-07-15 Audio/video apparatus and method for providing personalized services through voice and speaker recognition
US10/899,052 US20050049862A1 (en) 2003-09-03 2004-07-27 Audio/video apparatus and method for providing personalized services through voice and speaker recognition
CNB2004100740661A CN1300765C (zh) 2003-09-03 2004-09-02 提供个性化服务的音频/视频装置和方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020030061511A KR20050023941A (ko) 2003-09-03 2003-09-03 음성 인식 및 화자 인식을 통한 개별화된 서비스를제공하는 a/v 장치 및 그 방법

Publications (1)

Publication Number Publication Date
KR20050023941A true KR20050023941A (ko) 2005-03-10

Family

ID=34132228

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020030061511A KR20050023941A (ko) 2003-09-03 2003-09-03 음성 인식 및 화자 인식을 통한 개별화된 서비스를제공하는 a/v 장치 및 그 방법

Country Status (5)

Country Link
US (1) US20050049862A1 (ko)
EP (1) EP1513136A1 (ko)
JP (1) JP2005078072A (ko)
KR (1) KR20050023941A (ko)
CN (1) CN1300765C (ko)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100913130B1 (ko) * 2006-09-29 2009-08-19 한국전자통신연구원 사용자 프로파일을 이용한 음성 인식 서비스 방법 및 장치
KR101531848B1 (ko) * 2013-11-20 2015-06-29 금오공과대학교 산학협력단 사용자 중심의 내비게이션 통신장치
US9484029B2 (en) 2014-07-29 2016-11-01 Samsung Electronics Co., Ltd. Electronic apparatus and method of speech recognition thereof
KR20180082783A (ko) * 2017-01-11 2018-07-19 (주)파워보이스 인공 지능 자동 화자 식별 방법을 이용하는 개인 맞춤형 음성 인식 서비스 제공 방법 및 이에 사용되는 서비스 제공 서버
KR101891698B1 (ko) * 2018-03-02 2018-08-27 주식회사 공훈 화자의 위치정보를 이용한 음성 인식을 통한 화자 식별 시스템 및 방법

Families Citing this family (118)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8645137B2 (en) 2000-03-16 2014-02-04 Apple Inc. Fast, language-independent method for user authentication by voice
US8238881B2 (en) 2001-08-07 2012-08-07 Waloomba Tech Ltd., L.L.C. System and method for providing multi-modal bookmarks
US8213917B2 (en) 2006-05-05 2012-07-03 Waloomba Tech Ltd., L.L.C. Reusable multimodal application
US8694322B2 (en) * 2005-08-05 2014-04-08 Microsoft Corporation Selective confirmation for execution of a voice activated user interface
US8677377B2 (en) 2005-09-08 2014-03-18 Apple Inc. Method and apparatus for building an intelligent automated assistant
US20070157285A1 (en) * 2006-01-03 2007-07-05 The Navvo Group Llc Distribution of multimedia content
US20070156853A1 (en) * 2006-01-03 2007-07-05 The Navvo Group Llc Distribution and interface for multimedia content and associated context
WO2007081682A2 (en) * 2006-01-03 2007-07-19 The Navvo Group Llc Distribution of multimedia content
US9928510B2 (en) * 2006-11-09 2018-03-27 Jeffrey A. Matos Transaction choice selection apparatus and system
US9318108B2 (en) 2010-01-18 2016-04-19 Apple Inc. Intelligent automated assistant
US9865240B2 (en) * 2006-12-29 2018-01-09 Harman International Industries, Incorporated Command interface for generating personalized audio content
JP4538756B2 (ja) 2007-12-03 2010-09-08 ソニー株式会社 情報処理装置、情報処理端末、情報処理方法、およびプログラム
US8996376B2 (en) 2008-04-05 2015-03-31 Apple Inc. Intelligent text-to-speech conversion
KR101556594B1 (ko) * 2009-01-14 2015-10-01 삼성전자 주식회사 신호처리장치 및 신호처리장치에서의 음성 인식 방법
US10241644B2 (en) 2011-06-03 2019-03-26 Apple Inc. Actionable reminder entries
US10241752B2 (en) 2011-09-30 2019-03-26 Apple Inc. Interface for a virtual digital assistant
US9431006B2 (en) 2009-07-02 2016-08-30 Apple Inc. Methods and apparatuses for automatic speech recognition
DE102009051508B4 (de) 2009-10-30 2020-12-03 Continental Automotive Gmbh Vorrichtung, System und Verfahren zur Sprachdialogaktivierung und -führung
US8886541B2 (en) * 2010-02-04 2014-11-11 Sony Corporation Remote controller with position actuatated voice transmission
US8682667B2 (en) 2010-02-25 2014-03-25 Apple Inc. User profiling for selecting user specific voice input processing information
US20110307250A1 (en) * 2010-06-10 2011-12-15 Gm Global Technology Operations, Inc. Modular Speech Recognition Architecture
US9262612B2 (en) 2011-03-21 2016-02-16 Apple Inc. Device access using voice authentication
CN103187053B (zh) * 2011-12-31 2016-03-30 联想(北京)有限公司 输入方法和电子设备
US8453058B1 (en) * 2012-02-20 2013-05-28 Google Inc. Crowd-sourced audio shortcuts
US9280610B2 (en) 2012-05-14 2016-03-08 Apple Inc. Crowd sourcing information to fulfill user requests
US9721563B2 (en) 2012-06-08 2017-08-01 Apple Inc. Name recognition system
KR20130140423A (ko) * 2012-06-14 2013-12-24 삼성전자주식회사 디스플레이 장치, 대화형 서버 및 응답 정보 제공 방법
US9288421B2 (en) 2012-07-12 2016-03-15 Samsung Electronics Co., Ltd. Method for controlling external input and broadcast receiving apparatus
US9547647B2 (en) 2012-09-19 2017-01-17 Apple Inc. Voice-based media searching
WO2014197334A2 (en) 2013-06-07 2014-12-11 Apple Inc. System and method for user-specified pronunciation of words for speech synthesis and recognition
US9582608B2 (en) 2013-06-07 2017-02-28 Apple Inc. Unified ranking with entropy-weighted information for phrase-based semantic auto-completion
WO2014197336A1 (en) 2013-06-07 2014-12-11 Apple Inc. System and method for detecting errors in interactions with a voice-based digital assistant
WO2014197335A1 (en) 2013-06-08 2014-12-11 Apple Inc. Interpreting and acting upon commands that involve sharing information with remote devices
US10176167B2 (en) 2013-06-09 2019-01-08 Apple Inc. System and method for inferring user intent from speech inputs
EP3008641A1 (en) 2013-06-09 2016-04-20 Apple Inc. Device, method, and graphical user interface for enabling conversation persistence across two or more instances of a digital assistant
US9911421B2 (en) * 2013-06-10 2018-03-06 Panasonic Intellectual Property Corporation Of America Speaker identification method, speaker identification apparatus, and information management method
KR20150012464A (ko) * 2013-07-25 2015-02-04 삼성전자주식회사 디스플레이 장치 및 개인화 서비스 제공 방법
US9900177B2 (en) * 2013-12-11 2018-02-20 Echostar Technologies International Corporation Maintaining up-to-date home automation models
US9772612B2 (en) 2013-12-11 2017-09-26 Echostar Technologies International Corporation Home monitoring and control
US9769522B2 (en) 2013-12-16 2017-09-19 Echostar Technologies L.L.C. Methods and systems for location specific operations
US9450812B2 (en) 2014-03-14 2016-09-20 Dechnia, LLC Remote system configuration via modulated audio
US9723393B2 (en) 2014-03-28 2017-08-01 Echostar Technologies L.L.C. Methods to conserve remote batteries
US10089985B2 (en) * 2014-05-01 2018-10-02 At&T Intellectual Property I, L.P. Smart interactive media content guide
US20150336786A1 (en) * 2014-05-20 2015-11-26 General Electric Company Refrigerators for providing dispensing in response to voice commands
US9430463B2 (en) 2014-05-30 2016-08-30 Apple Inc. Exemplar-based natural language processing
US9338493B2 (en) 2014-06-30 2016-05-10 Apple Inc. Intelligent automated assistant for TV user interactions
US9621959B2 (en) 2014-08-27 2017-04-11 Echostar Uk Holdings Limited In-residence track and alert
US9824578B2 (en) 2014-09-03 2017-11-21 Echostar Technologies International Corporation Home automation control using context sensitive menus
US9989507B2 (en) 2014-09-25 2018-06-05 Echostar Technologies International Corporation Detection and prevention of toxic gas
JP6129134B2 (ja) * 2014-09-29 2017-05-17 シャープ株式会社 音声対話装置、音声対話システム、端末、音声対話方法およびコンピュータを音声対話装置として機能させるためのプログラム
US9668121B2 (en) 2014-09-30 2017-05-30 Apple Inc. Social reminders
US9511259B2 (en) 2014-10-30 2016-12-06 Echostar Uk Holdings Limited Fitness overlay and incorporation for home automation system
US9983011B2 (en) 2014-10-30 2018-05-29 Echostar Technologies International Corporation Mapping and facilitating evacuation routes in emergency situations
CN104505091B (zh) * 2014-12-26 2018-08-21 湖南华凯文化创意股份有限公司 人机语音交互方法及系统
US9967614B2 (en) 2014-12-29 2018-05-08 Echostar Technologies International Corporation Alert suspension for home automation system
US10567477B2 (en) 2015-03-08 2020-02-18 Apple Inc. Virtual assistant continuity
US9729989B2 (en) 2015-03-27 2017-08-08 Echostar Technologies L.L.C. Home automation sound detection and positioning
US9948477B2 (en) 2015-05-12 2018-04-17 Echostar Technologies International Corporation Home automation weather detection
US9946857B2 (en) 2015-05-12 2018-04-17 Echostar Technologies International Corporation Restricted access for home automation system
US9632746B2 (en) 2015-05-18 2017-04-25 Echostar Technologies L.L.C. Automatic muting
US9578173B2 (en) 2015-06-05 2017-02-21 Apple Inc. Virtual assistant aided communication with 3rd party service in a communication session
KR102398488B1 (ko) * 2015-06-26 2022-05-13 엘지전자 주식회사 복수의 디바이스에 대한 원격제어를 수행할 수 있는 이동 단말기
CN105183778A (zh) * 2015-08-11 2015-12-23 百度在线网络技术(北京)有限公司 服务提供方法和装置
US9960980B2 (en) 2015-08-21 2018-05-01 Echostar Technologies International Corporation Location monitor and device cloning
US10671428B2 (en) 2015-09-08 2020-06-02 Apple Inc. Distributed personal assistant
US10747498B2 (en) 2015-09-08 2020-08-18 Apple Inc. Zero latency digital assistant
US11010550B2 (en) 2015-09-29 2021-05-18 Apple Inc. Unified language modeling framework for word prediction, auto-completion and auto-correction
US10366158B2 (en) 2015-09-29 2019-07-30 Apple Inc. Efficient word encoding for recurrent neural network language models
US11587559B2 (en) 2015-09-30 2023-02-21 Apple Inc. Intelligent device identification
US10691473B2 (en) 2015-11-06 2020-06-23 Apple Inc. Intelligent automated assistant in a messaging environment
US9996066B2 (en) 2015-11-25 2018-06-12 Echostar Technologies International Corporation System and method for HVAC health monitoring using a television receiver
US10049668B2 (en) 2015-12-02 2018-08-14 Apple Inc. Applying neural network language models to weighted finite state transducers for automatic speech recognition
US10101717B2 (en) 2015-12-15 2018-10-16 Echostar Technologies International Corporation Home automation data storage system and methods
US9798309B2 (en) 2015-12-18 2017-10-24 Echostar Technologies International Corporation Home automation control based on individual profiling using audio sensor data
US10223066B2 (en) 2015-12-23 2019-03-05 Apple Inc. Proactive assistance based on dialog communication between devices
CN106920546B (zh) * 2015-12-23 2020-03-20 小米科技有限责任公司 智能识别语音的方法及装置
US10091017B2 (en) 2015-12-30 2018-10-02 Echostar Technologies International Corporation Personalized home automation control based on individualized profiling
US10060644B2 (en) 2015-12-31 2018-08-28 Echostar Technologies International Corporation Methods and systems for control of home automation activity based on user preferences
US10073428B2 (en) 2015-12-31 2018-09-11 Echostar Technologies International Corporation Methods and systems for control of home automation activity based on user characteristics
EP3410172A4 (en) * 2016-01-26 2019-09-25 Shenzhen Royole Technologies Co. Ltd. HEADSET DEVICE, HEADSET DEVICE, AND SEPARATION CONTROL PROCEDURE FOR A HEAD-MOUNTED DEVICE
CN105551491A (zh) * 2016-02-15 2016-05-04 海信集团有限公司 语音识别方法和设备
US9628286B1 (en) 2016-02-23 2017-04-18 Echostar Technologies L.L.C. Television receiver and home automation system and methods to associate data with nearby people
US10446143B2 (en) 2016-03-14 2019-10-15 Apple Inc. Identification of voice inputs providing credentials
US9934775B2 (en) 2016-05-26 2018-04-03 Apple Inc. Unit-selection text-to-speech synthesis based on predicted concatenation parameters
US9972304B2 (en) 2016-06-03 2018-05-15 Apple Inc. Privacy preserving distributed evaluation framework for embedded personalized systems
US10249300B2 (en) 2016-06-06 2019-04-02 Apple Inc. Intelligent list reading
KR20190016536A (ko) * 2016-06-06 2019-02-18 시러스 로직 인터내셔널 세미컨덕터 리미티드 보이스 사용자 인터페이스
US10049663B2 (en) 2016-06-08 2018-08-14 Apple, Inc. Intelligent automated assistant for media exploration
US9882736B2 (en) 2016-06-09 2018-01-30 Echostar Technologies International Corporation Remote sound generation for a home automation system
DK179309B1 (en) 2016-06-09 2018-04-23 Apple Inc Intelligent automated assistant in a home environment
US10192552B2 (en) 2016-06-10 2019-01-29 Apple Inc. Digital assistant providing whispered speech
US10586535B2 (en) 2016-06-10 2020-03-10 Apple Inc. Intelligent digital assistant in a multi-tasking environment
US10509862B2 (en) 2016-06-10 2019-12-17 Apple Inc. Dynamic phrase expansion of language input
US10490187B2 (en) 2016-06-10 2019-11-26 Apple Inc. Digital assistant providing automated status report
US10067938B2 (en) 2016-06-10 2018-09-04 Apple Inc. Multilingual word prediction
DK201670540A1 (en) 2016-06-11 2018-01-08 Apple Inc Application integration with a digital assistant
DK179415B1 (en) 2016-06-11 2018-06-14 Apple Inc Intelligent device arbitration and control
DK179049B1 (en) 2016-06-11 2017-09-18 Apple Inc Data driven natural language event detection and classification
DK179343B1 (en) 2016-06-11 2018-05-14 Apple Inc Intelligent task discovery
CN107527613A (zh) * 2016-06-21 2017-12-29 中兴通讯股份有限公司 一种视频业务控制方法、移动终端及业务服务器
US10294600B2 (en) 2016-08-05 2019-05-21 Echostar Technologies International Corporation Remote detection of washer/dryer operation/fault condition
US10049515B2 (en) 2016-08-24 2018-08-14 Echostar Technologies International Corporation Trusted user identification and management for home automation systems
US10043516B2 (en) 2016-09-23 2018-08-07 Apple Inc. Intelligent automated assistant
WO2018101459A1 (ja) 2016-12-02 2018-06-07 ヤマハ株式会社 コンテンツ再生機器、収音機器、及びコンテンツ再生システム
WO2018101458A1 (ja) * 2016-12-02 2018-06-07 ヤマハ株式会社 収音機器、コンテンツ再生機器、及びコンテンツ再生システム
US10593346B2 (en) 2016-12-22 2020-03-17 Apple Inc. Rank-reduced token representation for automatic speech recognition
CN107147618B (zh) * 2017-04-10 2020-05-15 易视星空科技无锡有限公司 一种用户注册方法、装置及电子设备
DK201770439A1 (en) 2017-05-11 2018-12-13 Apple Inc. Offline personal assistant
DK179496B1 (en) 2017-05-12 2019-01-15 Apple Inc. USER-SPECIFIC Acoustic Models
DK179745B1 (en) 2017-05-12 2019-05-01 Apple Inc. SYNCHRONIZATION AND TASK DELEGATION OF A DIGITAL ASSISTANT
DK201770432A1 (en) 2017-05-15 2018-12-21 Apple Inc. Hierarchical belief states for digital assistants
DK201770431A1 (en) 2017-05-15 2018-12-20 Apple Inc. Optimizing dialogue policy decisions for digital assistants using implicit feedback
DK179560B1 (en) 2017-05-16 2019-02-18 Apple Inc. FAR-FIELD EXTENSION FOR DIGITAL ASSISTANT SERVICES
EP3660842A4 (en) * 2017-07-26 2020-09-02 Nec Corporation VOICE CONTROL DEVICE AND CONTROL PROCEDURE FOR IT
JP2019193134A (ja) * 2018-04-26 2019-10-31 シャープ株式会社 表示装置、テレビ受信装置及び表示方法
US11017782B2 (en) * 2018-11-14 2021-05-25 XMOS Ltd. Speaker classification
CN111902865A (zh) 2018-12-03 2020-11-06 谷歌有限责任公司 文本无关的说话者识别
JP7254316B1 (ja) 2022-04-11 2023-04-10 株式会社アープ プログラム、情報処理装置、及び方法

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5717743A (en) * 1992-12-16 1998-02-10 Texas Instruments Incorporated Transparent telephone access system using voice authorization
US5774859A (en) * 1995-01-03 1998-06-30 Scientific-Atlanta, Inc. Information system having a speech interface
US5719921A (en) * 1996-02-29 1998-02-17 Nynex Science & Technology Methods and apparatus for activating telephone services in response to speech
WO2000039789A1 (en) * 1998-12-29 2000-07-06 Alcatel Usa Sourcing, L.P. Security and user convenience through voice commands
US6314398B1 (en) * 1999-03-01 2001-11-06 Matsushita Electric Industrial Co., Ltd. Apparatus and method using speech understanding for automatic channel selection in interactive television
US6324512B1 (en) * 1999-08-26 2001-11-27 Matsushita Electric Industrial Co., Ltd. System and method for allowing family members to access TV contents and program media recorder over telephone or internet
US6339706B1 (en) * 1999-11-12 2002-01-15 Telefonaktiebolaget L M Ericsson (Publ) Wireless voice-activated remote control device
CN1101025C (zh) * 1999-11-19 2003-02-05 清华大学 语音命令控制器的训练与识别方法
CN1123862C (zh) * 2000-03-31 2003-10-08 清华大学 基于语音识别专用芯片的特定人语音识别、语音回放方法
DE60120062T2 (de) * 2000-09-19 2006-11-16 Thomson Licensing Sprachsteuerung von elektronischen Geräten
DE10111121B4 (de) * 2001-03-08 2005-06-23 Daimlerchrysler Ag Verfahren zur Sprechererkennung für die Bedienung von Geräten
FR2823361A1 (fr) * 2001-04-05 2002-10-11 Thomson Licensing Sa Procede et dispositif d'extraction acoustique d'un signal vocal
JP2004533752A (ja) * 2001-04-13 2004-11-04 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 対話システムにおける話し手の認証
US7519534B2 (en) * 2002-10-31 2009-04-14 Agiletv Corporation Speech controlled access to content on a presentation medium

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100913130B1 (ko) * 2006-09-29 2009-08-19 한국전자통신연구원 사용자 프로파일을 이용한 음성 인식 서비스 방법 및 장치
KR101531848B1 (ko) * 2013-11-20 2015-06-29 금오공과대학교 산학협력단 사용자 중심의 내비게이션 통신장치
US9484029B2 (en) 2014-07-29 2016-11-01 Samsung Electronics Co., Ltd. Electronic apparatus and method of speech recognition thereof
KR20180082783A (ko) * 2017-01-11 2018-07-19 (주)파워보이스 인공 지능 자동 화자 식별 방법을 이용하는 개인 맞춤형 음성 인식 서비스 제공 방법 및 이에 사용되는 서비스 제공 서버
WO2018131752A1 (ko) * 2017-01-11 2018-07-19 (주)파워보이스 인공 지능 자동 화자 식별 방법을 이용하는 개인 맞춤형 음성 인식 서비스 제공 방법 및 이에 사용되는 서비스 제공 서버
US11087768B2 (en) 2017-01-11 2021-08-10 Powervoice Co., Ltd. Personalized voice recognition service providing method using artificial intelligence automatic speaker identification method, and service providing server used therein
KR101891698B1 (ko) * 2018-03-02 2018-08-27 주식회사 공훈 화자의 위치정보를 이용한 음성 인식을 통한 화자 식별 시스템 및 방법

Also Published As

Publication number Publication date
CN1591571A (zh) 2005-03-09
US20050049862A1 (en) 2005-03-03
JP2005078072A (ja) 2005-03-24
CN1300765C (zh) 2007-02-14
EP1513136A1 (en) 2005-03-09

Similar Documents

Publication Publication Date Title
KR20050023941A (ko) 음성 인식 및 화자 인식을 통한 개별화된 서비스를제공하는 a/v 장치 및 그 방법
US10958773B2 (en) Entertainment systems and methods
US11425469B2 (en) Methods and devices for clarifying audible video content
US7519534B2 (en) Speech controlled access to content on a presentation medium
US9419665B2 (en) Alternate user interfaces for multi tuner radio device
US8086168B2 (en) Device and method for monitoring, rating and/or tuning to an audio content channel
US20040083490A1 (en) Program recommendation system, program recommendation method and program for realizing the same
US7756916B2 (en) Display method
US20040143349A1 (en) Personal audio recording system
US20080133696A1 (en) Personal multi-media playing system
JP2007178927A (ja) 情報検索装置および方法
KR20140055502A (ko) 방송 수신 장치, 서버 및 그 제어 방법
WO2021018212A1 (zh) 具备通知功能的电子装置及电子装置的控制方法
WO2004029835A2 (en) System and method for associating different types of media content
JP3525855B2 (ja) 音声認識方法及び音声認識装置
JP2012203773A (ja) 動画推薦装置及び動画推薦方法
KR100499032B1 (ko) 텔레비젼 수신기를 기반으로 하는 오디오 및 비디오 합성편집장치
JP2005005900A (ja) 番組検索装置および方法
JP3807577B2 (ja) マン−マシンインターフェースシステム
JP7132974B2 (ja) 映像表示装置
JP2002252813A (ja) 番組検索装置及び番組検索プログラム
US9386254B2 (en) Broadcast method and broadcast apparatus
JPWO2006095847A1 (ja) コンテンツ記録装置、その方法、そのプログラム、および、そのプログラムを記録した記録媒体
JP2005055628A (ja) カラオケ装置
JP2006041662A (ja) 番組推薦装置

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E601 Decision to refuse application