KR20150077580A - 음성 인식 기반 서비스 제공 방법 및 그 장치 - Google Patents

음성 인식 기반 서비스 제공 방법 및 그 장치 Download PDF

Info

Publication number
KR20150077580A
KR20150077580A KR1020130166048A KR20130166048A KR20150077580A KR 20150077580 A KR20150077580 A KR 20150077580A KR 1020130166048 A KR1020130166048 A KR 1020130166048A KR 20130166048 A KR20130166048 A KR 20130166048A KR 20150077580 A KR20150077580 A KR 20150077580A
Authority
KR
South Korea
Prior art keywords
service
action type
providing
voice
keywords
Prior art date
Application number
KR1020130166048A
Other languages
English (en)
Inventor
류구현
김상락
장선균
김종주
전승기
Original Assignee
주식회사 케이티
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 케이티 filed Critical 주식회사 케이티
Priority to KR1020130166048A priority Critical patent/KR20150077580A/ko
Publication of KR20150077580A publication Critical patent/KR20150077580A/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems

Abstract

음성 인식 기반 서비스 제공 방법 및 그 장치가 개시된다. 음성 인식 기반 서비스 제공 방법은 사용자에 의해 입력된 음성을 인식하여 복수의 키워드를 추출하는 단계; 상기 추출된 키워드를 조합하여 액션 타입을 결정하는 단계; 및 상기 결정된 액션 타입에 따른 서비스를 제공하는 단계를 포함한다.

Description

음성 인식 기반 서비스 제공 방법 및 그 장치{Method and apparatus for providing of service based speech recognition}
본 발명은 음성 인식에 기반하여 콘텐츠 사용 패턴을 분석하여 사용자의 의도에 맞는 서비스를 제공할 수 있는 음성 인식 기반 서비스 제공 방법 및 그 장치에 관한 것이다.
음성인식(speech recognition) 기술이란 인간이 발화한 음성과 같은 음향학적 신호(acoustic speech signal)을 컴퓨터가 분석해 이를 인식 또는 이해하는 기술을 말하는데, 발음에 따라 입 모양과 혀의 위치 변화에 따라 특정한 주파수를 갖는 다는 점을 이용하여, 발성된 음성을 전기신호로 변환한 후 음성신호의 주파수 특성을 추출해 발음을 인식하는 기술이다.
한편, 음성은 일상 생활에서 가장 효과적이고 자연스러운 의사소통방법으로서, 사용자의 음성명령의 처리는 음성인식 기술의 발전과 더불어 인간과 기계 간의 새로운 인터페이스로 제안 및 개발되고 있다. 음성입력은 키보드나 마우스 등 기존의 입력장치의 사용이 미숙한 사람도 쉽게 사용할 수 있으며 정보입력속도도 빠를 뿐만 아니라 정보입력과 동시에 손으로 다른 일을 할 수 있다는 장점이 있다. 특히, 최근 급속도로 보급되고 있는 터치스크린을 구비한 스마트폰의 경우, 터치 스크린 상에 나타나는 가상 키보드를 통해 문자입력 등 조작을 하게 되는데, 이러한 가상 키보드에 의한 입력의 불편함을 해소할 수 있는 대안으로 음성입력이 강하게 대두되고 있다.
그러나 종래 기술은 음성으로 단순 단어 및 문장을 발성하면 텍스트 입력을 대신한 수준에서 주로 검색, 채팅, 명령어 실행 정도 기능으로 이용되고 있는 상황이다.
본 발명은 음성 인식에 기반하여 콘텐츠 사용 패턴을 분석하여 사용자의 의도에 맞는 서비스를 제공할 수 있는 음성 인식 기반 서비스 제공 방법 및 그 장치를 제공하기 위한 것이다.
본 발명의 일 측면에 따르면 음성 인식에 기반하여 콘텐츠 사용 패턴을 분석하여 사용자의 의도에 맞는 서비스를 제공할 수 있는 음성 인식 기반 서비스 제공 방법이 제공된다.
본 발명의 일 실시예에 따르면, 사용자에 의해 입력된 음성을 인식하여 복수의 키워드를 추출하는 단계; 상기 추출된 키워드를 조합하여 액션 타입을 결정하는 단계; 및 상기 결정된 액션 타입에 따른 서비스를 제공하는 단계를 포함하는 음성 인식 기반 서비스 제공 방법이 제공될 수 있다.
상기 액션 타입은 앱(app) 호출 타입 또는 검색 타입일 수 있다.
상기 액션 타입을 결정하는 단계는, 상기 추출된 키워드를 조합하여 매핑된 앱이 존재하면, 상기 앱 호출 타입으로 상기 액션 타입을 결정하는 단계를 포함할 수 있다.
상기 결정된 액션 타입에 따른 서비스를 제공하는 단계는, 상기 추출된 키워드의 조합에 따른 매핑된 앱을 실행하는 단계; 및 상기 실행된 앱을 통해 상기 추출된 키워드에 따른 콘텐츠를 재생시키는 단계를 포함할 수 있다.
상기 액션 타입을 결정하는 단계는, 상기 추출된 키워드를 조합하여 매핑된 앱이 존재하지 않는 경우, 상기 액션 타입을 검색 타입으로 결정할 수 있다.
상기 결정된 액션 타입에 따른 서비스를 제공하는 단계는, 상기 추출된 키워드의 조합에 따른 매핑된 앱이 복수인 경우, 복수의 앱 리스트를 출력하는 단계; 및 상기 출력된 앱 리스트 중 어느 하나를 선택받아 실행하는 단계를 포함할 수 있다.
상기 액션 타입을 결정하는 단계는, 상기 추출된 키워드의 조합에 따른 히스토리를 더 고려하여 상기 액션 타입을 결정할 수 있다.
상기 액션 타입을 결정하는 단계는, 상기 히스토리를 더 고려하여 상기 추출된 키워드의 조합에 따라 가장 최근 결정된 액션 타입으로 결정할 수 있다.
상기 액션 타입을 결정하는 단계는, 상기 히스토리를 더 고려하여 상기 추출된 키워드의 조합에 따른 결정 빈도가 가장 높은 액션 타입으로 결정할 수 있다.
본 발명의 다른 실시예에 따르면, 사용자에 의해 입력된 음성을 인식하여 복수의 키워드를 추출하는 단계; 및 상기 추출된 키워드에 대응하는 서비스 사용에 따른 히스토리가 존재하면, 상기 히스토리에 기초하여 서비스를 제공하는 단계를 포함할 수 있다.
상기 히스토리에 기초하여 서비스를 제공하는 단계는, 상기 히스토리에 기초하여 상기 추출된 키워드에 대응하는 서비스 사용에 따른 사용 빈도가 가장 높거나 가장 최근 사용된 서비스를 제공할 수 있다.
상기 서비스는 앱 또는 검색 서비스일 수 있다.
본 발명의 다른 측면에 따르면, 음성 인식에 기반하여 콘텐츠 사용 패턴을 분석하여 사용자의 의도에 맞는 서비스를 제공할 수 있는 음성 인식 기반 서비스를 제공할 수 있는 장치가 제공된다.
본 발명의 일 실시예에 따르면, 사용자의 음성을 입력받는 음성 입력부; 상기 음성 입력부를 통해 입력된 음성을 인식하여 복수의 키워드를 추출하는 음성 인식부; 및 상기 추출된 키워드를 이용하여 액션 타입을 결정하고, 상기 결정된 액션 타입에 따른 서비스를 제공하는 서비스 제공부를 포함하는 사용자 단말이 제공될 수 있다.
본 발명의 다른 실시예에 따르면, 사용자의 음성을 입력받는 음성 입력부; 상기 입력받은 음성을 포함하는 음성 인식 요청을 서버로 제공하고, 상기 서버를 통해 음성 인식 결과에 따른 복수의 키워드를 수신하는 통신부; 및 상기 추출된 키워드를 이용하여 액션 타입을 결정하고, 상기 결정된 액션 타입에 따른 서비스를 제공하는 서비스 제공부를 포함하는 사용자 단말이 제공될 수도 있다.
상기 서비스 제공부는, 상기 추출된 키워드에 매핑된 앱이 존재하면, 상기 액션 타입을 앱 호출 타입으로 결정하고, 상기 추출된 키워드에 매핑된 앱이 존재하지 않으면, 상기 액션 타입을 검색 타입으로 결정할 수 있다.
본 발명의 또 다른 실시예에 따르면, 사용자의 음성을 입력받는 음성 입력부; 상기 입력받은 음성을 포함하는 음성 인식 요청을 서버로 제공하고, 상기 서버로부터 상기 음성 인식 결과에 따른 추출된 키워드와 상기 추출된 키워드에 대한 액션 타입을 수신하는 통신부; 및 상기 수신된 액션 타입에 따른 서비스를 실행하고, 상기 실행된 서비스를 통해 상기 추출된 키워드에 따른 콘텐츠를 재생하거나 상기 추출된 키워드에 대한 검색 서비스를 제공하는 서비스 제공부를 포함하는 사용자 단말이 제공될 수 있다.
본 발명의 또 다른 실시예에 따르면, 사용자의 음성을 입력받는 음성 입력부; 상기 입력받은 음성을 인식하여 복수의 키워드를 추출하는 음성 인식부; 및 상기 추출된 키워드에 대응하는 서비스 사용에 따른 히스토리에 기초하여 서비스를 제공하는 서비스 제공부를 포함하는 사용자 단말이 제공될 수 있다.
본 발명의 일 실시예에 따르면, 음성 인식 기반 서비스 제공 방법 및 그 장치를 제공함으로써, 음성 인식에 기반하여 콘텐츠 사용 패턴을 분석하여 사용자의 의도에 맞는 서비스를 제공할 수 있다.
도 1은 본 발명의 일 실시예에 따른 음성 인식 기반 서비스를 제공하기 위한 시스템 구성을 도시한 도면.
도 2는 본 발명의 일 실시예에 따른 음성 인식 기반 서비스를 제공하는 방법을 나타낸 순서도.
도 3 내지 도 6은 본 발명의 일 실시예에 따른 음성 인식에 따른 서비스를 제공하는 시나리오를 예시한 도면.
도 7은 본 발명의 다른 실시예에 따른 음성 인식 기반 서비스를 제공하는 방법을 나타낸 순서도.
도 8은 본 발명의 일 실시예에 따른 사용자 단말의 내부 구성을 나타낸 블록도.
본 발명은 다양한 변환을 가할 수 있고 여러 가지 실시예를 가질 수 있는 바, 특정 실시예들을 도면에 예시하고 상세한 설명에 상세하게 설명하고자 한다. 그러나, 이는 본 발명을 특정한 실시 형태에 대해 한정하려는 것이 아니며, 본 발명의 사상 및 기술 범위에 포함되는 모든 변환, 균등물 내지 대체물을 포함하는 것으로 이해되어야 한다. 본 발명을 설명함에 있어서 관련된 공지 기술에 대한 구체적인 설명이 본 발명의 요지를 흐릴 수 있다고 판단되는 경우 그 상세한 설명을 생략한다.
본 발명을 설명함에 있어서, 관련된 공지 기술에 대한 구체적인 설명이 본 발명의 요지를 불필요하게 흐릴 수 있다고 판단되는 경우 그 상세한 설명을 생략한다. 또한, 본 명세서의 설명 과정에서 이용되는 숫자(예를 들어, 제1, 제2 등)는 하나의 구성요소를 다른 구성요소와 구분하기 위한 식별기호에 불과하다.
또한, 본 명세서에서, 일 구성요소가 다른 구성요소와 "연결된다" 거나 "접속된다" 등으로 언급된 때에는, 상기 일 구성요소가 상기 다른 구성요소와 직접 연결되거나 또는 직접 접속될 수도 있지만, 특별히 반대되는 기재가 존재하지 않는 이상, 중간에 또 다른 구성요소를 매개하여 연결되거나 또는 접속될 수도 있다고 이해되어야 할 것이다.
이하, 첨부된 도면들을 참조하여 본 발명의 실시예를 상세히 설명한다.
도 1은 본 발명의 일 실시예에 따른 음성 인식 기반 서비스를 제공하기 위한 시스템 구성을 도시한 도면이다.
도 1에 도시된 바와 같이, 본 발명의 일 실시예에 따른 음성 인식 기반 서비스 제공을 위해 각 서비스를 n(자연수)개의 카테고리로 분류할 수 있다. 도 1에는 영상(TV), 음악, 지역, 앱 실행, 날씨, 뉴스, 주식, 교육, 웹 검색으로 카테고리를 분류하고 있으나. 이외의 다른 기준으로 서비스에 대한 카테고리가 분류될 수도 있음은 당연하다.
사용자 단말(100)을 통해 사용자가 음성을 입력하면, 사용자 단말(100) 또는 서버를 통해 사용자에 의해 입력된 음성이 인식된다. 이에 따라 사용자 단말(100)은 음성 인식된 결과에 따른 적어도 하나의 텍스트(키워드) 또는 복수의 텍스트(키워드)의 조합에 따라 음성의 의미를 인식하여 인식된 의미에 따른 서비스를 사용자에게 제공할 수 있다.
도 2는 본 발명의 일 실시예에 따른 음성 인식 기반 서비스를 제공하는 방법을 나타낸 순서도이다.
단계 210에서 사용자 단말(100)은 사용자로부터 음성을 입력받는다.
단계 215에서 사용자 단말(100)은 입력받은 음성을 인식하여 복수의 키워드를 추출한다. 예를 들어, 사용자 단말(100)은 입력받은 음성을 인식하여 텍스트로 변환하고, 변환된 텍스트에서 형태소 분석을 통해 각 단어를 키워드로써 추출할 수 있다.
입력받은 음성을 인식하여 텍스트로 변환하는 방법 자체, 각 텍스트에서 형태소 분석을 통해 각 단어를 추출하는 방법 자체는 이미 공지된 기술이므로 이에 대한 별도의 설명은 생략하기로 한다.
단계 220에서 사용자 단말(100)은 추출된 키워드를 이용하여 액션 타입을 결정한다.
여기서, 액션 타입은 앱 호출 또는 검색 타입 중 어느 하나일 수 있다.
예를 들어, 사용자 단말(100)은 추출된 키워드 중 어느 하나 또는 추출된 키워드의 조합에 따른 매핑된 앱(app)이 존재하는지 여부를 판단한다. 만일 추출된 키워드에 대응하는 앱이 존재하면, 사용자 단말(100)은 추출된 키워드에 따른 액션 타입은 앱 호출 타입인 것으로 결정할 수 있다.
그러나, 만일 추출된 키워드에 대응하는 앱이 존재하지 않거나 특정되지 않는 경우, 사용자 단말(100)은 해당 추출된 키워드의 액션 타입을 검색 타입으로 결정할 수 있다. 예를 들어, 음성 인식 결과에 따라 추출된 키워드가 "VAN 사업 특성에 대해 알려 주세요"라고 가정하자. 이와 같은 경우, 해당 추출된 키워드에 대응하는 앱 또는 서비스를 특정할 수 없으므로, 사용자 단말(100)은 해당 추출된 키워드로의 검색을 위해 액션 타입을 검색 타입으로 결정할 수 있다.
이와 같이, 사용자 단말(100)은 추출된 키워드에 대응하여 특정되는 앱 또는 서비스가 존재하지 않는 경우 액션 타입을 검색 타입으로 결정할 수 있다.
또한, 액션 타입 결정시, 사용자 단말(100)은 히스토리를 더 고려하여 액션 타입을 결정할 수도 있다.
예를 들어, 사용자 단말(100)은 히스토리를 참조하여, 추출된 키워드에 대응하여 결정된 결정 빈도가 가장 높은 액션 타입으로 액션 타입을 결정하거나 가장 마지막에 결정된 액션 타입으로 액션 타입을 결정할 수도 있다.
단계 225에서 사용자 단말(100)은 결정된 액션 타입에 따른 서비스를 제공한다.
예를 들어, 액션 타입이 앱 호출 타입이라고 가정하자. 사용자 단말(100)은 추출된 키워드에 대응하는 앱을 호출하고, 호출된 앱을 통해 추출된 키워드에 관련된 콘텐츠를 재생하도록 할 수 있다.
이때, 추출된 키워드에 대응하는 앱이 복수인 경우, 사용자 단말(100)은 추출된 키워드에 대응하는 복수의 키워드를 출력한 후 사용자로부터 어느 하나를 선택받고, 선택받은 앱을 실행시킬 수도 있다.
다른 예를 들어, 추출된 키워드에 대응하는 앱이 복수인 경우, 사용자 단말(100)은 이전 히스토리를 참조하여 사용빈도가 가장 많은 앱, 최근 이용된(즉, 가장 마지막 이용된) 앱을 실행할 수도 있다.
다른 예를 들어, 액션 타입이 검색 타입이라고 가정하자. 사용자 단말(100)은 추출된 키워드의 검색을 위해 연동된 검색 창을 실행시키고, 추출된 키워드를 검색어로 입력하여 검색 결과를 화면에 출력하도록 할 수 있다.
도 3 내지 도 6은 본 발명의 일 실시예에 따른 음성 인식에 따른 서비스를 제공하는 시나리오를 예시한 도면이다.
도 3은 음성 인식을 통해 특정 가수의 노래를 재생하기 위한 시나리오를 예시한 것으로, 사용자가 "조용필 노래"와 같이 음성을 입력하였다고 가정하자(310). 음성 인식을 통해 "조용필 노래"가 인식되면, 사용자 단말(100)은 음성 인식을 통해 추출된 키워드 "노래"에 대응하여 노래 재생을 위한 앱(예를 들어, 지니앱")이 존재하므로 노래 재생 앱을 실행시킨다(320). 이어, 사용자 단말(100)은 실행된 노래 재생 앱을 통해 인식된 키워드(즉, 추출된 키워드) "조용필"을 검색한 후 조용필에 대한 노래 리스트를 출력할 수 있다(330).
도 4는 음성 인식을 통해 영화 재생을 위한 시나리오를 예시한 것이다. 사용자가 사용자 단말(100)을 통해 "최신 영화"와 같이 음성을 입력하였다고 가정하자(410). 음성 인식을 통해 "최신 영화"가 인식되면, 사용자 단말(100)은 음성 인식을 통해 추출된 키워드 "영화"에 대응하여 영화 재생을 위한 앱이 존재하므로, 이를 실행시킨다(420). 이어, 사용자 단말(100)은 영화 재생을 위해 실행된 앱을 통해 최신 영화 리스트를 화면에 출력하고(430) 사용자에 의해 어느 하나가 선택되는 경우, 해당 선택된 영화를 재생시킬 수 있다.
도 5는 음성 인식을 통해 맛집을 검색하는 시나리오를 예시한 것이다. 사용자가 "광화문 맛집"과 같이 음성을 입력하였다고 가정하자(510). 사용자 단말(100)은 음성 인식을 통해 "광화문 맛집"을 키워드로 추출하고, 추출된 키워드에 대응하여 내비게이션 앱이 존재하므로, 내비게이션 앱을 실행시킨다(520). 이어, 사용자 단말(100)은 실행된 내비게이션 앱을 통해 "광화문 맛집"을 검색하여 검색 결과를 제공할 수 있다(530).
이와 같이, 사용자 단말(100)은 음성 인식을 통해 복수의 키워드를 추출하고, 추출된 키워드에 대응하여 앱이 존재하면, 해당 앱을 실행시키고, 실행된 앱을 통해 특정 콘텐츠를 제공할 수 있다.
도 3 내지 도 5에서 보여지는 바와 같이, 음성 인식시, 사용자 단말(100)은 음성 인식에 따른 추출된 키워드와 관련하여 유사 검색어 리스트를 제공할 수도 있다.
도 6은 음성 인식에 따른 키워드에 대응하는 앱이 존재하지 않는 경우의 시나리오를 예시한 도면이다.
도 6의 610과 같이, 사용자가 사용자 단말(100)을 통해 "계삵기"와 같이 음성을 인식하였다고 가정하자. 음성 인식 결과 "계삵기"에 대응하는 앱이 존재하지 않으므로, 사용자 단말(100)은620과 같이 음성 인식 실패를 알리는 안내 메시지"이해하지 못하였습니다"를 출력한 후 검색 창을 실행시키고, 검색창을 통해 추출된 키워드를 검색어로 입력하여 검색 결과를 출력할 수 있다(630).
도 7은 본 발명의 다른 실시예에 따른 음성 인식 기반 서비스를 제공하는 방법을 나타낸 순서도이다.
단계 710에서 사용자 단말(100)은 사용자로부터 음성을 입력받는다.
이와 같이, 입력받은 음성을 사용자 단말(100)은 서버(미도시)로 전송한다. 여기서, 서버는 음성 인식에 따른 음성 인식 결과를 제공하기 위한 서버로, 클라우드 기반 서버일 수 있다.
단계 715에서 서버는 음성 인식 결과를 사용자 단말(100)로 전송한다.
음성 인식 결과는 텍스트 형태로 제공되며, 복수의 키워드를 포함할 수 있다.
단계 720에서 사용자 단말(100)은 서버를 통해 제공받은 음성 인식 결과를 이용하여 대응하는 액션 타입을 결정한다.
이어, 단계725에서 사용자 단말(100)은 결정된 액션 타입에 따른 서비스를 제공한다.
도 7에 도시된 바와 같이, 사용자 단말(100)은 사용자로부터 음성이 인식되면, 이를 클라우드 기반 서버로 전송하여 음성 인식을 요청하고, 서버로부터 음성 인식 결과를 제공받은 후 음성 인식 결과에 따른 액션 타입을 결정하여 관련된 서비스를 제공할 수 있다.
다른 예를 들어, 사용자 단말(100)은 사용자로부터 입력된 음성을 포함하는 음성 인식 요청을 서버로 전송하고, 서버를 통해 음성 인식 결과와 함께 결정된 액션 타입을 제공받을 수도 있다. 사용자 단말(100)은 서버로부터의 음성 인식 결과에 따라 제공받은 액션 타입에 따른 서비스를 제공할 수도 있다.
도 8은 본 발명의 일 실시예에 따른 사용자 단말의 내부 구성을 나타낸 블록도이다.
도 8을 참조하면, 본 발명의 일 실시예에 따른 사용자 단말(100)은 통신부(810), 음성 입력부(815), 입력부(820), 음성 인식부(825), 디스플레이부(830), 메모리(835), 서비스 제공부(840) 및 제어부(845)를 포함하여 구성된다.
통신부(810)는 통신망을 통해 다른 장치들과 데이터를 송수신하기 위한 수단이다.
음성 입력부(815)는 제어부(845)의 제어에 따라 사용자로부터 음성을 입력받기 위한 수단이다. 예를 들어, 음성 입력부(815)는 마이크일 수 있다.
입력부(820)는 본 발명의 일 실시예에 따른 사용자 단말(100)을 제어하기 위한 제어 명령, 어플리케이션 실행 명령 또는 다양한 데이터를 입력받기 위한 수단이다. 예를 들어, 입력부(820)는 적어도 하나의 키버튼을 포함할 수 있다.
음성 인식부(825)는 음성 입력부(815)를 통해 입력받은 음성을 인식하기 위한 수단이다.
본 발명의 일 실시예에 따른 사용자 단말(100)은 음성 인식부(825)를 포함할 수도 있으나, 다른 실시예에 따르면, 음성 인식부(825)를 미포함할 수도 있다.
예를 들어, 음성 인식부(825)가 미포함된 경우, 사용자 단말(100)은 사용자에 의해 입력된 음성을 포함하는 음성 인식 요청을 서버로 전송하여 음성 인식 결과 및 액션 타입 중 적어도 하나를 서버로부터 제공받을 수 있다.
음성 인식 방법 자체는 이미 공지된 사항이므로 이에 대한 상세한 설명은 생략하기로 한다.
디스플레이부(830)는 다양한 데이터를 시각 정보의 형태로 출력하기 위한 수단이다. 예를 들어, 디스플레이부(830)는 액정화면일 수 있다.
예를 들어, 디스플레이부(830)는 제어부(845)의 제어에 따라 앱 실행 화면 등을 디스플레이 할 수 있다.
메모리(835)는 본 발명의 일 실시예에 따른 사용자 단말(100)을 운용하기 위해 필요한 다양한 어플리케이션, 음성 인식에 기반한 서비스를 제공하기 위한 다양한 데이터 등을 저장하기 위한 수단이다.
서비스 제공부(840)는 음성 인식부(825)를 통해 인식된 음성 인식 결과에 따른 액션 타입을 결정하고, 결정된 액션 타입에 따른 서비스를 제공하기 위한 수단이다.
예를 들어, 서비스 제공부(840)는 음성 인식 결과에 따라 추출된 복수의 키워드에 대응하는 앱의 존재 여부에 따라 액션 타입을 결정하고, 결정된 액션 타입에 따른 서비스(예를 들어, 앱 실행, 검색창 구동 등)를 제공할 수 있다.
또한, 서비스 제공부(840)는 음성 인식 결과에 따라 추출된 키워드에 대응하여 결정된 액션 타입에 따른 히스토리를 저장하여 관리할 수도 있다. 이에 따라, 서비스 제공부(840)는 히스토리를 참고하여 추출된 키워드에 가장 많이 대응되는 액션 타입 또는 가장 많이 결정된 액션 타입으로 액션 타입을 결정할 수도 있다.
또 다른 예를 들어, 서비스 제공부(840)는 결정된 액션 타입에 따른 서비스를 제공시에도 히스토리를 고려할 수도 있다. 이에 따라, 서비스 제공부(840)는 히스토리를 고려하여 사용자의 사용 패턴을 분석한 후 이를 반영하여 액션 타입에 따른 서비스를 제공할 수도 있다.
예를 들어, 히스토리를 고려하여 결정된 액션 타입에 따른 가장 많이 이용된 서비스, 가장 최근 이용된 서비스를 제공할 수도 있다.
제어부(845)는 본 발명의 일 실시예에 따른 사용자 단말(100)의 내부 구성 요소들(예를 들어, 통신부(810), 음성 입력부(815), 입력부(820), 음성 인식부(825), 디스플레이부(830), 메모리(835), 서비스 제공부(840) 등)을 제어하기 위한 수단이다.
상술한 본 발명에 따른 음성 인식에 기반한 서비스를 제공하는 방법은 컴퓨터로 읽을 수 있는 기록 매체에 컴퓨터가 읽을 수 있는 코드로서 구현되는 것이 가능하다. 컴퓨터가 읽을 수 있는 기록매체로는 컴퓨터 시스템에 의하여 해독될 수 있는 데이터가 저장된 모든 종류의 기록 매체를 포함한다. 예를 들어, ROM(Read Only Memory), RAM(Random Access Memory), 자기 테이프, 자기 디스크, 플래쉬 메모리, 광 데이터 저장장치 등이 있을 수 있다. 또한, 컴퓨터가 읽을 수 있는 기록매체는 컴퓨터 통신망으로 연결된 컴퓨터 시스템에 분산되어, 분산방식으로 읽을 수 있는 코드로서 저장되고 실행될 수 있다.
이상에서는 본 발명의 실시예를 참조하여 설명하였지만, 해당 기술 분야에서 통상의 지식을 가진 자라면 하기의 특허 청구의 범위에 기재된 본 발명의 사상 및 영역으로부터 벗어나지 않는 범위 내에서 본 발명을 다양하게 수정 및 변경시킬 수 있음을 쉽게 이해할 수 있을 것이다.
810: 통신부
815: 음성 입력부
820: 입력부
825: 음성 인식부
830: 디스플레이부
835: 메모리
840: 서비스 제공부
845: 제어부

Claims (17)

  1. 사용자에 의해 입력된 음성을 인식하여 복수의 키워드를 추출하는 단계;
    상기 추출된 키워드를 조합하여 액션 타입을 결정하는 단계; 및
    상기 결정된 액션 타입에 따른 서비스를 제공하는 단계를 포함하는 음성 인식 기반 서비스 제공 방법.
  2. 제1 항에 있어서,
    상기 액션 타입은 앱(app) 호출 타입 또는 검색 타입인 것을 특징으로 하는 음성 인식 기반 서비스 제공 방법.
  3. 제2 항에 있어서,
    상기 액션 타입을 결정하는 단계는,
    상기 추출된 키워드를 조합하여 매핑된 앱이 존재하면, 상기 앱 호출 타입으로 상기 액션 타입을 결정하는 단계를 포함하는 음성 인식 기반 서비스 제공 방법.
  4. 제3 항에 있어서,
    상기 결정된 액션 타입에 따른 서비스를 제공하는 단계는,
    상기 추출된 키워드의 조합에 따른 매핑된 앱을 실행하는 단계; 및
    상기 실행된 앱을 통해 상기 추출된 키워드에 따른 콘텐츠를 재생시키는 단계를 포함하는 것을 특징으로 하는 음성 인식 기반 서비스 제공 방법.
  5. 제1 항에 있어서,
    상기 액션 타입을 결정하는 단계는,
    상기 추출된 키워드를 조합하여 매핑된 앱이 존재하지 않는 경우, 상기 액션 타입을 검색 타입으로 결정하는 것을 특징으로 하는 음성 인식 기반 서비스 제공 방법.
  6. 제3 항에 있어서,
    상기 결정된 액션 타입에 따른 서비스를 제공하는 단계는,
    상기 추출된 키워드의 조합에 따른 매핑된 앱이 복수인 경우, 복수의 앱 리스트를 출력하는 단계; 및
    상기 출력된 앱 리스트 중 어느 하나를 선택받아 실행하는 단계를 포함하는 음성 인식 기반 서비스 제공 방법.
  7. 제1 항에 있어서,
    상기 액션 타입을 결정하는 단계는,
    상기 추출된 키워드의 조합에 따른 히스토리를 더 고려하여 상기 액션 타입을 결정하는 것을 특징으로 하는 음성 인식 기반 서비스 제공 방법.
  8. 제7 항에 있어서,
    상기 액션 타입을 결정하는 단계는,
    상기 히스토리를 더 고려하여 상기 추출된 키워드의 조합에 따라 가장 최근 결정된 액션 타입으로 결정하는 것을 특징으로 하는 음성 인식 기반 서비스 제공 방법.
  9. 제7 항에 있어서,
    상기 액션 타입을 결정하는 단계는,
    상기 히스토리를 더 고려하여 상기 추출된 키워드의 조합에 따른 결정 빈도가 가장 높은 액션 타입으로 결정하는 것을 특징으로 하는 음성 인식 기반 서비스 제공 방법.
  10. 사용자에 의해 입력된 음성을 인식하여 복수의 키워드를 추출하는 단계; 및
    상기 추출된 키워드에 대응하는 서비스 사용에 따른 히스토리가 존재하면, 상기 히스토리에 기초하여 서비스를 제공하는 단계를 포함하는 음성 인식 기반 서비스 제공 방법.
  11. 제10 항에 있어서,
    상기 히스토리에 기초하여 서비스를 제공하는 단계는,
    상기 히스토리에 기초하여 상기 추출된 키워드에 대응하는 서비스 사용에 따른 사용 빈도가 가장 높거나 가장 최근 사용된 서비스를 제공하는 것을 특징으로 하는 음성 인식 기반 서비스 제공 방법.
  12. 제10 항에 있어서,
    상기 서비스는 앱 또는 검색 서비스인 것을 특징으로 하는 음성 인식 기반 서비스 제공 방법.
  13. 사용자의 음성을 입력받는 음성 입력부;
    상기 음성 입력부를 통해 입력된 음성을 인식하여 복수의 키워드를 추출하는 음성 인식부; 및
    상기 추출된 키워드를 이용하여 액션 타입을 결정하고, 상기 결정된 액션 타입에 따른 서비스를 제공하는 서비스 제공부를 포함하는 사용자 단말.
  14. 사용자의 음성을 입력받는 음성 입력부;
    상기 입력받은 음성을 포함하는 음성 인식 요청을 서버로 제공하고, 상기 서버를 통해 음성 인식 결과에 따른 복수의 키워드를 수신하는 통신부; 및
    상기 추출된 키워드를 이용하여 액션 타입을 결정하고, 상기 결정된 액션 타입에 따른 서비스를 제공하는 서비스 제공부를 포함하는 사용자 단말.
  15. 제13 항 또는 제14 항에 있어서,
    상기 서비스 제공부는,
    상기 추출된 키워드에 매핑된 앱이 존재하면, 상기 액션 타입을 앱 호출 타입으로 결정하고, 상기 추출된 키워드에 매핑된 앱이 존재하지 않으면, 상기 액션 타입을 검색 타입으로 결정하는 것을 특징으로 하는 사용자 단말.
  16. 사용자의 음성을 입력받는 음성 입력부;
    상기 입력받은 음성을 포함하는 음성 인식 요청을 서버로 제공하고, 상기 서버로부터 상기 음성 인식 결과에 따른 추출된 키워드와 상기 추출된 키워드에 대한 액션 타입을 수신하는 통신부; 및
    상기 수신된 액션 타입에 따른 서비스를 실행하고, 상기 실행된 서비스를 통해 상기 추출된 키워드에 따른 콘텐츠를 재생하거나 상기 추출된 키워드에 대한 검색 서비스를 제공하는 서비스 제공부를 포함하는 사용자 단말.
  17. 사용자의 음성을 입력받는 음성 입력부;
    상기 입력받은 음성을 인식하여 복수의 키워드를 추출하는 음성 인식부; 및
    상기 추출된 키워드에 대응하는 서비스 사용에 따른 히스토리에 기초하여 서비스를 제공하는 서비스 제공부를 포함하는 사용자 단말.
KR1020130166048A 2013-12-27 2013-12-27 음성 인식 기반 서비스 제공 방법 및 그 장치 KR20150077580A (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020130166048A KR20150077580A (ko) 2013-12-27 2013-12-27 음성 인식 기반 서비스 제공 방법 및 그 장치

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020130166048A KR20150077580A (ko) 2013-12-27 2013-12-27 음성 인식 기반 서비스 제공 방법 및 그 장치

Publications (1)

Publication Number Publication Date
KR20150077580A true KR20150077580A (ko) 2015-07-08

Family

ID=53790301

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020130166048A KR20150077580A (ko) 2013-12-27 2013-12-27 음성 인식 기반 서비스 제공 방법 및 그 장치

Country Status (1)

Country Link
KR (1) KR20150077580A (ko)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018016760A1 (ko) * 2016-07-21 2018-01-25 삼성전자 주식회사 전자 장치 및 그의 제어 방법
KR20180084672A (ko) * 2017-01-16 2018-07-25 주식회사 케이티 음성 신호에 기반하여 서비스를 제공하는 통합 서버, 방법 및 공용 단말
WO2020111292A1 (en) * 2018-11-27 2020-06-04 Lg Electronics Inc. Multimedia device for processing voice command
KR102148021B1 (ko) 2019-10-16 2020-08-25 주식회사 젠티 딥러닝 텍스트 탐지 기술을 활용한 실생활 영상 속의 정보 검색 방법 및 그 장치
US10957321B2 (en) 2016-07-21 2021-03-23 Samsung Electronics Co., Ltd. Electronic device and control method thereof
KR20210045298A (ko) 2019-10-16 2021-04-26 주식회사 젠티 딥러닝 텍스트 탐지 기술을 활용한 실생활 영상 속의 정보 검색 방법
US11211063B2 (en) 2018-11-27 2021-12-28 Lg Electronics Inc. Multimedia device for processing voice command
WO2023074918A1 (ko) * 2021-10-25 2023-05-04 엘지전자 주식회사 디스플레이 장치

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018016760A1 (ko) * 2016-07-21 2018-01-25 삼성전자 주식회사 전자 장치 및 그의 제어 방법
US10957321B2 (en) 2016-07-21 2021-03-23 Samsung Electronics Co., Ltd. Electronic device and control method thereof
KR20180084672A (ko) * 2017-01-16 2018-07-25 주식회사 케이티 음성 신호에 기반하여 서비스를 제공하는 통합 서버, 방법 및 공용 단말
WO2020111292A1 (en) * 2018-11-27 2020-06-04 Lg Electronics Inc. Multimedia device for processing voice command
US11211063B2 (en) 2018-11-27 2021-12-28 Lg Electronics Inc. Multimedia device for processing voice command
KR102148021B1 (ko) 2019-10-16 2020-08-25 주식회사 젠티 딥러닝 텍스트 탐지 기술을 활용한 실생활 영상 속의 정보 검색 방법 및 그 장치
KR20210045298A (ko) 2019-10-16 2021-04-26 주식회사 젠티 딥러닝 텍스트 탐지 기술을 활용한 실생활 영상 속의 정보 검색 방법
WO2023074918A1 (ko) * 2021-10-25 2023-05-04 엘지전자 주식회사 디스플레이 장치

Similar Documents

Publication Publication Date Title
EP3251115B1 (en) Updating language understanding classifier models for a digital personal assistant based on crowd-sourcing
US11232155B2 (en) Providing command bundle suggestions for an automated assistant
JP6667504B2 (ja) オーファン発話検出システム及び方法
KR20150077580A (ko) 음성 인식 기반 서비스 제공 방법 및 그 장치
Schalkwyk et al. “Your word is my command”: Google search by voice: A case study
US9886958B2 (en) Language and domain independent model based approach for on-screen item selection
CN105592343B (zh) 针对问题和回答的显示装置和方法
KR102072826B1 (ko) 음성 인식 장치 및 응답 정보 제공 방법
KR20140089861A (ko) 디스플레이 장치 및 그의 제어 방법
KR20150036643A (ko) 내추럴 동작 입력을 사용한 문맥 관련 쿼리 조정
US11881209B2 (en) Electronic device and control method
US11586689B2 (en) Electronic apparatus and controlling method thereof
US20230419963A1 (en) Selectively providing enhanced clarification prompts in automated assistant interactions
KR20160032564A (ko) 영상표시장치, 영상표시장치의 구동방법 및 컴퓨터 판독가능 기록매체
KR20120083025A (ko) 서로 다른 적어도 2개 이상의 데이터베이스를 이용하여 음성 인식 서비스를 제공하는 멀티미디어 디바이스 및 그 제어 방법
US20230144326A1 (en) Contextual smart switching via multi-modal learning mechanism
US11935539B1 (en) Integrating voice controls into applications
US20210264910A1 (en) User-driven content generation for virtual assistant
KR20160022326A (ko) 디스플레이 장치 및 그의 제어 방법
KR20230014680A (ko) 서드파티 디지털 어시스턴트 액션을 위한 비트 벡터 기반 콘텐츠 매칭
KR20190077268A (ko) 디스플레이 장치 및 그의 제어 방법

Legal Events

Date Code Title Description
E902 Notification of reason for refusal
AMND Amendment
E601 Decision to refuse application
AMND Amendment
E902 Notification of reason for refusal