KR101467519B1

KR101467519B1 - 음성 정보를 이용한 컨텐츠 검색 서버 및 방법

Info

Publication number: KR101467519B1
Application number: KR1020110121543A
Authority: KR
Inventors: 류창선; 구명완; 김희경; 박성찬; 박재한; 안동훈; 이경님; 한영호
Original assignee: 주식회사 케이티
Priority date: 2011-11-21
Filing date: 2011-11-21
Publication date: 2014-12-02
Also published as: KR20130055879A; US20130132081A1

Abstract

제 1 단말로부터 음성 정보를 수신하고, 상기 제 1 단말로부터 상기 제 1 단말의 단말 정보를 수신하고, 상기 수신한 제 1 단말의 단말 정보에 기초하여 단말을 식별하고, 상기 제 1 단말의 단말 정보에 기초하여 상기 음성 정보를 텍스트 정보로 변환하고, 상기 변환된 텍스트 정보에 기초하여 컨텐츠를 검색하여, 상기 검색된 컨텐츠 정보를 제 2 단말로 제공하는 컨텐츠 검색 서버 및 방법이 제공된다.

Description

음성 정보를 이용한 컨텐츠 검색 서버 및 방법{SERVER AND METHOD FOR SEARCHING CONTENTS USING VOICE INFORMATION}

본 발명은 음성 정보를 이용한 컨텐츠 검색 서버 및 방법에 관한 것이다.

IPTV(Internet Protocol Television)는 인터넷망을 이용하여 정보서비스, 영화 및 방송 등을 제공하는 양방향 텔레비전 서비스를 일컫는다.

IPTV는 인터넷 TV와는 다르게 컴퓨터 모니터 대신 TV를 이용하고, 마우스 대신 리모컨을 사용한다. 따라서 컴퓨터에 익숙하지 않은 사용자라도 리모컨을 이용하여 간단하게 인터넷 검색뿐만 아니라 영화감상, 홈쇼핑, 게임 등 인터넷이 제공하는 다양한 컨텐츠 및 부가 서비스를 제공 받을 수 있다.

또한, IPTV는 일반 공중파 방송이나 케이블방송 및 위성방송과는 달리 시청자가 자신이 편리한 시간에 자신이 보고 싶은 프로그램만 볼 수 있는 장점이 있으며, 이러한 양방향성은 다양한 형태의 서비스 도출을 가능하게 한다.

사용자가 기존 IPTV 서비스를 이용하여, 컨텐츠를 검색하거나 제어하는 기능을 리모컨이 수행하였으나, 최근에는 스마트폰 등의 단말을 이용한 방법이 제시되고 있다.

하지만, 컨텐츠가 다양하며, 스마트폰 등의 단말은 터치식 입력의 한계를 벗어나지 못하였으며, 터치 방식의 단말 등에 익숙하지 않은 사용자는 이용하기 쉽지 않다.

한편, 선행 기술로서, 한국 특허공개번호 제2011-0027362호에는 “음성 인터페이스를 이용한 ＩＰＴＶ 시스템 및 서비스 방법”에 관한 발명을 개시하고 있는 바, 사용자로부터 입력된 음성을 이용하여, 요청한 컨텐츠를 IPTV로 제공하는 기술에 관한 것이다.

본 발명의 일 실시예는 단말로부터 제공된 음성 정보를 이용하여 컨텐츠를 검색하고, 검색된 컨텐츠를 다른 단말로 제공할 수 있는 컨텐츠 검색 서버 및 방법을 제공한다.

본 발명의 다른 실시예는 복수의 단말로부터 제공된 음성 정보에 대한 음성 인식의 성능을 보다 향상시키는 컨텐츠 검색 서버 및 방법을 제공한다.

상술한 기술적 과제를 달성하기 위한 기술적 수단으로서, 본 발명의 일 실시예는 제 1 단말로부터 음성 정보를 수신하는 음성 정보 수신부, 상기 제 1 단말로부터 상기 제 1 단말의 단말 정보를 수신하고, 상기 수신한 제 1 단말의 단말 정보에 기초하여 단말을 식별하는 단말 식별부, 상기 제 1 단말의 단말 정보에 기초하여 상기 음성 정보를 텍스트 정보로 변환하는 음성 정보 변환부 및 상기 변환된 텍스트 정보에 기초하여 컨텐츠를 검색하여, 상기 검색된 컨텐츠 정보를 제 2 단말로 제공하는 컨텐츠 제공부를 포함하는 컨텐츠 검색 서버를 제공할 수 있다.

또한, 본 발명의 다른 실시예는 제 1 단말로부터 상기 제 1 단말의 단말 정보를 수신하는 단계, 상기 제 1 단말로부터 음성 정보를 수신하는 단계, 상기 수신한 제 1 단말의 단말 정보에 기초하여 상기 음성 정보를 텍스트 정보로 변환하는 단계, 상기 변환된 텍스트 정보에 기초하여 컨텐츠를 검색하는 단계 및 상기 검색된 컨텐츠 정보를 제 2 단말로 제공하는 단계를 포함하는 컨텐츠 검색 방법을 제공할 수 있다.

또한, 본 발명의 또 다른 실시예는 사용자에 의해 선택된 단말의 단말 정보를 컨텐츠 검색 서버로 전송하는 단계, 상기 사용자로부터 음성 정보를 입력 받는 단계 및 상기 입력된 음성 정보를 상기 컨텐츠 검색 서버로 전송하는 단계를 포함하되, 상기 컨텐츠 검색 서버가 상기 음성 정보에 기초하여 컨텐츠를 검색하고, 상기 검색한 컨텐츠 정보를 상기 단말로 전송하는 것인 컨텐츠 검색 방법을 제공할 수 있다.

전술한 본 발명의 과제 해결 수단에 의하면, 음성 정보를 이용하여 컨텐츠를 검색할 뿐만 아니라, 복수의 단말 중 어느 하나의 단말로 검색된 컨텐츠를 제공한다.

또한, 전술한 본 발명의 과제 해결 수단에 의하면, 복수의 단말 각각의 단말 특성을 고려하여 음성 정보를 텍스트 정보로 변환함으로써, 음성 인식의 성능을 보다 향상시킨다.

도 1은 본 발명의 일 실시예에 따른 컨텐츠 검색 서버를 설명하기 위한 전체 개요도이다.
도 2는 본 발명의 일 실시예에 따른 컨텐츠 검색 서버의 구성을 설명하기 위한 세부 구성도이다.
도 3은 본 발명의 다른 실시예에 따른 컨텐츠 검색 서버의 구성을 설명하기 위한 세부 구성도이다.
도 4는 음성 정보를 이용하여 컨텐츠를 검색하는 일례를 도시한 도면이다.
도 5는 본 발명의 일 실시예에 따른 컨텐츠 검색 방법을 나타내는 세부 흐름도이다.

아래에서는 첨부한 도면을 참조하여 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자가 용이하게 실시할 수 있도록 본 발명의 실시예를 상세히 설명한다. 그러나 본 발명은 여러 가지 상이한 형태로 구현될 수 있으며 여기에서 설명하는 실시예에 한정되지 않는다. 그리고 도면에서 본 발명을 명확하게 설명하기 위해서 설명과 관계없는 부분은 생략하였으며, 명세서 전체를 통하여 유사한 부분에 대해서는 유사한 도면 부호를 붙였다.

명세서 전체에서, 어떤 부분이 다른 부분과 "연결"되어 있다고 할 때, 이는 "직접적으로 연결"되어 있는 경우뿐 아니라, 그 중간에 다른 소자를 사이에 두고 "전기적으로 연결"되어 있는 경우도 포함한다. 또한 어떤 부분이 어떤 구성요소를 "포함"한다고 할 때, 이는 특별히 반대되는 기재가 없는 한 다른 구성요소를 제외하는 것이 아니라 다른 구성요소를 더 포함할 수 있는 것을 의미한다.

이하 첨부된 도면을 참고하여 본 발명을 상세히 설명하기로 한다.

도 1은 본 발명의 일 실시예에 따른 컨텐츠 검색 서버를 설명하기 위한 전체 개요도이다.

컨텐츠 검색 서버(100)는 네트워크(200)를 통해 사용자 단말(300)과 연결된다.

네트워크(200)는 근거리 통신망(Local Area Network; LAN), 광역 통신망(Wide Area Network; WAN) 또는 부가가치 통신망(Value Added Network; VAN) 등과 같은 유선 네트워크나 이동 통신망(mobile radio communication network) 또는 위성 통신망 등과 같은 모든 종류의 무선 네트워크로 구현될 수 있다.

사용자 단말(300)은 네트워크(200)를 통해 원격지의 서버에 접속할 수 있는 컴퓨터나 휴대용 단말기로 구현될 수 있다. 여기서, 컴퓨터는 예를 들어, 웹 브라우저(WEB Browser)가 탑재된 노트북, 데스크톱(desktop), 랩톱(laptop) 등을 포함하고, 휴대용 단말기는 예를 들어, 휴대성과 이동성이 보장되는 무선 통신 장치로서, PCS(Personal Communication System), GSM(Global System for Mobile communications), PDC(Personal Digital Cellular), PHS(Personal Handyphone System), PDA(Personal Digital Assistant), IMT(International Mobile Telecommunication)-2000, CDMA(Code Division Multiple Access)-2000, W-CDMA(W-Code Division Multiple Access), Wibro(Wireless Broadband Internet) 단말, 스마트폰(smartphone) 등과 같은 모든 종류의 핸드헬드(Handheld) 기반의 무선 통신 장치를 포함할 수 있다.

또한, 사용자 단말(300)은 TV 단말 또는 TV 단말에 대응하는 리모컨을 포함할 수도 있다. 예를 들어, 제 1 단말이 TV 단말에 대응하는 리모컨이 되고, 제 2 단말이 TV 단말이 될 수 있다. 이때, 리모컨은 마이크 등의 음성 정보를 입력할 수 있는 장치를 포함할 수 있다.

컨텐츠 검색 서버(100)는 사용자 단말(300) 중 하나, 예를 들어 제 1 단말(310)로부터 음성 정보를 수신하면, 제 1 단말(310)의 단말 정보에 기초하여 음성 정보를 텍스트 정보로 변환하고, 변환된 텍스트 정보에 기초하여 컨텐츠를 검색하여, 검색된 컨텐츠를 제 1 단말(310)에 의해 선택된 단말, 예를 들어 제 2 단말(320)로 제공한다.

여기서, 제 2 단말(320)은 음성 정보에 기초하여 검색된 컨텐츠를 출력하는 단말로, 복수의 단말 중 제 1 단말(310)에 의해 선택되는 단말이다. 또한, 제 2 단말(320)은 제 1 단말(310)에 의해 제 1 단말(310)이 선택될 수도 있다.

먼저, 제 1 단말(310)은 사용자에 의해 단말, 예를 들어 제 2 단말(320)을 선택하고, 제 2 단말(320)의 제어 정보를 컨텐츠 검색 서버(100)로 전송한다. 이때, 사용자에 의해 선택된 단말은 사용자가 컨텐츠를 검색하거나 제어하려는 단말로, 제 1 단말(310)에 설치된 어플리케이션을 통해 사용자가 선택할 수 있다.

컨텐츠 검색 서버(100)는 제 1 단말(310)로부터 수신한 제 2 단말(320)의 제어 정보에 기초하여 제 2 단말(320)에 대한 제어 명령을 생성한다.

컨텐츠 검색 서버(100)는 생성된 제어 명령을 제 2 단말(320)로 전송하면, 수신한 제어 명령에 의해 제 2 단말(320)이 제어된다. 이때, 제 2 단말(320)은 제어 명령에 의해 제 2 단말(320)의 볼륨을 작아지도록 제어할 수 있다.

제 1 단말(310)은 사용자로부터 음성을 입력 받아, 음성 정보를 생성한다. 예를 들어, 제 1 단말(310)은 마이크 등의 입력 장치를 이용하여 사용자로부터 음성을 녹음함으로써 음성 정보를 생성할 수 있다.

이때, 제 1 단말(310)에 의해 음성 정보가 생성되는 동안에, 제 2 단말(320)은 제어 명령에 의해 제 2 단말(320)의 볼륨을 제어하여, 음성 정보에 잡음이 노출되지 않도록 할 수 있다.

즉, 사용자가 제 1 단말(310)을 통해 음성을 녹음하는 동안에 제 2 단말(320)의 볼륨이 작아지게 함으로써, 제 2 단말(320)에 의한 잡음이 발생하는 것을 방지할 수 있다.

예를 들어, 사용자가 제 1 단말(310)을 통해 제 2 단말(320)을 선택하고, 음성을 입력하기 위해 음성 입력 버튼을 누르면, 컨텐츠 검색 서버(100)는 제 1 단말(310)로부터 제 2 단말(320)에 대한 제어 정보를 수신하여 제어 명령을 생성하여 제 2 단말(320)로 전송하여, 제 2 단말(320)의 볼륨을 줄인 상태에서, 제 1 단말(310)은 음성을 녹음하여 음성 정보를 생성할 수 있다.

이와 관련하여, 도 4를 참조하여 후술하기로 한다.

제 1 단말(310)은 생성된 음성 정보를 컨텐츠 검색 서버(100)로 전송한다. 이때, 제 1 단말(310)은 제 1 단말(310)의 단말 정보도 함께 전송한다.

컨텐츠 검색 서버(100)는 제 1 단말(310)로부터 수신한 제 1 단말(310)의 단말 정보에 기초하여 단말 타입을 식별하고, 식별된 제 1 단말(310)의 단말 타입에 기초하여 음성 정보를 텍스트 정보로 변환한다.

또한, 컨텐츠 검색 서버(100)는 변환된 텍스트 정보에 기초하여 컨텐츠를 검색하고, 검색된 컨텐츠 정보를 제 2 단말(320)로 제공한다.

제 2 단말(320)은 제공된 컨텐츠 정보에 대응하는 컨텐츠를 출력한다.

따라서, 사용자는 컨텐츠를 출력하려는 단말을 복수의 단말 중 자유롭게 선택할 수 있을 뿐만 아니라, 음성을 이용하여 보기 원하는 컨텐츠를 손쉽게 검색할 수 있으며, 음성 정보를 생성하는 동안에 단말이 제어되어, 잡음의 발생을 줄여 음성 인식의 성능을 향상시킬 수 있다.

도 2는 본 발명의 일 실시예에 따른 컨텐츠 검색 서버의 구성을 설명하기 위한 세부 구성도이다.

도 2를 참조하면, 컨텐츠 검색 서버(100)는 음성 정보 수신부(110), 단말 식별부(120), 음성 정보 변환부(130) 및 컨텐츠 제공부(140)를 포함한다.

음성 정보 수신부(110)는 제 1 단말(도시 생략)로부터 음성 정보를 수신한다. 여기서, 음성 정보는 제 1 단말에서 사용자로부터 음성을 녹음함에 따라 생성될 수 있다.

단말 식별부(120)는 제 1 단말로부터 제 1 단말의 단말 정보를 수신하고, 수신한 제 1 단말의 단말 정보에 기초하여 제 1 단말의 단말 타입을 식별한다. 여기서, 제 1 단말의 단말 타입은 제 1 단말이 속한 통신 네트워크 정보, 제 1 단말의 플랫폼 정보, 제 1 단말에 설치된 소프트웨어 정보, 제 1 단말의 하드웨어 정보, 제 1 단말의 제조사 정보 및 제 1 단말의 모델 정보 중 적어도 하나 이상을 포함할 수 있다.

또한, 단말 식별부(120)는 제 1 단말을 포함한 복수의 단말에 대해 각 단말 타입을 구분하여 미리 저장하고 있으며, 제 1 단말의 단말 정보에 대응하는 제 1 단말의 단말 타입을 식별할 수 있다.

음성 정보 변환부(130)는 제 1 단말의 단말 정보에 기초하여 음성 정보를 텍스트 정보로 변환한다. 음성 정보 변환부(130)는 단말 식별부(120)에 의해 식별된 제 1 단말의 단말 타입에 기초하여 음성 정보를 텍스트 정보로 변환할 수 있다.

한편, 음성 정보 변환부(130)는 식별된 제 1 단말의 단말 타입에 기초하여 음성 정보를 텍스트 정보로 변환하는 음성 인식부(도시 생략)를 더 포함할 수 있으며, 이와 관련해서 도 3을 참조하여 후술하기로 한다.

컨텐츠 제공부(140)는 변환된 텍스트 정보에 기초하여 컨텐츠를 검색하여, 검색된 컨텐츠 정보를 제 2 단말로 제공한다. 이때, 컨텐츠 제공부(140)는 텍스트 정보에 대응하는 컨텐츠를 검색하기 위한 검색엔진을 포함할 수 있다. 또한, 컨텐츠 제공부(140)는 컨텐츠를 검색하는 별도의 검색 서버로 컨텐츠 검색을 요청하여 검색된 컨텐츠 정보를 제공 받을 수도 있다.

제 2 단말은 제공된 컨텐츠 정보에 의해 컨텐츠를 재생할 수 있다.

도 3은 본 발명의 다른 실시예에 따른 컨텐츠 검색 서버의 구성을 설명하기 위한 세부 구성도이다.

도 3을 참조하면, 컨텐츠 검색 서버(100)는 음성 정보 수신부(110), 제어 명령 생성부(115), 단말 식별부(120), 음성 정보 변환부(130), 음성 인식부(135) 및 컨텐츠 제공부(140)를 포함한다.

제어 명령 생성부(115)는 제 2 단말(도시 생략)에 대한 제어 명령을 생성한다. 여기서 제 2 단말은 제 1 단말에 의해 선택된 단말로, 제 1 단말로부터 수신한 음성 정보를 이용하여 검색되는 컨텐츠 정보를 제공 받는다.

즉, 제어 명령 생성부(115)는 제 1 단말로부터 제 2 단말에 대한 제어 정보를 수신하여, 수신한 제어 정보에 기초하여 제어 명령을 생성하며, 생성한 제어 명령을 제 2 단말로 전송한다. 이때, 제 2 단말에 전송된 제어 명령에 의해 제 2 단말의 볼륨이 제어된다.

예를 들어, 제 1 단말이 음성 정보를 생성하기 전에 제 2 단말에 대한 제어 정보를 제어 명령 생성부(115)로 전송하면, 제어 명령 생성부(115)가 수신한 제어 정보에 기초하여 제어 명령을 생성하고, 생성한 제어 명령을 제 2 단말로 전송한다. 제 2 단말은 수신한 제어 명령에 따라 제 2 단말의 볼륨을 제어하게 된다. 따라서, 제어 명령 생성부(115)는 제 1 단말에서 음성 정보가 생성되는 동안 제 2 단말의 볼륨이 작아지도록 제어될 수 있도록 하여, 음성 정보에 잡음이 포함되지 않도록 방지할 수 있도록 한다.

음성 정보 변환부(130)는 제 1 단말의 단말 정보에 기초하여 음성 정보를 텍스트 정보로 변환한다.

또한, 음성 정보 변환부(130)는 식별된 제 1 단말의 단말 타입에 기초하여 음성 정보를 텍스트 정보로 변환하는 음성 인식부(135)를 포함한다.

구체적으로, 음성 정보 변환부(130)는 제 1 단말의 단말 타입을 포함하는 복수의 단말 타입 각각에 대응하는 복수의 음성 인식부(135)를 포함한다. 이것은, 단말의 종류에 따라 단말 타입이 구분될 뿐만 아니라, 단말의 제조사, 모델, 하드웨어 등에 의해 구분된 단말의 타입에 따라 음성의 특성이 달라져 음성 정보가 달라질 수 있기 때문에 각 단말 타입에 해당하는 음성 인식부(135)에서 음성을 인식하여 음성 인식하는 성능을 향상시켜, 컨텐츠 검색 서버(100)가 음성 정보를 통해 컨텐츠를 검색하기 원활하게 하기 위함이다.

따라서, 음성 정보 변환부(130)는 복수의 음성 인식부(135) 중 제 1 단말의 단말 타입에 대응하는 어느 하나에 의해 음성 정보를 인식하고, 인식된 음성 정보를 텍스트 정보로 변환할 수 있다.

컨텐츠 제공부(140)는 변환된 텍스트 정보에 기초하여 컨텐츠를 검색하여, 검색된 컨텐츠 정보를 제 2 단말로 제공한다.

따라서, 사용자는 단말에 음성 정보를 생성하여 컨텐츠를 검색할 뿐만 아니라, 다른 단말로 컨텐츠를 제공할 수 있다.

한편, 컨텐츠 검색 서버(100)는 단말에서 음성 정보가 생성되는 동안에 다른 단말을 제어시켜 잡음을 최소화시킬 수 있다. 또한, 컨텐츠 검색 서버(100)는 단말 타입에 따른 음성 정보의 특성에 대응하여 음성을 인식하는 성능을 향상시켜 음성 정보를 이용한 컨텐츠 검색을 원활하게 할 수 있다.

도 4는 음성 정보를 이용하여 컨텐츠를 검색하는 일례를 도시한 도면이다.

예를 들어, 도 4a에 도시된 바와 같이 제 1 단말이 스마트폰인 경우, 사용자는 스마트폰에 컨텐츠를 검색하는 서비스를 이용하기 위한 어플리케이션을 설치할 수 있다. 사용자는 컨텐츠를 제공 받으려는 제 2 단말, 예를 들어 IPTV 등을 선택한다.

도 4b에 도시된 바와 같이, 사용자는 검색 아이콘을 클릭함으로써, 컨텐츠를 검색할 수 있으며, 도 4c에 도시된 바와 같이 사용자는 검색창에서 마이크 아이콘을 클릭하여, 음성 정보를 입력할 수 있게 된다. 이때, 사용자가 검색 아이콘을 클릭함에 따라 제 2 단말에 대한 제어 정보가 컨텐츠 검색 서버로 전송될 수 있으며, 이로써, 컨텐츠 검색 서버는 제어 정보에 기초하여 생성한 제어 명령을 제 2 단말로 전송하고, 제 2 단말의 볼륨이 제어될 수 있다.

도 4d에 도시된 바와 같이 마이크 등의 입력 장치를 통해, 사용자는 제 1 단말에서 음성을 녹음하여 음성 정보가 생성되어, 컨텐츠 검색 서버로 전송된다. 컨텐츠 검색 서버는 수신한 음성 정보를 제 1 단말의 단말 타입에 기초하여 텍스트 정보로 변환하고, 변환된 텍스트 정보에 대응하는 컨텐츠를 검색한다.

도 4e에 도시된 바와 같이, 컨텐츠 검색 서버는 검색된 컨텐츠 정보를 제 1 단말에 검색 결과를 리스트 형태로 출력되도록 할 수 있다. 이때, 검색된 컨텐츠 정보가 제 2 단말로 바로 출력될 수도 있다.

사용자는 제 1 단말에 출력된 검색 리스트 중 원하는 컨텐츠를 선택하여, 도 4f에 도시된 바와 같이, 시청 버튼을 누르면 선택한 제 2 단말에 컨텐츠가 출력된다.

도 5는 본 발명의 일 실시예에 따른 컨텐츠 검색 방법을 나타내는 세부 흐름도이다.

도 5를 참조하면, 제 1 단말(310)은 사용자에 의해 제 2 단말(320)을 선택한다(S105). 여기서, 제 2 단말(320)은 음성 정보에 기초하여 검색된 컨텐츠를 출력하는 단말로, 복수의 단말 중 제 1 단말(310)에 의해 선택되는 단말이다.

제 1 단말(310)은 제 2 단말(320)의 제어 정보를 컨텐츠 검색 서버(100)로 전송한다(S110).

컨텐츠 검색 서버(100)는 제 1 단말(310)로부터 수신한 제 2 단말(320)의 제어 정보에 기초하여 제 2 단말(320)에 대한 제어 명령을 생성하고(S115), 생성된 제어 명령을 제 2 단말(320)로 전송한다(S120).

제 2 단말(320)은 수신한 제어 명령에 기초하여 제 2 단말(320)의 볼륨을 작아지도록 제어한다(S125). 제 2 단말(320)의 볼륨이 줄어들면, 제 1 단말(310)에서 음성 정보가 생성될 때 잡음이 줄어드는 이점이 있다.

제 1 단말(310)은 사용자로부터 음성을 입력 받는다(S130). 이때 제 1 단말(310)은 마이크 등의 입력 장치를 이용하여 사용자의 음성을 입력 받을 수 있다.

제 1 단말(310)은 입력 받은 음성에 기초하여 음성 정보로 생성하고(S135), 컨텐츠 검색 서버(100)로 전송한다(S140). 이때, 제 1 단말(310)은 제 1 단말(310)의 단말 정보도 함께 전송한다.

컨텐츠 검색 서버(100)는 제 1 단말(310)로부터 수신한 제 1 단말(310)의 단말 정보에 기초하여 단말 타입을 식별한다(S145).

컨텐츠 검색 서버(100)는 식별된 제 1 단말(310)의 단말 타입에 기초하여 음성 정보를 텍스트 정보로 변환한다(S150). 여기서, 제 1 단말의 단말 타입은 제 1 단말이 속한 통신 네트워크 정보, 제 1 단말의 플랫폼 정보, 제 1 단말에 설치된 소프트웨어 정보, 제 1 단말의 하드웨어 정보, 제 1 단말의 제조사 정보 및 제 1 단말의 모델 정보 중 적어도 하나 이상을 포함할 수 있다.

컨텐츠 검색 서버(100)는 변환된 텍스트 정보에 기초하여 컨텐츠를 검색하고(S155), 검색된 컨텐츠 정보를 제 2 단말(320)로 제공한다(S160).

이때, 컨텐츠 검색 서버(100)는 텍스트 정보에 대응하는 컨텐츠를 검색하기 위한 검색엔진을 포함할 수 있다. 또한, 컨텐츠 검색 서버(100)는 컨텐츠를 검색하는 별도의 검색 서버로 컨텐츠 검색을 요청하여 검색된 컨텐츠 정보를 제공 받을 수도 있다.

본 발명의 일 실시예는 컴퓨터에 의해 실행되는 프로그램 모듈과 같은 컴퓨터에 의해 실행가능한 명령어를 포함하는 기록 매체의 형태로도 구현될 수 있다. 컴퓨터 판독 가능 매체는 컴퓨터에 의해 액세스될 수 있는 임의의 가용 매체일 수 있고, 휘발성 및 비휘발성 매체, 분리형 및 비분리형 매체를 모두 포함한다. 또한, 컴퓨터 판독가능 매체는 컴퓨터 저장 매체 및 통신 매체를 모두 포함할 수 있다. 컴퓨터 저장 매체는 컴퓨터 판독가능 명령어, 데이터 구조, 프로그램 모듈 또는 기타 데이터와 같은 정보의 저장을 위한 임의의 방법 또는 기술로 구현된 휘발성 및 비휘발성, 분리형 및 비분리형 매체를 모두 포함한다. 통신 매체는 전형적으로 컴퓨터 판독가능 명령어, 데이터 구조, 프로그램 모듈, 또는 반송파와 같은 변조된 데이터 신호의 기타 데이터, 또는 기타 전송 메커니즘을 포함하며, 임의의 정보 전달 매체를 포함한다.

전술한 본 발명의 설명은 예시를 위한 것이며, 본 발명이 속하는 기술분야의 통상의 지식을 가진 자는 본 발명의 기술적 사상이나 필수적인 특징을 변경하지 않고서 다른 구체적인 형태로 쉽게 변형이 가능하다는 것을 이해할 수 있을 것이다. 그러므로 이상에서 기술한 실시예들은 모든 면에서 예시적인 것이며 한정적이 아닌 것으로 이해해야만 한다. 예를 들어, 단일형으로 설명되어 있는 각 구성 요소는 분산되어 실시될 수도 있으며, 마찬가지로 분산된 것으로 설명되어 있는 구성 요소들도 결합된 형태로 실시될 수 있다.

본 발명의 범위는 상기 상세한 설명보다는 후술하는 특허청구범위에 의하여 나타내어지며, 특허청구범위의 의미 및 범위 그리고 그 균등 개념으로부터 도출되는 모든 변경 또는 변형된 형태가 본 발명의 범위에 포함되는 것으로 해석되어야 한다.

100: 컨텐츠 검색 서버 110: 음성 정보 수신부
115: 제어 명령 생성부 120: 단말 식별부
130: 음성 정보 변환부 135: 음성 인식부
140: 컨텐츠 제공부 200: 네트워크
300: 사용자 단말 310: 제 1 단말
320: 제 2 단말

Claims

음성 정보를 이용하여 컨텐츠를 검색하는 컨텐츠 검색 서버에 있어서,
제 1 단말로부터 음성 정보를 수신하는 음성 정보 수신부;
상기 제 1 단말로부터 상기 제 1 단말의 단말 정보를 수신하고, 상기 수신한 제 1 단말의 단말 정보에 기초하여 단말을 식별하는 단말 식별부;
상기 제 1 단말의 단말 정보에 기초하여 상기 음성 정보를 텍스트 정보로 변환하는 음성 정보 변환부;
상기 변환된 텍스트 정보에 기초하여 컨텐츠를 검색하여, 상기 검색된 컨텐츠 정보를 제 2 단말로 제공하는 컨텐츠 제공부; 및
상기 제 2 단말에 대한 제어 명령을 생성하는 제어 명령 생성부
를 포함하는 컨텐츠 검색 서버.
제 1 항에 있어서,
상기 단말 식별부는 상기 수신한 제 1 단말의 단말 정보에 기초하여 상기 제 1 단말의 단말 타입을 식별하고,
상기 음성 정보 변환부는 상기 식별된 제 1 단말의 단말 타입에 기초하여 상기 음성 정보를 상기 텍스트 정보로 변환하는 음성 인식부를 포함하는 컨텐츠 검색 서버.
제 2 항에 있어서,
상기 음성 정보 변환부는 상기 제 1 단말의 단말 타입을 포함하는 복수의 단말 타입 각각에 대응하는 복수의 음성 인식부를 포함하는 컨텐츠 검색 서버.
제 2 항 또는 제 3 항에 있어서,
상기 제 1 단말의 단말 타입은 상기 제 1 단말이 속한 통신 네트워크 정보, 상기 제 1 단말의 플랫폼 정보, 상기 제 1 단말에 설치된 소프트웨어 정보, 상기 제 1 단말의 하드웨어 정보, 상기 제 1 단말의 제조사 정보 및 상기 제 1 단말의 모델 정보 중 적어도 하나 이상을 포함하는 것인, 컨텐츠 검색 서버.
삭제
제 1항에 있어서,
상기 제어 명령 생성부는 상기 제 1 단말로부터 상기 제 2 단말에 대한 제어 정보를 수신하여, 상기 수신한 제어 정보에 기초하여 상기 제어 명령을 생성하여 상기 제 2 단말로 전송하는 것인 컨텐츠 검색 서버.
제 6 항에 있어서,
상기 제어 명령에 의해 상기 제 2 단말의 볼륨이 제어되는 것인 컨텐츠 검색 서버.
제 7 항에 있어서,
상기 음성 정보가 생성되는 동안에 상기 제 2 단말의 볼륨이 작아지도록 제어되는 것인 컨텐츠 검색 서버.
제 1 항에 있어서,
상기 음성 정보는 상기 제 1 단말에서 사용자로부터 음성을 녹음함에 따라 생성되는 것인 컨텐츠 검색 서버.
음성 정보를 이용하여 컨텐츠를 검색하는 컨텐츠 검색 방법에 있어서,
제 1 단말로부터 상기 제 1 단말의 단말 정보를 수신하는 단계;
상기 제 1 단말로부터 음성 정보를 수신하는 단계;
상기 수신한 제 1 단말의 단말 정보에 기초하여 상기 음성 정보를 텍스트 정보로 변환하는 단계;
상기 변환된 텍스트 정보에 기초하여 컨텐츠를 검색하는 단계;
상기 검색된 컨텐츠 정보를 제 2 단말로 제공하는 단계; 및
상기 제 1 단말로부터 상기 제 2 단말에 대한 제어 정보를 수신하는 단계
를 포함하고,
상기 수신한 제어 정보에 기초하여 상기 제 2 단말에 대한 제어 명령을 생성하고, 상기 생성한 제어 명령을 상기 제 2 단말로 전송하는 것인 컨텐츠 검색 방법.
제 10 항에 있어서,
상기 변환하는 단계에서,
상기 제 1 단말의 단말 정보에 기초하여 상기 제 1 단말의 단말 타입을 식별하고, 상기 식별된 제 1 단말의 단말 타입에 기초하여 상기 음성 정보를 상기 텍스트 정보로 변환하는 것인 컨텐츠 검색 방법.
제 11 항에 있어서,
상기 제 1 단말의 단말 타입은 상기 제 1 단말이 속한 통신 네트워크 정보, 상기 제 1 단말의 플랫폼 정보, 상기 제 1 단말에 설치된 소프트웨어 정보, 상기 제 1 단말의 하드웨어 정보, 상기 제 1 단말의 제조사 정보 및 상기 제 1 단말의 모델 정보 중 적어도 하나 이상을 포함하는 것인 컨텐츠 검색 방법.
삭제
제 10 항에 있어서,
상기 제어 명령에 의해 상기 제 2 단말의 볼륨이 제어되는 것인 컨텐츠 검색 방법.
음성 정보를 이용하여 컨텐츠를 검색하는 컨텐츠 검색 방법에 있어서,
사용자에 의해 선택된 단말의 단말 정보를 컨텐츠 검색 서버로 전송하는 단계;
상기 사용자로부터 음성 정보를 입력 받는 단계; 및
상기 입력된 음성 정보를 상기 컨텐츠 검색 서버로 전송하는 단계
를 포함하되,
상기 컨텐츠 검색 서버가 상기 음성 정보에 기초하여 컨텐츠를 검색하고, 상기 검색한 컨텐츠 정보를 상기 단말로 전송하고,
상기 음성 정보를 입력 받는 단계에서, 상기 단말의 제어 정보를 상기 컨텐츠 검색 서버로 전송하면, 상기 컨텐츠 검색 서버가 상기 단말의 제어 정보에 기초하여 생성된 제어 명령을 상기 단말로 전송하여, 상기 단말이 제어되는 것인 컨텐츠 검색 방법.
삭제
제 15 항에 있어서,
상기 음성 정보를 입력 받는 동안에 상기 제어 명령에 의해 상기 단말의 볼륨이 제어되는 것인 컨텐츠 검색 방법.