WO2016175443A1

WO2016175443A1 - 음성 인식을 이용한 정보 검색 방법 및 장치

Info

Publication number: WO2016175443A1
Application number: PCT/KR2016/002168
Authority: WO
Inventors: 박은민; 정상우; 김기영
Original assignee: 주식회사 아마다스
Priority date: 2015-04-30
Filing date: 2016-03-04
Publication date: 2016-11-03
Also published as: KR101595090B1; US20180137859A1; US10403277B2

Abstract

본 발명은 정보 검색 방법 및 장치에 관한 것으로서, 상세하게는 마이크를 통해 입력되는 음성 데이터가 사용자 정의 데이터베이스에 존재하고 반복적으로 입력되는 경우 그 음성 데이터에 대응하는 정보를 검색하여 사용자에게 제공하는 음성 인식을 이용한 정보 검색 방법 및 장치에 관한 것이다. 이를 위하여, 본 발명에 따른 음성 인식을 이용한 정보 검색 방법은 마이크를 통해 음성 데이터가 입력되면 입력된 음성 데이터를 사용자 정의 음성 데이터베이스에 저장된 음성 데이터와 비교하는 단계와, 상기 비교 결과 일치하는 음성 데이터가 존재하면 음성 데이터의 반복 입력이 설정되어 있는지 판단하는 단계와, 상기 판단 결과 음성 데이터의 반복 입력이 설정되어 있으면 내부 메모리에 상기 입력된 음성 데이터와 일치하는 음성 데이터가 존재하는지 확인하는 단계와, 상기 확인 결과 일치하는 음성 데이터가 존재하면 이벤트를 출력하고 음성 데이터에 대응하는 정보를 검색 서버에 요청하는 단계를 포함한다.

Description

음성 인식을 이용한 정보 검색 방법 및 장치

본 발명은 정보 검색 방법 및 장치에 관한 것으로서, 상세하게는 마이크를 통해 입력되는 음성 데이터가 사용자 정의 데이터베이스에 존재하고 반복적으로 입력되는 경우 그 음성 데이터에 대응하는 정보를 검색하여 사용자에게 제공하는 음성 인식을 이용한 정보 검색 방법 및 장치에 관한 것이다.

스마트폰은 휴대의 편이성과 함께 작은 크기에 집약된 데이터 통신, 일정관리, 인터넷 검색, 위치기반 서비스 등 다양한 기능으로 매우 대중적인 스마트 기기가 되었다. 그런데 스마트폰을 대상으로 하는 데이터의 입력, 정보검색, 각종 기능조작 등은 작은 크기의 단말기 화면으로 인해 사용이 다소 불편한 점이 있다.

특히 사용자가 데이터 검색을 위해 텍스트 데이터를 입력하거나 각종 프로그램 등을 조작하고자 할 때 그 불편함이 가중된다. 이러한 사용자 인터페이스를 개선하기 위한 방법으로 음성 인식을 적용한 방법이 연구되고 있다. 이 방법은 사용자의 음성을 인식하여 기기상의 프로그램을 실행 또는 제어하거나 데이터의 입력을 가능하게 한다.

또한, 최근에는 스마트폰에서 사용자의 음성을 인식하여 그 음성에 대응하는 각종 정보를 검색하여 제공하는 서비스가 실현되고 있다.

즉, 종래 음성인식 기반의 서비스는 사용자가 의식적으로 의도하여 발성한 음성을 입력받아 그 음성이 인식되면 즉각적으로 그에 대응하는 정보를 제공하는 것을 상정하고 있다.

그러나 이러한 방식에서는 사용자 음성이 인식되는 대로 계속해서 정보를 검색하여 제공하기 때문에, 사용자가 의도하지 않고 무심코 내뱉은 말도 인식이 되는 한 해당 정보가 출력되어 음성인식 모듈이 활성화된 상태에서는 음성인식에 따른 무차별 검색에 따라 그 제공되는 정보가 오히려 사용자에게 소음이나 공해가 될 수 있는 문제점이 있다.

본 발명은 상기와 같은 문제점을 해결하기 위해 창안된 것으로서, 본 발명의 목적은 사용자 음성이 인식되는 대로 정보 검색이 모두 수행되어 오히려 원치 않은 정보를 받게 되는 상황을 방지할 수 있는 음성 인식을 이용한 정보 검색 및 장치를 제공하는 것이다.

본 발명의 다른 목적은 사용자가 의식적이든 무의식적이든 사용자의 음성을 통해 사용자가 관심 있어 하는 내용에 근접한 정보 검색을 수행할 수 있는 음성 인식을 이용한 정보 검색 및 장치를 제공하는 것이다.

이를 위하여, 본 발명에 따른 음성 인식을 이용한 정보 검색 방법은 마이크를 통해 음성 데이터가 입력되면 입력된 음성 데이터를 사용자 정의 음성 데이터베이스에 저장된 음성 데이터와 비교하는 단계와, 상기 비교 결과 일치하는 음성 데이터가 존재하면 음성 데이터의 반복 입력이 설정되어 있는지 판단하는 단계와, 상기 판단 결과 음성 데이터의 반복 입력이 설정되어 있으면 내부 메모리에 상기 입력된 음성 데이터와 일치하는 음성 데이터가 존재하는지 확인하는 단계와, 상기 확인 결과 일치하는 음성 데이터가 존재하면 이벤트를 출력하고 음성 데이터에 대응하는 정보를 검색 서버에 요청하는 단계를 포함한다.

또한, 본 발명에 따른 음성 인식을 이용한 정보 검색 장치는 정보 검색의 대상이 되는 음성 데이터를 저장하는 사용자 정의 음성 데이터베이스와, 마이크를 통해 입력된 음성 데이터를 상기 사용자 정의 음성 데이터베이스에 저장된 음성 데이터와 비교하는 음성 비교부와, 상기 마이크를 통해 입력된 음성 데이터를 임시 저장하는 메모리와, 검색 서버와 데이터를 송수신하는 통신부와, 상기 음성 비교부에 의한 비교 결과 일치하는 음성 데이터가 존재하고 음성 데이터의 반복 입력이 설정되어 있으면, 상기 메모리에 상기 마이크를 통해 입력된 음성 데이터와 일치하는 음성 데이터가 존재하는지 확인하여 일치하는 음성 데이터가 존재하면 이벤트를 출력하고, 해당 음성 데이터에 대응하는 정보를 검색 서버에 요청하는 신호를 생성하는 제어부를 포함한다.

상술한 바와 같이, 본 발명에 따르면 마이크를 통해 입력되는 음성 데이터가 사용자 정의 데이터베이스에 존재하고 또한 반복적으로 입력되는 경우에 한하여 그 음성 데이터에 대응하는 정보를 검색하기 때문에 사용자가 무심코 내뱉은 말이나 의도하지 않은 말에 대하여 자동으로 정보가 검색되는 현상을 방지할 수 있다.

이에 따라 사용자는 의도적으로 검색하고자 하는 단어를 반복하든지 또는 의도하지 않더라도 관심 있어 하는 내용에 대해서는 무의식적으로 그 내용에 해당하는 단어를 반복할 개연성이 높기 때문에 불필요한 정보의 검색을 방지하고 사용자에게 최적의 정보를 신속하게 제공할 수 있는 효과가 있다.

도 1은 본 발명에 따른 정보 검색 시스템의 개략적 구성도.

도 2는 본 발명에 따른 음성 인식을 이용한 정보 검색 장치의 내부 구성도.

도 3은 본 발명에 따른 음성 인식을 이용한 정보 검색 방법의 순서도.

이하, 첨부된 도면을 참조하여 본 발명에 따른 실시 예를 상세하게 설명한다. 본 발명의 구성 및 그에 따른 작용 효과는 이하의 상세한 설명을 통해 명확하게 이해될 것이다.

본 발명의 상세한 설명에 앞서, 동일한 구성요소에 대해서는 다른 도면상에 표시되더라도 가능한 동일한 부호로 표시하며, 공지된 구성에 대해서는 본 발명의 요지를 흐릴 수 있다고 판단되는 경우 구체적인 설명은 생략하기로 함에 유의한다.

도 1은 본 발명에 따른 음성 인식을 이용한 정보 검색 시스템의 개략적 구성을 나타낸 것이다.

도 1을 참조하면, 정보 검색 시스템은 사용자가 소지한 정보 검색 단말(100) 및 서비스업자가 보유한 검색 서버(200)로 구성되며, 정보 검색 단말(100)과 검색 서버(200)는 통신망을 통해 상호 접속되어 있다.

정보 검색 단말(100)은 음성인식 모듈을 구비하여 사용자의 음성을 인식하고 그 인식한 음성에 대응하는 각종 정보를 검색 서버(200)로부터 제공받아 사용자에게 출력하는 장치이다.

정보 검색 단말(100)은 스마트폰, 태블릿 PC, 노트북, 퍼스널 컴퓨터 등의 장치가 될 수 있으나, 이에 한정하는 것은 아니며 정보 검색을 위한 전용 장치이거나 또는 별도의 장치가 아닌 정보 검색 기능이 IoT 기반의 도어락, 자동차, 홈 네트워크 시스템 등에 내장되어 구현될 수 있다.

검색 서버(200)는 정보 검색 단말(100)로부터 음성 인식 기반의 정보 검색 요청을 받아 인식된 음성에 대응하는 정보를 검색 엔진을 통해 검색하여 검색된 정보를 정보 검색 단말(100)에 제공한다.

도 2는 본 발명에 따른 음성 인식을 이용한 정보 검색 장치의 내부 구성을 나타낸 것이다.

도 2를 참조하면, 음성 인식을 이용한 정보 검색 장치는 마이크(11), 음성 처리부(13), 표시부(15), 스피커(17), 사용자 정의 음성 DB(19), 메모리(21), 통신부(23), 음성 비교부(25), 제어부(27) 등을 포함한다.

마이크(11)는 사용자의 음성을 전기 신호로 변환하고, 음성 처리부(13)는 마이크(11)로부터 입력된 전기 신호를 처리하여 디지털 신호로 변환한다. 음성 처리부(13)에서 처리된 디지털 신호인 음성 데이터는 제어부(27)로 입력된다.

표시부(15)는 정보 검색 장치의 상태를 시각적으로 출력하는 부분으로, 특히 인식된 음성에 대응하는 각종 정보를 사용자에게 표시한다. 표시부(15)는 터치스크린으로 구현될 수 있으며, 이 경우 표시부(15)는 디스플레이 기능 외에 입력 인터페이스의 역할도 동시에 수행한다.

본 발명의 실시예에 따르면 사용자는 표시부(15)의 입력 인터페이스를 통해 반복 입력을 설정할 수 있다. 여기서, 반복 입력 설정이란 마이크(11)를 통해 입력되는 음성 데이터가 2번 이상 중복되는 경우에 한하여 정보 검색을 실행하도록 하기 위한 검색 설정 옵션을 말한다. 사용자는 입력 인터페이스를 통해 반복 입력을 설정하고 그 반복 횟수를 임의로 입력할 수 있다.

스피커(17)는 정보 검색 장치의 상태를 청각적으로 출력하는 부분으로, 특히 인식된 음성에 대응하는 정보를 검색하거나 검색한 정보를 제공할 때 이를 사용자에게 알리기 위해 기계음, 음향(예를 들어, '빙고'라는 소리) 등의 청각적 이벤트를 출력한다.

사용자 정의 음성 데이터베이스(DB)(19)는 사용자가 미리 정의해 놓은 검색 대상의 음성 데이터를 저장하고 있는 공간이다. 사용자 정의 음성 데이터베이스(19)는 정보 검색 장치 내에 존재할 수 있으나 검색 서버(200)나 인터넷상의 다른 공간에 존재할 수 있다. 사용자 정의 음성 데이터베이스(19)는 정보 검색 장치 내부에 존재하든 외부 서버에 존재하든 주기적으로 갱신된다.

메모리(21)는 각종 프로그램 및 데이터를 저장하는 부분으로, 롬(ROM), 램(RAM), 플래시 메모리 등을 포함하며, 메모리(21) 중에서 플래시 메모리는 마이크(11)를 통해 입력된 음성 데이터를 임시 저장하거나 사용자의 설정 정보(예를 들어, 상기 반복 입력 설정)를 저장한다.

통신부(23)는 검색 서버(200)와 데이터를 송수신하는 부분이다. 통신부(23)는 음성 데이터에 대응하는 정보 검색 요청 신호를 검색 서버(200)로 전송하고, 검색 서버(200)로부터 각종 정보를 수신한다. 통신부(23)는 데이터 통신을 위해 LTE, LTE-A 등의 이동통신모듈, Wi-Fi 등의 무선 인터넷 통신모듈, 이더넷 등의 유선 인터넷 통신모듈 등으로 구성될 수 있다.

음성 비교부(25)는 마이크(11)를 통해 입력된 음성 데이터와 사용자 정의 음성 데이터베이스(19)에 저장된 음성 데이터를 비교하는 부분이다. 즉, 음성 비교부(25)는 사용자 정의 데이터베이스(19)에 마이크(11)를 통해 입력된 음성 데이터와 동일한 음성 데이터가 존재하는지 확인한다.

제어부(27)는 음성 비교부(25)에 의한 비교 결과 일치하는 음성 데이터가 존재하는 것으로 확인되면 음성 데이터의 반복 입력이 설정되어 있는지 확인한다.

음성 데이터의 반복 입력이 설정되어 있으면, 제어부(27)는 메모리(21)에 마이크(11)를 통해 입력된 음성 데이터와 일치하는 음성 데이터가 존재하는지 확인한다.

메모리(21)에 일치하는 음성 데이터가 존재하면 제어부(27)는 사용자에게 정보 검색 또는 제공을 알리기 위한 이벤트를 출력하고, 해당 음성 데이터에 대응하는 정보를 검색 서버(200)에 요청하기 위한 정보 검색 요청 신호를 생성한다. 만약 음성 데이터의 반복 입력이 설정되어 있지 않으면, 제어부(27)는 곧바로 이벤트를 출력하고 정보 검색 요청 신호를 생성한다.

제어부(27)는 통신부(23)를 통해 정보 검색 요청 신호를 전송한 후, 메모리(21)에 저장된 해당 음성 데이터를 삭제한다.

한편 메모리(21)에 일치하는 음성 데이터가 존재하지 않으면 제어부(27)는 메모리(21)에 마이크(11)를 통해 입력된 음성 데이터를 저장하고, 다시 음성 데이터의 입력을 대기한다.

그리고 마이크(11)를 통해 메모리(21)에 저장된 음성 데이터와 일치하는 음성 데이터가 입력되면 상술한 바와 같이 정보 검색 요청 후에 음성 데이터를 삭제하고, 일치하는 음성 데이터가 입력되지 않으면 음성 데이터가 저장된 시점부터 일정 시간 경과 후에 메모리(21)에서 음성 데이터를 삭제한다.

이와 같이 구성된 본 발명에 따른 정보 검색 장치에서 음성 인식을 이용하여 정보 검색을 처리하는 과정을 도 3을 참조하여 구체적으로 설명한다.

도 3은 본 발명에 따른 음성 인식을 이용한 정보 검색 방법의 순서도를 나타낸 것이다.

먼저, 정보 검색 장치(100)에 구비된 마이크(11)를 통해 사용자의 음성 데이터가 입력되면(S10), 정보 검색 장치(100)는 내부에 구비되거나 또는 외부 서버에 존재하는 사용자 정의 음성 데이터베이스(19)에 접근하여 마이크(11)를 통해 입력된 음성 데이터와 사용자 정의 음성 데이터베이스(19)에 저장된 음성 데이터를 비교함으로써, 마이크(11)를 통해 입력된 음성 데이터가 사용자 정의 음성 데이터베이스(19)에 존재하는지 판단한다(S12).

사용자 정의 음성 데이터베이스(19)에 마이크(11)를 통해 입력된 음성 데이터와 일치하는 음성 데이터가 존재하면, 음성 데이터의 반복 입력이 설정되어 있는지 판단한다(S14). 만약 사용자 정의 음성 데이터베이스(19)에 마이크(11)를 통해 입력된 음성 데이터와 일치하는 음성 데이터가 존재하지 않으면, 아무런 동작도 발생하지 않으며 다시 음성 데이터의 입력을 대기한다.

상기 단계(S14)의 판단 결과, 음성 데이터의 반복 입력이 설정되어 있으면, 내부 메모리(21)에 마이크(11)를 통해 입력된 음성 데이터와 일치하는 음성 데이터가 존재하는지 확인한다(S16). 만약 음성 데이터의 반복 입력이 설정되어 있지 않으면 바로 이벤트를 출력하고 그 음성 데이터에 대응하는 정보 검색을 요청한다(S20).

본 발명의 실시예에 따른 이벤트는 정보 검색 및 제공이 가능함을 나타내는 것으로 '빙고' 등 특정 음이 출력되는 청각적 이벤트일 수 있으나, LED 램프가 깜박이는 것과 같은 시각적 이벤트도 가능하며 두 요소가 동시에 출력될 수 있다.

상기 단계(S16)의 확인 결과, 메모리(21)에 마이크(11)를 통해 입력된 음성 데이터와 일치하는 음성 데이터가 존재하지 않으면, 메모리(21)에 마이크(11)를 통해 입력된 음성 데이터를 저장하고(S18) 다시 음성 데이터의 입력을 대기한다.

만약 메모리(21)에 마이크(11)를 통해 입력된 음성 데이터와 일치하는 음성 데이터가 존재하면 이벤트를 출력하고 그 음성 데이터에 대응하는 정보 검색을 요청한다(S20).

음성 데이터에 대응하는 정보 검색을 요청한 후 메모리(21)에 저장된 해당 음성 데이터를 삭제한다(S22). 메모리(21)에 저장된 음성 데이터가 삭제되는 시점은 해당 음성 데이터에 대응하는 정보에 대한 검색 요청 이후이거나 음성 데이터가 메모리(21)에 저장된 다음 일정 시간이 지난 후이다.

이와 같이 사용자 정의 음성 데이터베이스(19)에 검색 대상이 되는 음성 데이터가 존재하되 그 음성 데이터의 반복 입력이 설정되어 있으면 음성 데이터가 일정 시간 안에 중복해서 입력되는 경우에 한하여 정보 검색을 실행함으로써 음성 인식에 따른 무차별적 정보 검색을 방지할 수 있다.

이상의 설명은 본 발명을 예시적으로 설명한 것에 불과하며, 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자에 의해 본 발명의 기술적 사상에서 벗어나지 않는 범위에서 다양한 변형이 가능할 것이다.

따라서 본 발명의 명세서에 개시된 실시 예들은 본 발명을 한정하는 것이 아니다. 본 발명의 범위는 아래의 특허청구범위에 의해 해석되어야 하며, 그와 균등한 범위 내에 있는 모든 기술도 본 발명의 범위에 포함되는 것으로 해석해야 할 것이다.

본 발명은 음성 데이터가 사용자 정의 데이터베이스에 존재하고 반복적으로 입력되는 경우에 한하여 해당 음성 데이터에 대응하는 정보를 검색 및 제공하는 기술로서, 음성 인식을 이용한 정보 검색 분야에 널리 사용될 수 있다.

Claims

음성 인식 기반의 정보 검색 장치에서 음성 데이터에 대응하는 정보를 검색하는 방법에 있어서,

마이크를 통해 음성 데이터가 입력되면 입력된 음성 데이터를 사용자 정의 음성 데이터베이스에 저장된 음성 데이터와 비교하는 단계와,

상기 비교 결과 일치하는 음성 데이터가 존재하면 음성 데이터의 반복 입력이 설정되어 있는지 판단하는 단계와,

상기 판단 결과 음성 데이터의 반복 입력이 설정되어 있으면 내부 메모리에 상기 입력된 음성 데이터와 일치하는 음성 데이터가 존재하는지 확인하는 단계와,

상기 확인 결과 일치하는 음성 데이터가 존재하면 이벤트를 출력하고 음성 데이터에 대응하는 정보를 검색 서버에 요청하는 단계를 포함하는 음성 인식을 이용한 정보 검색 방법.
제1항에 있어서,

상기 판단 결과 음성 데이터의 반복 입력이 설정되어 있지 않으면 이벤트를 출력하고 음성 데이터에 대응하는 정보를 검색 서버에 요청하는 단계를 더 포함하는 것을 음성 인식을 이용한 정보 검색 방법.
제1항에 있어서,

상기 확인 결과 일치하는 음성 데이터가 존재하지 않으면 상기 내부 메모리에 상기 입력된 음성 데이터를 저장하는 단계와,

상기 입력된 음성 데이터가 저장된 후 일정 시간이 지나면 상기 내부 메모리에서 음성 데이터를 삭제하는 단계를 더 포함하는 것을 특징으로 하는 음성 인식을 이용한 정보 검색 방법.
제1항에 있어서,

상기 검색 서버로 정보 요청 후 상기 내부 메모리에 저장된 음성 데이터를 삭제하는 단계를 더 포함하는 음성 인식을 이용한 정보 검색 방법.
정보 검색의 대상이 되는 음성 데이터를 저장하는 사용자 정의 음성 데이터베이스와,

마이크를 통해 입력된 음성 데이터를 상기 사용자 정의 음성 데이터베이스에 저장된 음성 데이터와 비교하는 음성 비교부와,

상기 마이크를 통해 입력된 음성 데이터를 임시 저장하는 메모리와,

검색 서버와 데이터를 송수신하는 통신부와,

상기 음성 비교부에 의한 비교 결과 일치하는 음성 데이터가 존재하고 음성 데이터의 반복 입력이 설정되어 있으면, 상기 메모리에 상기 마이크를 통해 입력된 음성 데이터와 일치하는 음성 데이터가 존재하는지 확인하여 일치하는 음성 데이터가 존재하면 이벤트를 출력하고, 해당 음성 데이터에 대응하는 정보를 검색 서버에 요청하는 신호를 생성하는 제어부를 포함하는 음성 인식을 이용한 정보 검색 장치.
제5항에 있어서,

상기 제어부는 상기 검색 서버로 정보 요청 후 상기 메모리에서 해당 음성 데이터를 삭제하는 것을 특징으로 하는 음성 인식을 이용한 정보 검색 장치.
제5항에 있어서,

상기 제어부는 상기 음성 데이터의 반복 입력이 설정되어 있지 않으면 이벤트를 출력하고 해당 음성 데이터에 대응하는 정보를 검색 서버에 요청하는 신호를 생성하는 것을 특징으로 하는 음성 인식을 이용한 정보 검색 장치.
제5항에 있어서,

상기 제어부는 상기 메모리에 상기 마이크를 통해 입력된 음성 데이터와 일치하는 음성 데이터가 존재하지 않으면 상기 메모리에 상기 마이크를 통해 입력된 음성 데이터를 저장하고, 상기 마이크를 통해 입력된 음성 데이터가 저장된 후 일정 시간이 지나면 상기 메모리에서 음성 데이터를 삭제하는 것을 특징으로 하는 음성 인식을 이용한 정보 검색 장치.
제1항 내지 제4항 중 어느 한 항에 의한 방법을 실행하기 위한 프로그램을 저장한 컴퓨터로 읽을 수 있는 기록매체.