KR101434190B1

KR101434190B1 - 음성신호를 이용한 전자도서 제어방법 및 장치

Info

Publication number: KR101434190B1
Application number: KR1020120127640A
Authority: KR
Inventors: 김성길
Original assignee: 주식회사 인프라웨어
Priority date: 2012-11-12
Filing date: 2012-11-12
Publication date: 2014-08-27
Also published as: KR20140060830A

Abstract

본 발명은 전자도서를 이용하는 방법에 관한 것으로서, 보다 상세하게는 사람의 음성을 이용, 전자도서를 검색하고 표시하여, 읽기 편의를 제공할 수 있는 방법 및 장치가 개시된다.
본 발명은, 음성신호를 수신하는 단계, 상기 음성신호를 잡음 신호와 데이터 신호로 분류하는 단계와 상기 데이터 신호를 추출하는 단계, 추출한 상기 데이터 신호의 분석을 통해 매칭데이터를 생성하는 단계, 상기 매칭데이터를 데이터 베이스의 일 이상의 전자도서정보와 매칭하여 일 이상의 전자도서를 선택하는 단계 및 상기 일 이상의 전자도서에 대하여 사용자의 명령어를 실행하는 단계를 포함하는 것을 특징으로 한다. 음성을 이용해 전자도서를 이용함으로써, 유아, 노인 또는 손이 불편한 사람들에게 빠르고 편리한 사용자 인터페이스를 제공하고, 물리적인 조작이 아닌 음성조작을 이용하므로, 사용자가 다른 업무를 수행하면서도 로딩이 가능한 효과가 있다.

Description

음성신호를 이용한 전자도서 제어방법 및 장치{METHOD AND APPARATUS FOR CONTROLLING ELECTRONIC PUBLICATIONS THROUGH PHONETIC SIGNALS}

본 발명은 전자도서를 이용하는 방법에 관한 것으로서, 보다 상세하게는 사용자의 음성을 통하여, 전자도서를 검색하고 표시하여, 읽기 편의를 제공할 수 있는 방법 및 장치에 관한 것이다.

음성인식기술 (Automatic Speech Recognition; ASR) 은 입력 음성신호를 음성신호처리기술에 의해 문자열로 변환하는 기술로서, 음성합성과 더불어 음성신호처리의 가장 핵심적인 기술 분야 가운데 하나이다. 사용자의 음성명령을 인식하고, 인식된 음성명령을 명령어 코드로 변환하여 실행시키는 기술에서, 최근에는 사람과 사람 사이의 자연스럽게 발성하는 대화체 음성까지 인식할 수 있는 대화체 인식 기술도 활발히 연구되고 있다. 이러한 음성인식 기술은 각종 시스템에 응용, 모바일 기기, 차량용 네비게이터에 적용되어 사용자의 편의를 고조하는데 일조하고 있고, 점차 그 적용범위를 넓혀가고 있다.

전자도서 시스템은 PC, 휴대용 컴퓨터, 모바일 기기 등을 통해서 읽거나 볼 수 있는 디지털화된 출판물, 즉 전자화 된 출판물을 제공하는 시스템을 의미한다. 전자도서 시스템은 전자도서를 편집하여 사용자에게 제공하고, 사용자는 전자도서 시스템으로부터 PC 통신이나 인터넷을 통해 전자도서를 다운 받을 수 있다 . 이러한 전자도서는 컨텐츠를 독자에게 전달함에 있어 종이를 필요로 하지 않고, 인쇄, 유통에 이르는 일련의 과정이 생략됨에 따라, 저렴한 비용으로 독자에게 컨텐츠를 전달할 수 있는 장점이 있다. 따라서 시장 규모가 작은 분야의 도서도 전자도서로 쉽게 출판이 가능하고, 유행에 민감한 분야의 컨텐츠도 부담없이 출판할 수 있다. 이처럼 전자도서시장이 확장됨에 따라, 전자도서 활용 연령대가 유아나 노인들에게까지 확대되었으나, 전자도서가 구현 가능한 단말기는 종래의 전자기기 조작 방식에 머물러 있었다.

종래 전자도서를 열람할 수 있는 단말기의 경우, 사용자는 터치스크린 또는 키패드를 통해 텍스트를 입력하여 전자도서를 검색하거나, 수 많은 전자도서 목록에서 스크롤을 통하여 전자도서를 선택하는 것이 강제되어왔다. 이러한 방식은 종래의 전자기기 조작 방식에 익숙하지 않은 유아, 노인, 손이 불편한 사람들의 전자도서 활용을 어렵게 하고, 전자도서를 로딩 (loading) 하기 위해서 반드시 물리적인 제어가 요구되었다는 점에서 조작하기가 용이하지 않은 문제점이 있었다. 따라서, 단순히 전자도서의 컨텐츠만을 제공할 것이 아니라, 조작편의성을 강조한 전자도서 이용방법 및 장치의 개발이 요구되었다.

본 발명의 목적은 종래의 전자도서 조작 방법을 달리하여, 사용자의 조작편의성을 제고할 수 있는, 음성을 이용한 전자도서 이용방법 및 장치를 제공하는 것이다.

본 발명의 다른 목적은, 음성을 이용해 효율적으로 전자도서를 관리 및 활용하기 위한 사용자 인터페이스를 제공하는 것이다.

전술한 바와 같은 목적을 달성하기 위한 본 발명에 따른 음성을 이용한 전자도서 이용방법은, 음성신호를 수신하는 단계, 상기 음성신호를 잡음 신호와 데이터 신호로 분류하는 단계, 상기 음성신호 중에서 상기 데이터 신호를 추출하는 단계 및 추출한 상기 데이터 신호를 데이터 베이스에 저장된 서적정보 또는 제어명령어정보와 대조하여 매칭되는 동작을 실행하는 단계를 포함하는 것을 특징으로 한다.

본 발명의 다른 특징에 따르면, 상기 서적정보 또는 제어명령어정보는 상기 데이터 신호를 상기 데이터 베이스에 저장된 전자도서의 제호, 해당 제호의 키워드, 저자 이름 또는 연관어에 관한 일 이상의 전자도서정보와 대조하여 매칭되는 일 이상의 전자도서를 선택하는 정보를 포함한다.

본 발명의 또 다른 특징에 따르면, 상기 데이터 신호는 상기 데이터 신호의 파형 분석을 통해 음절단위로 분석하고 형태소 단위로 분류되는 것을 특징으로 한다.

본 발명의 또 다른 특징에 따르면, 상기 데이터 신호를 텍스트로 변환하는 단계를 포함한다.

본 발명의 또 다른 특징에 따르면, 상기 동작은 전자도서를 로딩 (loading) 하는 동작, 전자도서를 브라우징 (Browsing) 하는 동작 및 전자도서 설정을 변경하는 동작 중 하나 이상의 동작을 포함한다.

본 발명의 또 다른 특징에 따르면, 상기 대조에 앞서 상기 데이터 신호 내에 매칭데이터가 포함되어 있는 경우에만 상기 대조를 수행한다.

본 발명의 또 다른 특징에 따르면, 상기 데이터 신호와 상기 서적정보 또는 상기 제어명령어정보 간에 매칭값이 없는 경우 유사범주 데이터에 연결 (Linking) 한다.

전술한 바와 같은 목적을 달성하기 위한 본 발명에 따른 전자도서가 구현 가능한 단말기는, 음성신호 인식부, 음성신호 처리부, 중앙제어부, 및 디스플레이부를 포함하고, 상기 음성신호 인식부는 음성신호를 수신하고, 상기 음성신호 처리부는 상기 음성신호를 잡음 신호와 데이터 신호로 분류하여 상기 데이터 신호를 추출하고, 상기 중앙제어부는 추출한 상기 데이터 신호를 데이터 베이스에 저장된 서적정보 또는 제어명령어정보와 대조하여 매칭되는 동작을 실행하는 것을 특징으로 한다.

본 발명의 또 다른 특징에 따르면, 상기 데이터 신호는 상기 데이터 신호의 파형 분석을 통해 음절단위로 분석하고 형태소 단위로 분류된다.

본 발명의 또 다른 특징에 따르면, 상기 데이터 신호를 텍스트로 변환할 수 있는 텍스트 변환 모듈을 포함한다.

본 발명의 또 다른 특징에 따르면, 상기 동작은 전자도서를 로딩하는 동작, 전자도서를 브라우징하는 동작 및 전자도서 설정을 변경하는 동작 중 하나 이상의 동작을 포함한다.

본 발명의 또 다른 특징에 따르면, 상기 중앙제어부는 상기 대조에 앞서 상기 데이터 신호 내에 매칭데이터가 포함되어 있는 경우에만 상기 대조를 수행한다.

본 발명의 또 다른 특징에 따르면, 상기 중앙제어부는 상기 데이터 신호와 상기 서적정보 또는 상기 제어명령어정보 간에 매칭값이 없는 경우 유사범주 데이터에 연결 (Linking) 한다.

본 발명은 음성을 이용해 전자도서를 이용함으로써, 유아, 노인 또는 손이 불편한 사람들에게 빠르고 편리한 사용자 인터페이스의 제공이 가능한 효과가 있다.

또한, 물리적인 조작이 아닌 음성조작을 이용하므로, 사용자가 다른 업무를 수행하면서도 로딩이 가능한 효과가 있다.

도 1은 본 발명의 일 실시예에 따른, 음성을 이용한 전자도서 이용 알고리즘 처리모듈의 구성도를 도시한 것이다.
도 2a는 본 발명의 일 실시예에 따른, 전자도서가 구현 가능한 단말기에서 음성을 이용해 전자도서를 이용하는 알고리즘의 흐름도를 도시한 것이다.
도 2b는 본 발명의 일 실시예에 따른, 전자도서가 구현 가능한 단말기에서 제어명령어-식별어가 적용된 음성을 이용해 전자도서를 이용하는 알고리즘의 흐름도를 도시한 것이다.
도 3은 본 발명의 일 실시예에 따른, 전자도서가 구현 가능한 단말기에서 음성을 텍스트로 변환하여 디스플레이하는 모습을 도시한 것이다.
도 4는 본 발명의 일 실시예에 따른, 전자도서가 구현 가능한 단말기에서 음성을 이용해 전자도서를 이용시, 메모하는 모습을 도시한 것이다.
도 5는 본 발명의 일 실시예에 따른, 전자도서가 구현 가능한 단말기에서 음성을 이용해 전자도서를 이용시, 밑줄을 치는 모습을 도시한 것이다.

본 발명의 이점 및 특징, 그리고 그것들을 달성하는 방법은 첨부되는 도면과 함께 상세하게 후술되어 있는 실시예들을 참조하면 명확해질 것이다. 그러나 본 발명은 이하에서 개시되는 실시예들에 한정되는 것이 아니라 서로 다른 다양한 형태로 구현될 것이며, 단지 본 실시예들은 본 발명의 개시가 완전하도록 하며, 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 발명의 범주를 완전하게 알려주기 위해 제공되는 것이며, 본 발명은 청구항의 범주에 의해 정의될 뿐이다.

비록 제1, 제2 등이 다양한 구성요소들을 서술하기 위해서 사용되나, 이들 구성요소들은 이들 용어에 의해 제한되지 않음은 물론이다. 이들 용어들은 단지 하나의 구성요소를 다른 구성요소와 구별하기 위하여 사용하는 것이다. 따라서, 이하에서 언급되는 제1 구성요소는 본 발명의 기술적 사상 내에서 제2 구성요소일 수도 있음은 물론이다.

본 명세서에서 도면부호를 사용함에 있어, 도면이 상이한 경우라도 동일한 구성을 도시하고 있는 경우에는 가급적 동일한 도면부호를 사용한다.

본 명세서에 있어서는 어느 하나의 구성요소가 다른 구성요소로 데이터 또는 신호를 '전송'하는 경우에는 구성요소는 다른 구성요소로 직접 상기 데이터 또는 신호를 전송할 수 있고, 적어도 하나의 또 다른 구성요소를 통하여 데이터 또는 신호를 다른 구성요소로 전송할 수 있음을 의미한다.

또한, 각 블록은 특정된 논리적 기능 (들) 을 실행하기 위한 하나 이상의 실행 가능한 인스트럭션들을 포함하는 모듈, 세그먼트 또는 코드의 일부를 나타낼 수 있다. 또, 몇 가지 대체 실행 예들에서는 블록들에서 언급된 기능들이 순서를 벗어나서 발생하는 것도 가능함을 주목해야 한다. 예컨대, 잇달아 도시되어 있는 두 개의 블록들은 사실 실질적으로 동시에 수행되는 것도 가능하고 또는 그 블록들이 때때로 해당하는 기능에 따라 역순으로 수행되는 것도 가능하다.

도1은 본 발명의 일 실시예에 따른, 음성을 이용한 전자도서 이용 알고리즘 처리모듈의 구성도를 도시한 것이다.

도1에 따르면, 본 발명의 일 실시예에 따른, 음성을 이용한 전자도서 이용 알고리즘 처리모듈 (100) 은, 음성신호 인식부 (110), 음성신호 처리부 (120), 중앙제어부 (130) 및 디스플레이부 (140) 를 포함한다.

도1에 도시되어 있는 바와 같이, 음성신호 인식부 (110) 는 사용자가 발성한 음성신호를 수신한다. 일 실시예로 음성신호 인식부 (110) 는 마이크로폰 (microphone) 으로 구현될 수 있으며, 수신한 음성신호를 음성신호 처리부 (120) 에 전송한다.

음성신호 처리부 (120) 는 음성신호 인식부 (110) 로부터 전송받은 음성신호를 유효 전송 주파수 대역에 적합하게 필터링하는 필터부 (121), 상기 음성신호를 디지털 신호로 변환하는 신호 변환부 (122), 매칭데이터 생성부 (123) 를 포함할 수 있다. 상기 신호 변환부 (122) 는 바람직하게는 A/D 컨버터로 구성되어 아날로그 음성신호를 디지털 신호로 변환할 수 있다.

음성신호는 신호 변환부 (122) 에 의해서 분석가능한 다양한 형태의 신호로 변환될 수 있으며, 일례로 음성신호는 디지털 신호로 변환되어, 음성신호 패턴 즉, 음성주파수 패턴, 음성크기 패턴 및 음성파형 패턴으로 분류하여 분석될 수 있다. 음성주파수 패턴, 음성크기 패턴 및 음성파형 패턴이란, 음성신호를 소리의 3요소로 일컬어지는 주파수, 크기 (진폭) 및 파형에 따라 분류한 것을 의미한다.

매칭데이터 생성부 (123) 는 상기 데이터 신호를 분석하여 매칭데이터를 생성할 수 있다. 이때 데이터 신호의 분석은 파형분석을 통해 음절단위로 분석하여 형태소 단위로 분류, 상기 데이터 신호의 키워드를 추출하여 매칭데이터를 생성할 수 있다. 여기서 음절 (syllable) 이란, 분절음의 결합으로 만들어지는 음운론적 단위 중에서 가장 작은 것으로서, 음의 최소 마디를 의미하며, 형태소란, 일정한 의미가 있는 가장 작은 말의 단위로서 발화체 내에서 따로 떼어낼 수 있는 것을 의미한다.

예를 들어 사용자가 ‘백인의 눈으로 아프리카를 말하지 말라’ 라는 제호의 전자도서를 찾기 위해 해당 서적의 제호를 음성신호로 입력한 경우, 소리나는대로 신호를 입력받으면, 그 결과는 ‘배기늬 누느로 아프리카를 말하지 말라’가 되고, 특히 중간에 불분명하게 인식된 키워드로 해당 전자도서의 제호를 검색하는 경우 오류가 발생할 수 있다. 이러한 경우 ‘배’, ‘기’, ‘늬’와 같이 음절단위로 분석하되, 따로 떼어내어도 의미를 가질 수 있는 형태소 단위로 분류함으로써, 전자도서의 제호를 효과적으로 검색할 수 있다. 상기 예시에서 음성신호를 형태소 단위로 나누면 ‘백인’과 ‘의’로 분류가 이뤄져야 할 것이다. 하지만, 어미나 조사까지 모두 받아들인 데이터 신호를 제어명령어와 대조하는 경우, 어미나 조사의 발음이 흐린 통상 사용자의 발음 특성상, 잘못된 단어로 인식하여, 잘못된 매칭을 하거나, 매칭이 이뤄지지 못할 확률이 높아질 수 있다. 그러므로 오히려 이를 제외한 키워드만을 추출해 생성한 매칭데이터를 제어명령어와 대조하면, 매칭확률을 더 높일 수 있다. 즉, 앞서 예에서 어미나 조사를 제외한, ‘백인’, ‘눈’, ‘아프리카’ 및 ‘말’ 만을 키워드로 추출하여 복수의 키워드가 모두 매칭되는지 여부, 또는 키워드의 순서 (sequence) 의 일치 여부 등을 고려하여 매칭데이터를 생성할 수 있다.

한편, 중앙제어부 (130) 는 메모리 (131), 텍스트 변환모듈 (132) 및 매칭결과 연결모듈 (133) 을 포함할 수 있다. 메모리 (131) 에는 전자도서에 관한 정보를 담은 서적정보와 사용자의 음성명령에 대응하는 제어명령어정보가 데이터 베이스화 되어 저장될 수 있다. 제어명령어정보에 대응될 수 있는 음성명령은 필요에 따라 사용자가 재설정할 수 있도록 구성될 수 있다.

텍스트 변환모듈 (132) 은 데이터신호를 텍스트로 변환하는 기능을 수행하며, 매칭결과 연결모듈 (133) 은 사용자의 음성신호를 해석 가능하도록 변환한 데이터 신호와 데이터 베이스에 저장되어 있는 서적정보, 제어명령어정보를 매칭하는 기능을 수행한다. 나아가, 매칭결과 연결모듈 (133) 은 데이터신호와 매칭되는 서적정보, 제어명령어가 없는 경우, 유사범주 서적정보, 제어명령어정보 범주 내에서 해당 데이터신호에 대한 명령을 수행하도록 구현될 수 있다. 유사범주 제어명령어란, 데이터 신호의 일부와 매칭되는 서적정보 또는 제어명령어정보를 의미하며, 데이터 신호가 유사범주 제어명령어의 일부와 매칭되는 경우도 포함할 수 있다.

디스플레이부 (140) 는, 전자도서 및 전자도서를 볼 수 있는 뷰어 (Viewer) 를 표시한다. 전자도서 뷰어 (eBook Viewer) 는 PC, 모바일 기기, 전자도서 전용 단말기 등 디스플레이가 장착되어 있는 다양한 전자장치를 통해 구현될 수 있다.

이하에서는 음성을 이용해 전자도서를 이용하기 위한 알고리즘 처리모듈에서의 기본적인 동작 절차를 상세히 설명한다.

도2a는 본 발명의 일 실시예에 따른, 전자도서가 구현 가능한 단말기에서 음성을 이용해 전자도서를 이용하는 알고리즘의 흐름도를 도시한 것이다.

도2a에 따르면, 먼저 사용자가 음성을 발성하는 경우, 음성신호 인식부 (110) 를 통해 음성신호를 수신할 수 있다 (S100).

음성신호 인식부 (110) 로부터 음성신호를 전송받은 음성신호 처리부 (120) 에서는, 수신한 음성신호를 필터부 (121) 를 통해 음성신호를 잡음 신호와 데이터 신호로 분류하고 (S110), 신호 변환부 (122), 바람직하게는 A/D 컨버터를 통해 데이터 신호로 분류된 아날로그 음성 신호를 디지털 신호로 변환하여, 디지털 처리된 데이터 신호를 추출할 수 있다 (S120). 본 명세서에서는 설명 편의상 아날로그 데이터 신호와 디지털 처리된 데이터 신호를 모두 ‘데이터 신호’로 통칭한다.

중앙 제어부 (130) 는 추출된 데이터 신호와 데이터 베이스에 저장되어 있는 서적정보와 제어명령어정보를 비교하여 데이터 매칭되는 동작을 실행할 수 있다 (S130). 즉, 전자도서의 제목 또는 제어명령어에 해당하는 데이터 신호는 데이터 베이스 내 서적정보와 제어명령어정보와 비교함으로써 매칭을 수행할 수 있다. 상기 동작은 특정 전자도서의 로딩 동작뿐만 아니라, 전자도서를 보는 도중 전자도서의 이동, 편집을 용이하게 하기 위한 브라우징 관련 동작, 전자도서의 보기설정을 변경하는 동작 등을 포함할 수 있다.

전자도서를 로딩함에 있어, 서적의 제호에 해당하는 데이터 신호뿐만 아니라 사용자가 이전에 읽던 서적을 다시 로딩하도록 동작시키는 제어명령어가 사용될 수 있다. 예를 들면, ‘보던 책’, ‘어제 읽던 책’ 등 특정 음성명령으로서, 전자도서 자체의 정보 이외의 조건에 대응할 수 있는 제어명령어를 두어, 전자도서의 제목 등을 말하지 않고도 전자도서를 로딩할 수 있다.

한편, 전자도서 브라우징 (Browsing) 하도록 동작시키는 제어명령어의 예를 들면, 전자도서내부에서 ‘~페이지’, ‘~쪽’, ‘다음’, ‘이전’, ‘목차‘, ‘여기까지’, ‘보던 데’, ‘검색’, ‘사전’ 등 특정 음성명령을 통한 페이지간 이동, 목차로의 이동, 책갈피 삽입, 책갈피가 삽입된 페이지로의 이동, 전자도서내부검색, 사전검색을 비롯해, 후술할 메모나 하이라이트 삽입 제어명령어 등이 있을 수 있다.

전자도서의 보기설정을 변경하도록 동작시키는 제어명령어의 예를 들면, 화면밝기, 전자도서의 글자크기, 줄간격, 문단 간격, 글꼴, 등을 변경하는 제어명령어를 들 수 있다. 즉, ‘밝게’, ‘어둡게’, ‘크게’, ‘작게’, ‘줄간격 넓게’, ‘줄간격 좁게’, ‘문단간격 넓게’, ‘문단간격 좁게’, ‘궁서체’ 등 특정 음성명령에 대응할 수 있는 제어명령어들을 포함할 수 있다. 종래 전자도서 뷰어에서는 물리적인 입력 방법을 통해서만 구현할 수 있는 기능들을 음성명령을 통해 간편하게 구현할 수 있다.

본 발명의 일 실시예에 따르면, 중앙 제어부 (130) 는 추출된 데이터 신호를 메모리 (131) 에 저장된 데이터 베이스의 전자도서정보와 데이터 매칭을 통해 대조해, 매칭되는 일 이상의 전자도서를 선택할 수 있다. 상기 데이터 베이스는 전자도서의 기본정보나 내용뿐만 아니라, 검색의 편의를 높일 수 있도록, 전자도서의 제호, 해당 제호의 키워드, 저자정보 및 해당 서적과 관련된 연관어를 포함할 수 있다.

본 발명의 일 실시예에 따르면, 사용자의 음성신호를 수신하기에 앞서, 인식시작 제어명령을 수행할 수 있다. 인식시작 제어명령이란, 사용자의 음성신호를 수신할 수 있도록 음성신호 인식부 및 음성신호 처리부를 활성화시키는 제어명령을 의미한다. 전자도서가 구현 가능한 단말기에서, 음성신호 인식부 및 음성신호 처리부는 비활성화 상태로 두어, 불필요한 전력소모를 줄일 수 있는 장점이 있다. 인식시작 제어명령은, 물리적인 입력수단을 통해서 수신될 수 있음은 물론, 도2a에 따른 알고리즘의 흐름을 따라 음성신호로 수신될 수 있다.

도2b는 본 발명의 일 실시예에 따른, 전자도서가 구현 가능한 단말기에서 제어명령어-식별어가 적용된 음성을 이용해 전자도서를 이용하는 알고리즘의 흐름도를 도시한 것이다.

도2b에 따르면, 음성신호 인식부 (110) 를 통해 음성신호를 수신하고 (S200), 음성신호 인식부 (110) 로부터 음성신호를 전송받은 음성신호 처리부 (120) 에서는, 수신한 음성신호를 필터부 (121) 를 통해 잡음 신호와 데이터 신호로 분류하고 (S210), 신호 변환부 (122) 를 통해 데이터 신호로 분류된 아날로그 음성 신호를 디지털 신호로 변환하여, 데이터 신호를 추출 (S220) 한다. 해당 절차는 도2a의 S100 내지 S120 까지의 절차와 동일하다.

다만, 음성신호 처리부 (120) 로부터 데이터 신호를 전송 받은 중앙 제어부 (130) 는, 데이터 신호와 서적정보 또는 제어명령어정보를 매칭하기에 앞서, 매칭데이터를 생성할 수 있다 (S230).

매칭데이터는 데이터 신호에 대하여 데이터베이스 내 서적정보 또는 제어명령어정보와 매칭을 수행할 것인지 여부를 판단하기 위하여 사용되는 데이터로서, 마찬가지로 전술한 바와 같이 데이터 신호를 파형분석을 통해 음절단위로 분석하여 형태소 단위로 분류, 상기 데이터 신호의 키워드를 추출하여 생성할 수 있다.

중앙 제어부 (130) 는 데이터 신호가 제어명령어-식별어와 매칭되는 매칭데이터 신호로 시작하는지 확인하여 데이터베이스와 데이터 신호를 매칭할 것인지 판단할 수 있다 (S240).

제어명령어-식별어란, 일 이상의 특정한 제어명령어를 실행하고자 할 때, 함께 포함되어야만 하는 제어명령어를 의미하며, 이는 특정한 음성명령을 하고 있음을 알리는 인디케이터 (indicator) 로 볼 수 있다. 예를 들어, 제어명령어-식별어를 사용하지 않는 경우에는 사용자가 검색을 의도하지 않았더라도, 이를 음성명령으로 인식하여 제어명령어가 실행할 수 있는 문제점이 있다. 따라서 특정한 식별어를 두어, 이러한 식별어가 포함된 문구를 발성한 경우에만, 제어명령어를 실행하도록 할 수 있다. 예를 들어, ‘전자책’ 이 그 특정한 제어명령어-식별어일 때, 사용자가 ‘어제 읽던 책 괜찮았어’ 라고 발성한 경우, 제어명령어-식별어에 해당하는 ‘전자책’에 대응하는 문구가 없으므로, 읽던 전자도서를 로딩하는 제어명령어를 실행하지 않고 종료할 수 있다. 그러나 사용자가 ‘전자책 어제 읽던 책 괜찮았어’라고 발성한 경우, 제어명령어-식별어에 해당하는 ‘전자책’에 대응하는 문구가 있으므로, 읽던 책을 여는 제어명령어를 실행할 수 있다. 제어명령어에 앞서 제어명령어-식별어가 있어야 제어명령어를 실행하게끔 그 순서를 지정할 수도 있다.

또한, 일 이상의 전자도서정보를 검색하여 일 이상의 전자도서를 선택하는 제어명령어의 특정한 제어명령어-식별어로서 ‘검색’을 둔 경우, ‘검색’ 이란 제어명령과 함께 전자도서의 제목을 말하면, 해당 전자도서의 검색을 수행할 수 있다. 이때, 중앙 제어부 (130) 는 추출된 데이터 신호를, 메모리 (131) 에 저장된 데이터 베이스의 전자도서정보와 데이터 매칭을 통해 대조해, 매칭되는 일 이상의 전자도서를 선택할 수 있다. 또는, 추출된 데이터 신호를 분석해 생성된 매칭데이터를 데이터 매칭시 이용할 수 있다. 상기 데이터 베이스는 전자도서의 기본정보나 내용뿐만 아니라, 검색의 편의를 높일 수 있도록, 전자도서의 제호, 해당 제호의 키워드, 저자정보 및 해당 서적과 관련된 연관어를 포함할 수 있다.

그러나 ‘검색’ 이란 제어명령이 포함되어 있지 않고, 다른 음성명령만이 있으면, 해당 음성명령을 수행하게 할 수 있다. 이는, 사용자가 다른 업무를 수행하면서, 전자도서가 구현 가능한 단말기를 조작할 때 특히 유용할 수 있고, 전자도서 제목이 음성명령에 대응하는 문구를 포함하고 있을 때 생길 수 있는 오작동의 오류도 줄일 수 있다. 여기서 오작동이란, ‘읽던 책 계속 읽는 방법’ 이라는 제목의 전자도서를 찾을 때, 사용자가 발성한 문구 중, ‘읽던 책’ 이라는 읽던 책을 로딩하는 특정명령에만 대응해, 읽던 전자도서의 로딩이 이뤄지는 것 등을 의미한다. 또한, 제어명령을 수행함에 있어, 순차적인 입력을 수신할 필요가 경우, 예를 들면, 전자도서 내부에서의 검색, 메모 삽입, 밑줄 긋기, 사전검색을 할 때는, 제어명령어-식별어를 두어, 오작동을 줄일 수 있다.

이하에서는 사용자의 음성을 이용해 전자도서에 대해 제어명령어를 실행하는 전자도서 이용방법을 상세히 설명한다.

도3은 본 발명의 일 실시예에 따른, 전자도서가 구현 가능한 단말기에서 음성을 텍스트로 변환하여 디스플레이하는 모습을 도시한 것이다.

구체적으로, 본 실시예에서는, 앞에서 예를 든, ‘백인의 눈으로 아프리카를 말하지 말라’를 검색창에서 음성인식을 통해 입력한 모습을 도시한 것이다.

먼저, 음성신호 인식부 (110) 를 통해, 사용자의 음성신호 (도3에 도시되어 있는 바에 따르면, ‘백인의 눈으로 아프리카를 말하지 말라’) 를 수신하면, 이를 전송받은 음성신호 처리부 (120) 에서 잡음 신호와 데이터 신호로 분류하고, 데이터 신호를 추출한다. 중앙 제어부 (130) 에서 상기 데이터 신호를 분석하여 ‘백인의 눈으로 아프리카를 말하지 말라’에 대응하는 매칭데이터 신호를 생성할 수 있고, 전자도서 뷰어 창 (300) 에서는 상기 데이터 신호를 텍스트 (320) 로 변환하여 디스플레이할 수 있다. 이때 데이터 베이스는 전자도서의 기본정보나 내용뿐만 아니라, 검색의 편의를 높일 수 있도록, 전자도서의 제호, 해당 제호의 키워드, 저자정보 및 해당 서적과 관련된 연관어를 포함할 수 있으므로, 그 항목 (310) 을 한정하거나, 모든 항목을 포함해 검색할 수 있다.

이때 상기 데이터 신호와 데이터 베이스의 일 이상의 전자도서정보와 매칭하여 일 이상의 전자도서를 선택한 모습은 리스트 창 (330) 에 표시할 수 있다. 도3에 도시되어 있는 바와 같이, 선택된 일 이상의 전자도서들 (331) 은 리스트 창 (330) 안에 나열되어 표시될 수 있다. 다만, 상기 데이터 베이스는 전자도서의 기본정보나 내용뿐만 아니라, 검색의 편의를 높일 수 있도록, 전자도서의 제호, 해당 제호의 키워드, 저자정보 및 해당 서적과 관련된 연관어를 포함할 수 있으므로, 도3에 도시된 바와 같이, ‘백인’, ‘눈’, ‘아프리카’, ‘말라’와 모두 매칭되는 데이터가 없는 경우, 전자도서의 제호의 키워드나 키워드의 연관어 데이터 베이스와 연동하여 전자도서정보를 검색, 그와 유사범주 데이터에 대응하는 전자도서정보를 표시할 수 있다.

나열된 전자도서 중에서 전자도서를 로딩함에 있어서도, 사용자의 음성명령이 이용될 수 있다. 도3에 따르면, ‘자신없다 절대 말하지 말라’ 전자도서 (331a) 을 지칭할 수 있는 음성명령패턴에 대응하는 음성명령을 수신하면 해당 전자도서를 로딩할 수 있다. 예를 들어, 사용자가 ‘첫 째’, ‘하나’, ‘1 (일) ’ 등 특정 음성명령을 발성하면, 리스트창 (330) 에 표시된 전자도서들 (331) 중 첫 번째로 표시된 전자도서 (331a) 를 로딩할 수 있다. 마찬가지로, 둘 째 (331b), 셋 째 (331c), 넷 째 (331d) 전자도서도 전술한 바와 같이 로딩할 수 있다. 표시된 전자도서를 여는 전술한 방법 이외에도 ‘보던 책’, ‘어제 읽던 책’ 등 전자도서 자체의 정보 이외의 조건에 대응하는 음성명령패턴을 두어, 실시예 이외의 다양한 방법으로 전자도서를 검색하거나 로딩할 수 있다. 만약 전자도서 검색결과가 한 권이라면, 바로 열기가 가능할 수 있다.

도4는 본 발명의 일 실시예에 따른, 전자도서가 구현 가능한 단말기에서 음성을 이용해 전자도서를 이용시, 메모하는 모습을 도시한 것이다.

먼저, 음성신호 인식부 (110) 를 통해, 인식시작 제어명령어로서, 사용자의 ‘메모’, ‘메모창 열어’ 등 특정한 음성신호를 수신하면, 이를 전송받은 음성신호 처리부 (120) 에서 잡음 신호와 데이터 신호로 분류하고, 데이터 신호를 추출한다. 중앙 제어부 (130) 에서는 상기 데이터 신호를 분석하여, 매칭데이터 신호를 생성할 수 있다. 상기 데이터 신호가, 메모리 (131) 에 저장된 ‘메모창 열기’에 대응하는 제어명령어와 매칭되면, 메모창 열기에 해당하는 제어명령어를 실행할 수 있다.

전자도서 뷰어 창 (400) 에 메모창 (410) 이 열리면 사용자의 음성신호 (도4에 도시되어 있는 바에 따르면, ‘나도 안경을 쓰고 싶다’) 를 메모창에 텍스트 (411) 로 변환하여 표시하고 메모리에 저장할 수 있다. 이후 상기 메모를 저장 (412) 하거나, 취소 (413) 하는 액션 역시 사용자의 음성명령을 통해 이뤄질 수 있다. 본 발명의 일 실시예에 따르면, 추출한 데이터 신호 중에서 제어명령어-식별어와 매칭되는 데이터 신호가 있는지 확인하여 제어명령어를 실행할 수 있다. 따라서 메모시 사용자의 음성신호 중에, ‘닫아’, ‘취소’ 등 메모삽입을 취소하는 제어명령어에 대응하는 특정 음성신호가 포함되어 있더라도, 제어명령어-식별어에 대응하는 음성명령이 포함되어 있지 않으면, 메모삽입 취소 제어명령어는 실행하지 않을 수 있다.

도5는 본 발명의 일 실시예에 따른, 전자도서가 구현 가능한 단말기에서 음성을 이용해 전자도서를 이용시, 밑줄을 치는 모습을 도시한 것이다.

먼저, 음성신호 인식부 (110) 를 통해, 인식시작 제어명령어로서, 사용자의 ‘밑줄’, ‘밑줄 쳐’ 등 특정 음성신호를 수신하면, 이를 전송받은 음성신호 처리부 (120) 에서는 음성신호를 잡음 신호와 데이터 신호로 분류하고, 데이터 신호를 추출한다. 중앙 제어부 (130) 에서 상기 데이터 신호를 분석, 매칭데이터를 생성하여, 메모리 (131) 에 저장된 ‘밑줄치기’에 대응하는 음성명령 패턴과 매칭되면, 밑줄치기에 해당하는 제어명령어를 실행한다.

전자도서 뷰어 창 (500) 에서, 밑줄을 칠 수 있도록 활성화가 되면 (510), 사용자는 음성명령을 통해 밑줄을 칠 부분을 지정할 수 있다. 도5에 따르면, ‘검토함으로써 통합할 것인지 안 할 것인지 의사결정을 할 때의 판단의 근거를 수집한다.’ 부분을 사용자가 읽으면, 이에 대응하는 데이터 신호를 추출하고, 메모리 (131) 에 저장된 전자도서본문내용과 대조하여, 매칭되는 부분이 있으면, 매칭이 시작되는 부분 (511) 에서 마치는 부분 (512) 까지 밑줄을 그을 수 있다. 따라서, 단순히 전자도서를 읽는 것뿐만 아니라 능동적으로 마킹 (marking) 하여 읽을 수 있다.

본 명세서에 개시된 실시예들과 관련하여 설명된 방법 또는 알고리즘의 단계는 프로세서에 의해 실행되는 하드웨어, 소프트웨어 모듈, 또는 그 2 개의 결합으로 직접 구현될 수도 있다. 소프트웨어 모듈은 RAM 메모리, 플래시 메모리, ROM 메모리, EPROM 메모리, EEPROM 메모리, 레지스터, 하드 디스크, 착탈형 디스크, CD-ROM, 또는 당업계에 알려진 임의의 다른 형태의 저장 매체에 상주할 수도 있다. 예시적인 저장 매체는 프로세서에 커플링되며, 그 프로세서는 저장 매체로부터 정보를 판독할 수 있고 저장 매체에 정보를 기입할 수 있다. 다른 방법으로, 저장 매체는 프로세서와 일체형일 수도 있다. 프로세서 및 저장 매체는 주문형 집적회로 (ASIC) 내에 상주할 수도 있다. ASIC는 사용자 단말기 내에 상주할 수도 있다. 다른 방법으로, 프로세서 및 저장 매체는 사용자 단말기 내에 개별 컴포넌트로서 상주할 수도 있다.

이상 첨부된 도면을 참조하여 본 발명의 실시예들을 설명하였지만, 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자는 본 발명의 그 기술적 사상이나 필수적인 특징을 변경하지 않고서 다른 구체적인 형태로 실시될 수 있다는 것을 이해할 수 있을 것이다. 그러므로 이상에서 기술한 실시예들은 모든 면에서 예시적인 것이며 한정적이 아닌 것으로 이해해야만 한다.

110 : 음성신호 인식부
120 : 음성신호 처리부
121 : 필터부
122 : 신호변환부
123 : 매칭데이터 생성부
130 : 중앙제어부
131 : 메모리
132 : 텍스트 변환모듈
133 : 매칭결과 연결모듈
140 : 디스플레이부

Claims

음성신호를 수신하는 단계;
상기 음성신호를 잡음 신호와 데이터 신호로 분류하는 단계;
상기 음성신호 중에서 상기 데이터 신호를 추출하는 단계; 및
추출한 상기 데이터 신호를 데이터 베이스에 저장된 서적정보 또는 제어명령어정보와 대조하여 매칭되는 동작을 실행하는 단계를 포함하며,
상기 데이터 신호는 상기 데이터 신호의 파형 분석을 통해 음절 단위로 분석하고 형태소 단위로 분류되며,
상기 서적정보 또는 제어명령어정보와 대조하여 매칭하는 동작을 실행하는 단계에서, 추출된 상기 데이터 신호에서 조사 및 어미를 제외한 데이터 신호를 상기 서적정보 또는 제어명령어정보와 대조하여 매칭하는, 음성을 이용한 전자도서 이용방법.
제 1항에 있어서,
상기 서적정보 또는 제어명령어정보는 상기 데이터 신호를 상기 데이터 베이스에 저장된 전자도서의 제호, 해당 제호의 키워드, 저자 이름 또는 연관어에 관한 일 이상의 전자도서정보와 대조하여 매칭되는 일 이상의 전자도서를 선택하는 정보를 포함하는, 음성을 이용한 전자도서 이용방법.
삭제
제 1항에 있어서,
상기 데이터 신호를 텍스트로 변환하는 단계를 포함하는, 음성을 이용한 전자도서 이용방법.
제 1항에 있어서,
상기 동작은 전자도서를 로딩 (loading) 하는 동작, 전자도서를 브라우징 (Browsing) 하는 동작 및 전자도서 설정을 변경하는 동작 중 하나 이상의 동작을 포함하는, 음성을 이용한 전자도서 이용방법.
제 1항에 있어서,
상기 대조에 앞서 상기 데이터 신호 내에 제어명령어-식별어가 포함되어 있는 경우에만 상기 대조를 수행하는, 음성을 이용한 전자도서 이용방법.
제 1항에 있어서,
상기 데이터 신호와 상기 서적정보 또는 제어명령어정보가 전부 매칭되지 않는 경우, 상기 데이터 신호의 일부와 매칭되는 서적정보 또는 제어명령어정보가 선택되는, 음성을 이용한 전자도서 이용방법.
음성신호 인식부;
음성신호 처리부;
중앙제어부; 및
디스플레이부를 포함하고,
상기 음성신호 인식부는 음성신호를 수신하고, 상기 음성신호 처리부는 상기 음성신호를 잡음 신호와 데이터 신호로 분류하여 상기 데이터 신호를 추출하고, 상기 중앙제어부는 추출한 상기 데이터 신호를 데이터 베이스에 저장된 서적정보 또는 제어명령어정보와 대조하여 매칭되는 동작을 실행하며,
상기 데이터 신호는 상기 데이터 신호의 파형 분석을 통해 음절 단위로 분석하고 형태소 단위로 분류되며,
상기 중앙제어부는 추출된 상기 데이터 신호에서 조사 및 어미를 제외한 데이터 신호를 상기 서적정보 또는 제어명령어정보와 대조하여 매칭하는, 전자도서가 구현 가능한 단말기.
제 8항에 있어서,
상기 서적정보 또는 제어명령어정보는 상기 데이터 신호를 상기 데이터 베이스에 저장된 전자도서의 제호, 해당 제호의 키워드, 저자 이름 또는 연관어에 관한 일 이상의 전자도서정보와 대조하여 매칭되는 일 이상의 전자도서를 선택하는 정보를 포함하는, 전자도서가 구현 가능한 단말기.
삭제
제 8항에 있어서,
상기 데이터 신호를 텍스트로 변환할 수 있는 텍스트 변환 모듈을 포함하는, 전자도서가 구현 가능한 단말기.
제 8항에 있어서,
상기 동작은 전자도서를 로딩하는 동작, 전자도서를 브라우징하는 동작 및 전자도서 설정을 변경하는 동작 중 하나 이상의 동작을 포함하는, 전자도서가 구현 가능한 단말기.
제 8항에 있어서,
상기 중앙제어부는 상기 대조에 앞서 상기 데이터 신호 내에 제어명령어-식별어가 포함되어 있는 경우에만 상기 대조를 수행하는, 전자도서가 구현 가능한 단말기.
제 8항에 있어서,
상기 중앙제어부는 상기 데이터 신호와 상기 서적정보 또는 제어명령어정보가 전부 매칭되지 않는 경우, 상기 데이터 신호의 일부와 매칭되는 서적정보 또는 제어명령어정보를 선택하는, 전자도서가 구현 가능한 단말기.