KR20150095307A - 음성어플실행시스템 및 방법 - Google Patents

음성어플실행시스템 및 방법 Download PDF

Info

Publication number
KR20150095307A
KR20150095307A KR1020140016460A KR20140016460A KR20150095307A KR 20150095307 A KR20150095307 A KR 20150095307A KR 1020140016460 A KR1020140016460 A KR 1020140016460A KR 20140016460 A KR20140016460 A KR 20140016460A KR 20150095307 A KR20150095307 A KR 20150095307A
Authority
KR
South Korea
Prior art keywords
voice
application
command
icon
input
Prior art date
Application number
KR1020140016460A
Other languages
English (en)
Inventor
정관선
김상오
Original Assignee
정관선
김상오
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 정관선, 김상오 filed Critical 정관선
Priority to KR1020140016460A priority Critical patent/KR20150095307A/ko
Publication of KR20150095307A publication Critical patent/KR20150095307A/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

본 발명은 음성인식모듈(12b)을 기본적으로 탑재하고 있는 스마트단말(10)의 음성어플실행시스템에 있어서, 상기 스마트단말(10)은 이미지를 출력하기 위한 디스플레이부(16)와 음성이 입력되고 출력되는 음성입출력부(14)와, 제어부(12)를 구비하되, 상기 제어부(12)는 스마트단말(10) 내에 설치된 어플 아이콘을 화면에 표시하기 위한 아이콘출력부(11a)와 적어도 하나 이상의 명령어(B)를 입력할 수 있도록 하는 명령어입력부(11b)를 구비하는 아이콘출력 및 명령어입력수단(11)과, 상기 음성 입출력부(14)를 통해 음성이 입력되면 상기 음성을 분석하고, 분석된 음성에 대해 매칭된 어플이 저장부(13)에 존재할 경우 명령어에 해당하는 어플을 웨이크업(Wake-up) 하기 위한 어플구동모듈(12a)과, 상기 아이콘출력 및 명령어입력수단(11)을 통해 입력된 명령어(B)와 어플 아이콘을 서로 매칭하여 저장하기 위한 저장부(13)로 구성되는 음성어플실행시스템을 제공하기 위한 것으로, 본 발명은 종래 스마트단말에 있어서 단말기 제작사 또는 브라우저를 제공하는 업체에서만 제공하던 일방적이고 획일적인 명령어에 의한 어플구동방법을 탈피하여 스마트단말 사용자들이 스스로 명령어를 지정하여 어플을 음성으로 구동시킬 수 있는 효과를 갖는다.

Description

음성어플실행시스템 및 방법{System and method for executing application using voice signal}
본 발명은 음성 어플 실행에 관한 것으로, 보다 구체적으로는, VoiceXML 기반의 음성어플실행시스템 및 방법에 관한 것이다.
오늘날 우리는 스마트폰과 태블릿PC, 스마트TV, 네비게이션 등과 같은 단말기(이하 이들을 "스마트단말"로 통칭하기로 한다)이 급속히 보급되면서 정보의 홍수 속에서 살고 있다. 정보는 개인, 국가, 기업의 경쟁력으로 평가되고 그 어느 때보다 정보의 이동성이 중요시되고 있다. 또한, 이러한 정보를 언제, 어디서나, 어떠한 통신 매체를 통해서나 접근하고자 하는 욕구가 증가하고 있고 심지어 달리는 차 속에서뿐만 아니라 걷거나 움직이는 환경에서도 시시각각 변하는 다양한 정보를 얻고자 한다.
이러한 상황에서 이제는 스마트폰이 단순한 똑똑한 전화기에서 정보검색 및 입력 수단으로 중요한 자리매김을 하게 되었으며 또한 스마트폰이 웨어러블(Wearable) 스마트단말로 발전하면서 사용자와 스마트단말간의 쉬운 인터페이스 방법을 제공하는게 중요한 화두가 되었다.
따라서 이를 위한 사용자 인터페이스로 가장 자연스럽고 경쟁력 있는 수단은 다름 아닌 음성이다. 최근 음성 인식, 합성 및 화자인증 등의 음성 HMI(Human Machine Interface) 기술의 성능 향상과 음성 브라우저 개발로 인해서 PC가 아닌 다양한 기기로도 음성을 통한 각종 장치 제어 및 인터넷 정보 활용이 가능하게 되었다.
특히, 스마트단말을 손으로 제어할 수 없는 상황, 예를 들어 운전중에 안전성과 편의성을 위해서 음성 HMI 기술의 적용 필요성이 증대하고 있고, 스마트폰용 음성 브라우저는 다양성과 이질성을 가진 음성 정보 기술 요소들을 효과적으로 통합함으로써, 사용자와 음성서비스 콘텐즈 개발자에게 시스템의 내부 구현에 편리한 인터페이스를 제공할 수 있다. 최근 웨어러블(Wearable) 스마트단말 환경에서는 사용자의 눈과 손은 스마트단말을 자유롭게 제어할 수 없는 상황이므로 음성은 인터페이스를 통해 기기를 동작하고 다양한 정보 검색 수단으로 이용할 수 있다.
그러나 음성을 음성부라우저로 사용하는 경우 다음과 같은 문제점이 있다.
즉 현재 스마트단말에서의 음성을 사용하여 프로그램을 구동하는 방법은 주요 3사(구글,애플,마이크로소프트) 기종별로 정리하면 아래와 같다.
안드로이드 폰의 경우는 설정에서 핸즈프리 모드 선택 후 미리 제작자가 해당 프로그램을 작동하도록 저장해놓은 명령어에만 반응하는 구조이다.
즉 음성검색 어플을 실행시킨 후 마이크 모양의 화면에 미리 제작사에서 설정해놓은 단어를 말해야만 해당 프로그램을 작동시키는 방법인 것이다.
아이폰은 단말기의 가운데 홈버튼을 길게누르면 음성인식모드로 전환이되고 이때 원하는 검색어나 문장을 말하면 서버로부터 결과를 음성으로 알려주고, 해당 명령을 실행한다.
윈도우폰 역시 단말기 가운데 홈 버튼을 길게 누르면 음성인식모드로 전환이 되고 이때 원하는 검색어나 문장을 말하면 서버로부터 결과를 음성으로 알려준다.
이들이 갖는 공통적인 문제점은 첫 번째로 모든 어플의 구동이 각사에서 설정해놓은 명령어에 의해서만 가능하다는 것이다. 즉 음성명령의 어플 콘텐츠가 모두 서버 의존적인 것이다. 다시 말해 단말기 사용자가 원하는 명령어에 의해서 구동하는 방식이 아니라는 것이다.
두 번째로 스마트단말을 음성서비스 모드로 전환하기 하기위해서는 수동으로 조작을 해야한다. 즉 스마트단말이 주변상황을 인식해서 지능적으로 자동으로 음성모드로 전환하지않는다. 또한 스마트단말의 화면을 직접 터치하여야만 음성서비스 구동어플을 실행시킬 수 있는 구조이다.
이것은 웨어러블(Wearable) 스마트단말 또는 걷거나 자동차운전 환경과 같은 상황에서는 적합하지 않는 구조이다. 특히 요즘 걸으면서 스마트폰을 조작하거나 운전하면서 네비게이션 등을 조작하는 행위 때문에 많은 사고가 발생하고 있어 심각한 사회적 문제를 야기하고 있는 실정이다.
세 번째 음성서비스 제공 기술 및 방법은 각 3사가 모두 다르다. 즉 HTML 브라우저처럼 표준화된 음성브라우저를 통해서 서비스가 제공되고 있지 않다는 것이다. 따라서 다양한 음성서비스 콘텐츠 제작이 매우 힘들고 표준화된 음성브라우저의 부재로 인해 개인화된 단말기의 음성서비스(개인비서 기능)을 유저들이 사용할 수 없는 실정이다.
[관련기술문헌]
1. 스마트폰의 발신자 자동 음성 알림 프로그램(Auto Voice Caller Id Program for Smartphone) (특허출원번호 제10-2011-0002233호)
2. 스마트폰의 이미지 화면을 통한 양방향 통신시스템과 그 방법(Two ways comunication system and the method using the image screen of the smart phone) (특허출원번호 제10-2012-0064751호)
본 발명은 상기의 문제점을 해결하기 위한 것으로, 스마트폰, 태블릿 PC. 스마트 TV, 네비게이션 등과 같은 스마트단말에 있어서 사용자의 지정을 통한 명령어 에 의해 즉각적이고 정밀한 스마트단말의 어플을 실행시키도록 하기 위한 음성어플실행시스템 및 방법을 제공하기 위한 것이다.
또한, 본 발명은 속도 및 환경의 변화 등과 같은 주변상황을 인식해서 자동으로 음성서비스 모드로 전환되는 지능적인 스마트폰 용 또는 정보단말기용 WEB 기반 음성 브라우저를 제공하도록 하기 위한 음성어플실행시스템 및 방법을 제공하기 위한 것이다.
또한, 본 발명은 외부에서 전화나 문자 수신되었을 때 사용자가 직접 제작한 음성시나리오 컬러링을 실행하는 브라우저 및 음성 시나리오 서버를 제공하도록 하기 위한 음성어플실행시스템 및 방법을 제공하기 위한 것이다.
그러나 본 발명의 목적들은 상기에 언급된 목적으로 제한되지 않으며, 언급되지 않은 또 다른 목적들은 아래의 기재로부터 당업자에게 명확하게 이해될 수 있을 것이다.
상기의 목적을 달성하기 위해 본 발명의 실시예에 따른 음성어플실행시스템은, 이미지를 출력하기 위한 디스플레이부(16)와 음성이 입력되고 출력되는 음성입출력부(14)와 정보를 저장하기 위한 저장부(13)와 제어부(12)를 구비하고, 음성인식모듈(12b)을 기본적으로 탑재하는 스마트단말(10)의 음성어플실행시스템에 있어서,
상기 제어부(12)는,
스마트단말(10) 내에 설치된 어플 아이콘을 화면에 출력하기 위한 아이콘출력부(11a)와 적어도 하나 이상의 명령어(B)를 입력할 수 있도록 하는 명령어입력부(11b)를 구비하는 아이콘출력 및 명령어입력수단(11)과,
상기 아이콘출력 및 명령어입력수단(11)을 통해 입력된 명령어(B)와 화면에 표시된 어플 아이콘을 서로 매칭하여 저장하고, 음성 입출력부(14)를 통해 음성이 입력되면 상기 음성을 분석하고, 분석된 음성에 대해 매칭된 어플이 저장부(13)에 존재할 경우 명령어에 해당하는 어플을 웨이크업(Wake-up) 하기 위한 어플구동모듈(12a)로 구성됨을 특징으로 한다.
또 본 발명에 있어서, 상기 스마트단말(10)은 센서부(15)를 구비하되, 상기 센서부(15)의 센서들로 부터 미리 설정된 조건에 맞는 신호가 제어부(12)에 입력되면 제어부(12)는 음성브라우저를 구동하도록 하되, 상기 음성브라우저는 사용자가 미리 설정해놓은 음성시나리오에 따라 순차적으로 어플의 각 구동메뉴를 구동할 수 있도록 구성됨을 특징으로 한다.
또 본 발명은 스마트단말(10)의 제어부(12)가 음성인식모듈(12b)을 기본적으로 탑재하고 있는 스마트단말(10)에 어플구동모듈(12a)을 설치하는 단계와, 어플구동모듈(12a)은 아이콘출력 및 명령어입력수단(11)를 통해 스마트단말(10)에 설치된 어플 아이콘을 화면에 출력하는 단계와, 상기 아이콘출력 및 명령어입력수단(11)의 아이콘출력부(11a)에 디스플레이된 어플아이콘(A)에 대해 적어도 하나 이상의 명령어(B)를 명령어입력부(11b)를 통해 입력하는 단계와, 상기 입력된 명령어(B)와 대응하는 어플 아이콘(A)을 서로 매칭하여 저장부(13)에 저장하는 단계와, 상기 어플구동모듈(12a)은 음성 입출력부(14)를 통해 음성이 입력되면 상기 음성을 분석하고, 분석된 음성에 대해 매칭된 어플이 존재할 경우 명령어에 해당하는 어플을 웨이크업(Wake-up) 하여 구동하는 단계를 포함하는 것을 특징으로 한다.
본 발명의 효과는 종래 스마트단말에 있어서 단말기 제작사 또는 브라우저를 제공하는 업체에서만 제공하던 일방적이고 획일적인 명령어에 의한 어플구동방법을 탈피하여 스마트단말 사용자들이 스스로 명령어를 지정하여 어플을 음성으로 구동시킬 수 있는 것이다.
또한 본 발명은 센서에 의해 미리 설정한 조건이 입력되면 그때부터 음성만으로도 스마트단말을 조작가능한 상태가 되도록 한다. 예를 들면 일정속도 이상이 되면 스마트단말의 조작이 음성만으로만 이루어지도록 하여 집중력 산만으로 인한 교통사고 등을 예방할 수 있도록 한다
또한 본 발명은 음성만으로 어플을 구동할 수 있도록 하기 위해 미리 작성해놓은 음성시나리오에 따라 순차적으로 어플의 각 구동메뉴를 구동할 수 있도록 함으로써 스마트단말의 편리한 이용이 가능한 매우 유용한 발명인 것이다.
도 1은 본 발명의 실시예에 따른 음성어플실행시스템의 블럭구성도.
도 2는 아이콘출력 및 명령어입력수단(11)에 의해 구현되는 음성 매칭 저장 과정을 설명하기 위한 UI 화면을 나타내는 도면.
도 3은 본 발명의 실시예에 따른 음성 어플 실행 방법을 나타내는 흐름도
이하, 본 발명의 바람직한 실시예의 상세한 설명은 첨부된 도면들을 참조하여 설명할 것이다. 하기에서 본 발명을 설명함에 있어서, 관련된 공지 기능 또는 구성에 대한 구체적인 설명이 본 발명의 요지를 불필요하게 흐릴 수 있다고 판단되는 경우에는 그 상세한 설명을 생략할 것이다.
본 명세서에 있어서는 어느 하나의 구성요소가 다른 구성요소로 데이터 또는 신호를 '전송'하는 경우에는 구성요소는 다른 구성요소로 직접 상기 데이터 또는 신호를 전송할 수 있고, 적어도 하나의 또 다른 구성요소를 통하여 데이터 또는 신호를 다른 구성요소로 전송할 수 있음을 의미한다.
도 1은 본 발명의 실시예에 따른 음성어플실행시스템의 블럭구성도이고, 도 2는 아이콘출력 및 명령어입력수단(11)에 의해 구현되는 음성 매칭 저장 과정을 설명하기 위한 UI 화면을 나타내는 도면이며, 도 3은 본 발명의 실시예에 따른 음성 어플 실행 방법을 나타내는 흐름도이다.
본 발명에서 스마트단말(10)은 음성브라우저용 표준 XML 언어로 VoiceXML(Voice eXtensible Markup Language)을 사용한다. VoiceXML은 음성 정보 서비스를 위한 대화형 마크업 언어 표준으로 일종의 음성 미들웨어의 기능을 한다. VoiceXML은 차세대 웹 기술인 XML과 음성 합성 및 인식 기술을 접목함으로써 대화형 음성 정보 서비스의 웹 기반 개발 및 운영을 가능하게 하고 음성 엔진이나 음성기술에 대한 전문적인 지식이 없는 서비스 개발자도 문서 형태로 손쉽게 음성 서비스를 제작할 수 있게 한다.
또한 스마트단말(10)은 표준화된 음성 합성 마크업 언어(Synthesis Markup Language)와 음성 인식 마크업 언어(Grammar Markup Language)를 적용함으로써 보다 유연하고 확장성 있는 음성 브라우저 플랫폼을 지원할 수 있다. 이외에 스마트단말(10)은 SCXML, CCXML 등 다양한 XML 언어를 사용하여 음성브라우저를 지원 할수 있다.
본 발명의 실시예에 따른 음성어플실행시스템은, 이미지를 출력하기 위한 디스플레이부(16)와 음성이 입력되고 출력되는 음성입출력부(14)와 정보를 저장하기 위한 저장부(13)와 제어부(12)를 구비하고, 음성인식모듈(12b)을 기본적으로 탑재하는 스마트단말(10)의 음성어플실행시스템에 있어서,
상기 제어부(12)는,
스마트단말(10) 내에 설치된 어플 아이콘을 화면에 출력하기 위한 아이콘출력부(11a)와 적어도 하나 이상의 명령어(B)를 입력할 수 있도록 하는 명령어입력부(11b)를 구비하는 아이콘출력 및 명령어입력수단(11)과,
상기 아이콘출력 및 명령어입력수단(11)을 통해 입력된 명령어(B)와 화면에 표시된 어플 아이콘을 서로 매칭하여 저장하고, 음성 입출력부(14)를 통해 음성이 입력되면 상기 음성을 분석하고, 분석된 음성에 대해 매칭된 어플이 저장부(13)에 존재할 경우 명령어에 해당하는 어플을 웨이크업(Wake-up) 하기 위한 어플구동모듈(12a)로 구성된다.
이때 상기 아이콘출력부(11a)에는 스마트단말(10) 내에 설치된 어플 아이콘(A)이 위에서 아래로 순차적으로 배열하도록 하고, 상기 순차적으로 배열된 각 어플 아이콘(A)의 측방향에는 적어도 하나 이상의 명령어(B)를 입력할 수 있도록 하는 명령어입력창이 저장버튼과 함께 표시되도록 구성됨이 바람직하다.
상기 제어부(12)는 아이콘출력 및 명령어입력수단(11)과, 어플구동모듈(12a)과, 음성인식모듈(12b)을 구비하고, 또한 이들을 제어하는 기능을 갖는다.
상기 아이콘출력 및 명령어입력수단(11)은 도 2에 도시한 바와 같이 표현될 수 있으며, 이로 인해 어플 아이콘(A)과 명령어를 디스플레이부(16) 상에 시각적으로 표시되는 것이어서 명령어와 상기 명령어에 의해 구동되는 어플을 매칭하여 저장할 수 있게 되는 것이다.
좀더 상세하게 설명하면 상기 아이콘출력 및 명령어입력수단(11)은 디스플레이부(16)에 표현되어지되 일측에는 어플 아이콘(A)의 이미지를 노출시킬 수 있는 부분과, 타측에는 상기 각각의 어플 아이콘(A)에 매칭할 적어도 하나 이상의 명령어를 입력할 부분이 표현되는 구조이다. 이처럼 어플 아이콘(A)과 명령어는 서로 매칭된 상태로 저장부(13)에 저장된다.
이때 어플 아이콘(A)의 이미지와 명령어를 매칭시킨다는 의미는 명령어가 음성 입출력부(14)를 통해 입력되면 상기 명령어에 매칭시켰던 어플 아이콘(A)에 해당하는 어플, 즉 해당 프로그램이 실제 실행되는 것을 의미한다. 이는 음성이라는 수단을 이용할 뿐 종래 사용자가 모니터(디스플레이부) 상에 표시된 어플아이콘을 터치하여 구동하는 것과 같은 행위인 것이다.
따라서 본 발명은 제조사 또는 스마트기기 브라우저 제작사가 미리 제공한 획일화된 음성만으로 어플을 구동하는 방식에서 벗어나 사용자 자신이 원하는 명령어로 어플을 구동할 수 있게 된다. 또한 본 발명은 본인의 목소리를 인식가능하도록 구성할 수도 있어 타인이 동일한 명령어를 말하더라도 본인의 스마트기기에서는 어플이 구동되지 않도록 할 수 있으며, 이로 인해 본인의 스마트기기를 타인이 사용하는 것을 제한할 수도 있는 것이다.
이를 카메라 어플에 대해 국한하여 예를 들어 설명하면 다음과 같다.
본 발명을 실행시키면 디스플레이부(16)에 도 4와 같은 아이콘출력 및 명령어입력수단(11)이 표시된다. 물론 명령어를 입력하기 전에는 명령어입력부(11b)의 명령어 입력칸은 빈 상태일 것이다.
상기 명령어입력부(11b)에 해당 명령어를 타이핑하면 상기 명령어는 일측에 표시된 아이콘과 매칭되고, 저장버튼을 누르면 저장부(13)에 저장될 것이며, 이처럼 저장된 해당 명령어가 음성입출력부(14)를 통해 입력되면 제어부(12)는 상기 명령어에 매칭된 어플을 구동하게 될 것이다.
즉 사용자가 제1명령어로는 "카메라" 라고 입력하고, 제2명령어로는 "사진기"라고 저장하였다면 이후 제어부(12)는 음성입출력부(14)를 통해 "카메라" 또는 "사진기"라는 음성이 입력되면 카메라 어플을 실행시키게 된다.
본 발명의 보다 진보된 기술로는 상기 실행된 카메라 어플에 대해서도 명령어에 의해 다양한 메뉴를 구동하게 구성할 수도 있는바, 상기 모든 메뉴를 하나하나 명령어와 매칭시켜 두었다면 실행된 카메라 어플에 해당 명령어를 말하는 것만으로도 카메라어플의 각 메뉴들은 실행될 것이다.
예를 들면 카메라어플의 메뉴 중 하나인 촬영메뉴에 대해 "찍어" 또는 "셋" 라는 명령어를 매칭시켰다면 카메라어플 구동 중에 입력된 "찍어" 또는 "셋" 라는 음성에 어플은 반응하여 사진을 촬영하게 될 것이다.
물론 이외에도 다양한 명령어에 의해 카메라 어플은 다양한 메뉴를 작동하게 할 수도 있으며, 카메라 외에도 모든 어플에 대해 이처럼 매칭된 명령어로 구동할 수 있을 것이다.
예를 들면 “전화”에 대한 음성명령어에 의해 전화통화어플을 실행할 수도 있으며, 전화 자판이 디스플레이부(16)에 구현된다. 이후“1번”이라는 음성 명령어에 의해 1번에 저장된 단축번호로 전화가 걸리도록 제어할 수도 있다.
상기 제어부(12)의 어플구동모듈(12a)은 아이콘출력 및 명령어입력수단(11)를 통해 스마트단말(10)에 설치된 어플 아이콘을 화면에 출력되도록 하고, 입력된 하나 이상의 명령어(B)를 명령어입력부(11b)를 통해 입력되도록 하며, 상기 입력된 명령어(B)와 대응하는 어플 아이콘(A)을 서로 매칭하여 저장부(13)에 저장하고, 음성 입출력부(14)를 통해 음성이 입력되면 상기 음성을 분석한 다음 분석된 음성에 대해 매칭된 어플이 존재할 경우 상기 명령어에 해당하는 어플을 웨이크업(Wake-up) 하여 구동하는 기능을 한다.
상기 음성인식모듈(12b)은 어플구동모듈(12a)에 의해 구동된 어플의 동작을 STT(Speech To Text) 기반으로 음성 인식에 따른 명령어 해석을 수행하기 위한 기능을 한다.
본 발명에 있어서 제어부(12)도 프로그램의 일종이며, 또한 음성브라우저의 다른 표현으로 사용된 것이다.
따라서 상기 제어부(12)를 구동하기 위해서는 디스플레이부(16)에 출력된 제어부구동어플아이콘의 터치에 의해서도 가능하고, 또 미리 설정한 센서의 신호에 의해서도 가능하며, 또한 미리 매칭시켜둔 명령어에 의해서도 음성으로도 구동 가능하다.
특히 센서부(15)에 의해 주변상황을 스스로 인식해서 제어부(12)를 구동하고자 하는 경우에는 다양한 센서들이 사용될 수 있다. 예를 들면 근접센서의 인식시에는 음성모드로만 스마트단말(10)을 사용할 수 있도록 하고, 또 자이로센서의 센싱에 의해 휴대폰이 뒤집어진 것을 인식하면 그때부터는 음성모드로만 통화가 가능하게 한다든지 하여 다양한 목적으로 이를 활용할 수 있도록 한다. 물론 상기 센서부(15)를 대신해 설치된 어플 또는 미리 단말기에 내장되어 있는 자체프로그램 들이 그 기능을 대신할 수도 있다.
즉 스마트단말(10)이 스마트폰이나 네비게이션인 경우 많은 사용자들이 걸으면서 또는 운전중 통화를 시도하는 바 이는 사고의 우려가 높은 것이어서 이와 같이 상황처럼 미리 설정된 센서(GPS)의 신호가 입력되어 사용자가 이동중(설정된 주변상황)이라고 판단되면 제어부(12)는 스마트단말(10)이 자동으로 음성모드로 전환 되도록 구성할 수도 있다.
또 이처럼 스마트단말(10)이 음성모드로 전환되면 제어부(12)는 이후 사용자가 미리 설정한 음성시나리오에 의해서만 어플(프로그램)이 실행되도록 하고, 또 구동된 어플(프로그램)의 메뉴를 순차적으로 실행할 수 있도록 할 수도 있다.
이때 음성모드로 전환되면 제어부(12)는 이후 음성에 의해서만 스마트단말(10)이 작동되도록 한다. 이를 위해서는 사용자가 미리 정해둔 명령어 흐름(이를 "음성시나리오"라 한다)에 의해 프로그램(어플)이 실행되도록 하고, 또 구동된 프로그램(어플)의 메뉴가 순차적으로 실행되도록 한다.
즉 음성시나리오를 네비게이션의 목적지찾기서비스(어플)를 이용하는 경우로 가정하여 설명하면 "주소"라고 명령하면 주소입력창이 디스플레이부(16)에 표시되고, 다시 "가고싶은 장소의 주소"를 말하면 주소입력창에 주소가 입력되며,“시작”하고 명령하면 목적지를 안내하는 순서로 이루어지도록 구성될 것이다.
본 발명에 있어 통신망(20)은 대용량, 장거리 음성 및 데이터 서비스가 가능한 대형 통신망의 고속 기간 망인 통신망이며, 인터넷(Internet) 또는 고속의 멀티미디어 서비스를 제공하기 위한 차세대 유선 및 무선 망일 수 있다. 통신망(20)이 이동통신망일 경우 동기식 이동 통신망일 수도 있고, 비동기식 이동 통신망일 수도 있다. 비동기식 이동 통신망의 일 실시 예로서, WCDMA(Wideband Code Division Multiple Access) 방식의 통신망을 들 수 있다. 이 경우 도면에 도시되진 않았지만, 이동통신망(20)은 RNC(Radio Network Controller)을 포함할 수 있다. 한편, WCDMA망을 일 예로 들었지만, 3G LTE망, 4G망 등 차세대 통신망, 그 밖의 IP를 기반으로 한 IP망일 수 있다. 통신망(20)은 스마트단말(10)과 서버(30), 그 밖의 시스템 상호 간의 신호 및 데이터를 상호 전달하는 역할을 한다.
또 본 발명에 있어 서버(30)는 스마트단말(10)과 네트워크를 설정하고자 할 때 필요한 구성이다.
도 3은 본 발명의 실시예에 따른 음성 어플 실행 방법을 나타내는 흐름도이다.
본 발명은 음성인식모듈(12b)을 기본적으로 탑재하고 있는 스마트단말(10)에 어플구동모듈(12a)을 설치하는 단계(S1)와, 어플구동모듈(12a)은 아이콘출력 및 명령어입력수단(11)를 통해 스마트단말(10)에 설치된 어플 아이콘을 디스플레이부(16)에 출력하는 단계(S2)와, 상기 디스플레이부(16)에 출력된 어플아이콘(A)과 매칭되는 적어도 하나 이상의 명령어(B)를 선택하여 명령어입력부(11b)를 통해 입력하는 단계(S3)와, 상기 입력된 명령어(B)와 대응하는 어플 아이콘(A)을 서로 매칭시켜 저장부(13)에 저장하는 단계(S4)와, 음성 입출력부(14)를 통해 음성이 입력되면 상기 음성을 분석하고, 분석된 음성에 대해 매칭된 어플이 존재할 경우 명령어에 해당하는 어플을 웨이크업(Wake-up) 하여 구동하는 단계(S5)를 포함한다.
이때 아이콘출력 및 명령어입력수단(11)의 아이콘 출력부(11a)에는 설치된 어플의 어플아이콘이 미리 표시되도록 구성되지만, 본 발명의 다른 실시예로 아이콘을 상기 아이콘 출력부(11a)에 드래그시키는방식으로 입력하여 타이핑된 명령어와 매칭되도록 구성할 수도 있다.
본 발명은 또한 컴퓨터로 읽을 수 있는 기록매체에 컴퓨터가 읽을 수 있는 코드로서 구현하는 것이 가능하다. 컴퓨터가 읽을 수 있는 기록매체는 컴퓨터 시스템에 의하여 읽혀질 수 있는 데이터가 저장되는 모든 종류의 기록 장치를 포함한다.
컴퓨터가 읽을 수 있는 기록매체의 예로는 ROM, RAM, CD-ROM, 자기테이프, 플로피 디스크, 광 데이터 저장장치 등이 있으며, 또한 캐리어 웨이브(예를 들어, 인터넷을 통한 전송)의 형태로 구현되는 것도 포함한다.
또한 컴퓨터가 읽을 수 있는 기록매체는 네트워크로 연결된 컴퓨터 시스템에 분산되어, 분산방식으로 컴퓨터가 읽을 수 있는 코드가 저장되고 실행될 수 있다. 그리고 본 발명을 구현하기 위한 기능적인(functional) 프로그램, 코드 및 코드 세그먼트들은 본 발명이 속하는 기술 분야의 프로그래머들에 의해 용이하게 추론될 수 있다.
이상과 같이, 본 명세서와 도면에는 본 발명의 바람직한 실시예에 대하여 개시하였으며, 비록 특정 용어들이 사용되었으나, 이는 단지 본 발명의 기술 내용을 쉽게 설명하고 발명의 이해를 돕기 위한 일반적인 의미에서 사용된 것이지, 본 발명의 범위를 한정하고자 하는 것은 아니다. 여기에 개시된 실시예 외에도 본 발명의 기술적 사상에 바탕을 둔 다른 변형 예들이 실시 가능하다는 것은 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자에게 자명한 것이다.
10: 스마트단말
11: 아이콘출력 및 명령어입력수단
12: 제어부
12a: 어플구동모듈
12b: 음성인식모듈
13: 저장부
14: 음성 입출력부
16: 디스플레이부
20: 통신망
30: 서버

Claims (7)

  1. 이미지를 출력하기 위한 디스플레이부(16)와 음성이 입력되고 출력되는 음성입출력부(14)와 정보를 저장하기 위한 저장부(13)와 제어부(12)를 구비하고, 음성인식모듈(12b)을 기본적으로 탑재하는 스마트단말(10)의 음성어플실행시스템에 있어서,
    상기 제어부(12)는,
    스마트단말(10) 내에 설치된 어플 아이콘을 화면에 출력하기 위한 아이콘출력부(11a)와 적어도 하나 이상의 명령어(B)를 입력할 수 있도록 하는 명령어입력부(11b)를 구비하는 아이콘출력 및 명령어입력수단(11)과,
    상기 아이콘출력 및 명령어입력수단(11)을 통해 입력된 명령어(B)와 화면에 표시된 어플 아이콘을 서로 매칭하여 저장하고, 음성 입출력부(14)를 통해 음성이 입력되면 상기 음성을 분석하고, 분석된 음성에 대해 매칭된 어플이 저장부(13)에 존재할 경우 명령어에 해당하는 어플을 웨이크업(Wake-up) 하기 위한 어플구동모듈(12a)로 구성됨을 특징으로 하는 음성어플실행시스템.
  2. 청구항 1에 있어서, 상기 아이콘출력부(11a)에는 스마트단말(10) 내에 설치된 어플 아이콘이 위에서 아래로 순차적으로 배열하도록 하고, 상기 순차적으로 배열된 각 어플 아이콘의 측방향에는 적어도 하나 이상의 명령어(B)를 입력할 수 있도록 하는 명령어입력창이 저장버튼과 함께 표시되도록 구성됨을 특징으로 하는 음성어플실행시스템.
  3. 청구항 1에 있어서, 상기 스마트단말(10)은 센서부(15)를 구비하되, 상기 센서부(15)의 센서들로 부터 미리 설정된 조건에 맞는 신호가 제어부(12)에 입력되면 제어부(12)는 음성브라우저를 구동하도록 하되, 상기 음성브라우저는 사용자가 미리 설정해놓은 음성시나리오에 따라 순차적으로 어플의 각 구동메뉴를 구동할 수 있도록 구성됨을 특징으로 하는 음성어플실행시스템
  4. 음성인식모듈(12b)을 기본적으로 탑재하고, 제어부(12)를 구비하는 스마트단말(10)에 어플구동모듈(12a)을 설치하는 단계와,
    어플구동모듈(12a)은 아이콘출력 및 명령어입력수단(11)를 통해 스마트단말(10)에 설치된 어플 아이콘을 디스플레이부(16)에 출력하는 단계와,
    상기 디스플레이부(16)에 출력된 어플아이콘(A)과 매칭되는 적어도 하나 이상의 명령어(B)를 선택하여 명령어입력부(11b)를 통해 입력하는 단계와,
    상기 입력된 명령어(B)와 대응하는 어플 아이콘(A)을 서로 매칭시켜 저장부(13)에 저장하는 단계와,
    음성 입출력부(14)를 통해 음성이 입력되면 상기 음성을 분석하고, 분석된 음성에 대해 매칭된 어플이 존재할 경우 명령어에 해당하는 어플을 웨이크업(Wake-up) 하여 구동하는 단계를 포함하는 것을 특징으로 하는 음성을 이용한 스마트단말 어플 실행 방법.
  5. 제 4항에 있어서, 상기 아이콘출력 및 명령어입력수단(11)의 아이콘 출력부(11a)에는 스마트단말(10)에 설치된 어플 아이콘을 드래그시켜서 입력함으로써 입력된 명령어와 매칭되도록 하는 단계를 포함하는 것을 특징으로 하는 음성을 이용한 스마트단말 어플 실행 방법
  6. 제 4항에 있어서, 상기 제어부(12)는 미리 설정된 센서의 신호가 입력되면 스마트단말(10)이 음성모드로 전환 되도록 하는 단계를 포함하는 것을 특징으로 하는 음성을 이용한 스마트단말 어플 실행 방법
  7. 제 6항에 있어서, 상기 제어부(11)에 스마트단말(10)이 음성모드로 전환되면 제어부(12)는 이후 사용자가 미리 설정한 음성시나리오에 의해서만 어플(프로그램)이 실행되도록 하고, 또 구동된 어플(프로그램)의 메뉴를 순차적으로 실행할 수 있도록 하는 단계를 포함하는 것을 특징으로 하는 음성을 이용한 스마트단말 어플 실행 방법



KR1020140016460A 2014-02-13 2014-02-13 음성어플실행시스템 및 방법 KR20150095307A (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020140016460A KR20150095307A (ko) 2014-02-13 2014-02-13 음성어플실행시스템 및 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020140016460A KR20150095307A (ko) 2014-02-13 2014-02-13 음성어플실행시스템 및 방법

Publications (1)

Publication Number Publication Date
KR20150095307A true KR20150095307A (ko) 2015-08-21

Family

ID=54058356

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020140016460A KR20150095307A (ko) 2014-02-13 2014-02-13 음성어플실행시스템 및 방법

Country Status (1)

Country Link
KR (1) KR20150095307A (ko)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018164445A1 (en) * 2017-03-06 2018-09-13 Samsung Electronics Co., Ltd. Electronic device and method for controlling application thereof
WO2020091183A1 (ko) * 2018-10-30 2020-05-07 삼성전자주식회사 사용자 특화 음성 명령어를 공유하기 위한 전자 장치 및 그 제어 방법
US11244118B2 (en) 2019-08-01 2022-02-08 Samsung Electronics Co., Ltd. Dialogue management method based on dialogue management framework and apparatus thereof
CN115202545A (zh) * 2021-04-12 2022-10-18 广州视睿电子科技有限公司 基于接口的事件触发方法、模块、学习机及存储介质

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018164445A1 (en) * 2017-03-06 2018-09-13 Samsung Electronics Co., Ltd. Electronic device and method for controlling application thereof
WO2020091183A1 (ko) * 2018-10-30 2020-05-07 삼성전자주식회사 사용자 특화 음성 명령어를 공유하기 위한 전자 장치 및 그 제어 방법
US11972761B2 (en) 2018-10-30 2024-04-30 Samsung Electronics Co., Ltd. Electronic device for sharing user-specific voice command and method for controlling same
US11244118B2 (en) 2019-08-01 2022-02-08 Samsung Electronics Co., Ltd. Dialogue management method based on dialogue management framework and apparatus thereof
CN115202545A (zh) * 2021-04-12 2022-10-18 广州视睿电子科技有限公司 基于接口的事件触发方法、模块、学习机及存储介质
CN115202545B (zh) * 2021-04-12 2024-05-14 广州视睿电子科技有限公司 基于接口的事件触发方法、模块、学习机及存储介质

Similar Documents

Publication Publication Date Title
EP3396665A1 (en) Voice data processing method and electronic device supporting the same
US9733895B2 (en) Method for controlling electronic apparatus based on voice recognition and motion recognition, and electronic apparatus applying the same
CN110610699B (zh) 语音信号处理方法、装置、终端、服务器及存储介质
EP3416045A1 (en) Method for controlling a display, device, and storage medium
US9218052B2 (en) Framework for voice controlling applications
US20130035942A1 (en) Electronic apparatus and method for providing user interface thereof
US20130041665A1 (en) Electronic Device and Method of Controlling the Same
KR20150089145A (ko) 음성 제어를 수행하는 디스플레이 장치 및 그 음성 제어 방법
US20190012153A1 (en) Method and device for supporting multi-framework syntax
JP2018508086A (ja) 入力処理方法、装置及び機器
CN106126725B (zh) 页面显示方法及装置
EP3012750A1 (en) Method and device for identifying encoding of web page
KR20150054490A (ko) 음성인식 시스템, 음성인식 서버 및 디스플레이 장치의 제어방법
US20200075008A1 (en) Voice data processing method and electronic device for supporting same
CN111240635A (zh) 信息处理方法、装置、终端、服务器及存储介质
KR20150095307A (ko) 음성어플실행시스템 및 방법
US10929009B2 (en) Electronic device for outputting graphic indication
CN111273899A (zh) 代码处理方法、装置、电子设备及存储介质
KR20190068133A (ko) 오디오 데이터에 포함된 음소 정보를 이용하여 어플리케이션을 실행하기 위한 전자 장치 및 그의 동작 방법
KR102334299B1 (ko) 음성 정보 처리 방법, 장치, 프로그램 및 저장 매체
CN107463372B (zh) 一种数据驱动的页面更新方法和装置
CN111061452A (zh) 用户界面的语音控制方法和装置
US11210449B2 (en) Page display method and device and storage medium
CN109992754B (zh) 文档处理方法及装置
CN103428339A (zh) 通过语音输入控制手机进行操作的方法

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E601 Decision to refuse application