KR20060093424A - 멀티모달 플랫폼을 이용한 정보검색 시스템 및 그 방법 - Google Patents

멀티모달 플랫폼을 이용한 정보검색 시스템 및 그 방법 Download PDF

Info

Publication number
KR20060093424A
KR20060093424A KR1020050014168A KR20050014168A KR20060093424A KR 20060093424 A KR20060093424 A KR 20060093424A KR 1020050014168 A KR1020050014168 A KR 1020050014168A KR 20050014168 A KR20050014168 A KR 20050014168A KR 20060093424 A KR20060093424 A KR 20060093424A
Authority
KR
South Korea
Prior art keywords
subscriber
platform
voice
information
modal
Prior art date
Application number
KR1020050014168A
Other languages
English (en)
Other versions
KR100679394B1 (ko
Inventor
김경민
Original Assignee
에스케이 텔레콤주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 에스케이 텔레콤주식회사 filed Critical 에스케이 텔레콤주식회사
Priority to KR1020050014168A priority Critical patent/KR100679394B1/ko
Publication of KR20060093424A publication Critical patent/KR20060093424A/ko
Application granted granted Critical
Publication of KR100679394B1 publication Critical patent/KR100679394B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9537Spatial or temporal dependent retrieval, e.g. spatiotemporal queries
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/18Speech classification or search using natural language modelling
    • G10L15/183Speech classification or search using natural language modelling using context dependencies, e.g. language models
    • G10L15/19Grammatical context, e.g. disambiguation of the recognition hypotheses based on word sequence rules
    • G10L15/193Formal grammars, e.g. finite state automata, context free grammars or word networks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W4/00Services specially adapted for wireless communication networks; Facilities therefor
    • H04W4/02Services making use of location information

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Telephonic Communication Services (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

본 발명은 멀티모달 플랫폼을 이용하여 휴대폰 어플리케이션 상에서 음성인식을 기반으로 입력수단을 삼는다. 멀티모달 플랫폼는 음서인식을 위해 ASR(Automatic Speech Recognition) 서버를 사용하는데, 상기 ASR(Automatic Speech Recognition) 서버는 ABNF(Augmented Backus-Naur Form) 형태의 자연어 그래머를 수용할 수 있으며, 이를 이용하여 자연어 인식을 수행할 수 있다.
사용자가 발성하는 명령어를 미리 준비해둔 자연어 인식 그래머를 통해 인식하게 되면, 사용자가 원하는 바를 정확히 잡아낼 수 있으며, 이를 토대로 정보검색 시스템을 통해 원하는 정보를 추출하여 사용자에게 제공하게 된다.
지식검색, 위치검색, 핸드폰 어플리케이션, 음성입력

Description

멀티모달 플랫폼을 이용한 정보검색 시스템 및 그 방법{System for Searching Information Using Multi-Modal Platform And Method Thereof}
본 명세서에서 첨부되는 다음의 도면 들은 본 발명의 바람직한 실시예를 예시하는 것이며, 후술하는 발명의 상세한 설명과 함께 본 발명의 기술사상을 더욱 이해시키는 역할을 하는 것이므로, 본 발명은 그러한 도면에 기재된 사항에만 한정되어 해석되어서는 아니 된다.
도 1은 본 발명에 따른 멀티모달 플랫폼을 이용한 정보검색 시스템의 개략적인 구성도이다.
도 2는 본 발명에 따른 멀티모달 플랫폼을 이용한 정보검색 방법을 설명하기 위한 동작 흐름도이다.
< 도면의 주요 부분에 대한 부호 설명>
10: 이동통신 단말기 20: 교환기
30: Multi-Modal 플랫폼 40: ASR(Automatic Speech Recognition) 서버
50: LBS(Location Based Service) 플랫폼
60: 정보검색 서버
본 발명은 멀티모달 플랫폼을 이용한 정보검색 시스템 및 그 방법에 관한 것으로서, 보다 상세하게는 사용자로 하여금 특정 단어가 아닌 대화를 하듯이 음성 자연어를 이동통신 단말로 입력하게 함으로써, 특정 정보를 검색하고 그에 따른 결과 중에 원하는 정보를 열람 하도록 하는 멀티모달 플랫폼을 이용한 정보검색 시스템 및 그 방법에 관한 것이다.
최근에는 유선으로 특정 장소에 대한 검색을 수행하는 서비스가 눈부시게 발전하고 있다. 예를 들면, Yahoo의 "거기" 라는 서비스와 NAVER의 "지식인" 등을 통해 특정 장소를 찾거나 궁금증을 해소할 수 있다. 여기서, Yahoo의 "거기" 라는 서비스는 특정 장소를 검색하는 것으로써, 예를 들면 "여의도의 맛있는 자장면집은 어디일까?" 라고 입력하게 되면 여의도에 있는 자장면 집을 검색하여 추천수가 가장 많은 집을 결과로 출력하게 된다. 이는 수많은 사람들이 올린 음식점을 정보를 데이터베이스 화 하여 활용하게 되는 하나의 예일 뿐이다. NAVER의 "지식인" 또한 상기한 바와 유사한 검색 서비스를 사용자에게 제공한다.
최근에는, 상기한 바와 같은 유선의 서비스가 무선 왑 환경에서도 점차적으로 구현되어 가고 있다. 그러나, 서비스를 위한 무섭 왑 접속 후에라도 이용 방법에 따라 해당 메뉴를 단말기에서 일일이 찾아 키를 조작해야 하는 불편함이 있었다.
따라서, 이러한 부가 서비스 이용에 있어서의 불합리한 점을 극복하여, 사용 자가 보다 간편하면서도 효율적으로 부가 서비스를 이용할 수 있도록 하는 방법이 요구되고 있다.
따라서, 상기한 종래 기술의 제반 문제점을 해결하기 위하여 안출된 것으로서, 본 발명의 목적은 사용자로 하여금 특정 단어가 아닌 대화를 하듯이 음성 자연어를 이동통신 단말로 입력하게 함으로써, 특정 정보를 검색하고 그에 따른 결과 중에 원하는 정보를 열람 하도록 하는 멀티모달 플랫폼을 이용한 정보검색 시스템 및 그 방법을 제공 하는데 있다.
본 발명에 따른 멀티모달 플랫폼을 이용한 정보검색 시스템은, 가입자의 발성을 수집하는 음성인식 엔진을 내장하고, 가입자로부터 음성명령을 입력받은 후 그에 따른 위치기반 검색정보를 가입자에게 제공하는 이동통신 단말;
가입자의 음성명령을 입력받아 상기 이동통신 단말의 어플리케이션과 연동하여 사용자의 발성을 수집하고, 음성인식에 적당한 형태로 전처리한 후 출력하는 Multi-Modal 플랫폼;
상기 전처리된 음성을 입력받아 인식한 후 그 결과를 Multi-Modal 플랫폼 으로 출력하는 ASR(Automatic Speech Recognition) 서버;
상기 Multi-Modal 플랫폼의 요청에 의해 가입자의 위치를 조회하고, 그 응답을 내려주는 LBS(Location Based Service) 플랫폼; 및
내장된 데이터베이스에 지식정보 또는 위치기반 정보를 저장하고 있으며, 상기 Multi-Modal 플랫폼으로부터 가입자의 위치기반 정보검색 요청에 따라, 적절한 정보를 검색한 후 그 검색결과를 상기 Multi-Modal 플랫폼으로 제공하는 정보검색 서버를 포함하는 것을 특징으로 한다.
본 발명에 따른 멀티모달 플랫폼을 이용한 정보검색 방법은, A) 상기 이동통신 단말가, 가입자의 위치기반 정보검색에 따른 자연어 질의를 음성 형태로 캡쳐하여 Multi-Modal 플랫폼으로 전송하는 단계;
B) 상기 Multi-Modal 플랫폼이, 가입자의 상기 음성명령을 입력받아 상기 ASR(Automatic Speech Recognition) 서버로 음성인식을 요청하는 단계;
C) 상기 Multi-Modal 플랫폼가, 상기 ASR(Automatic Speech Recognition) 서버로부터 음성인식 결과를 전달받은 후, LBS 플랫폼으로 가입자의 현재 위치정보를 조회하는 단계;
D) 상기 Multi-Modal 플랫폼이, 상기 LBS(Location Based Service) 플랫폼으로부터 가입자의 현재 위치정보를 응답 받는 단계;
E) 상기 Multi-Modal 플랫폼이, 가입자의 음성인식 결과 및 가입자의 위치정보를 토대로 정보검색 서버로 위치기반 정보검색을 요청하고, 상기 정보검색 서버의 데이터베이스에 저장된 정보의 검색결과를 제공 받는 단계; 및
F) 상기 Multi-Modal 플랫폼이, 가입자의 음성명령에 따른 결과를 상기 이동통신 단말로 제공하는 단계를 포함하는 것을 특징으로 한다.
따라서, 본 발명에 의하면, 가입자가 정보 단말기 또는 이동 단말기를 이용해 자신이 원하는 위치기반 검색정보를 선택하고 소정 정보를 미리 설정해 두면, 기존의 CDMA 망을 통해 본 발명에 따른 멀티모달 플랫폼을 이용한 정보검색 시스템 에 접속하게 되고, 멀티모달 인터페이스를 의해 웹서버 및 데이터베이스를 통하여 위치기반 고객 맞춤형 서비스를 가입자에게 제공하게 된다.
상기 첨부 도면의 구성요소 들에 참조부호를 부가함에 있어서는 동일한 구성요소들에 한해서 비록 다른 도면 상에 표시 되더라도 가능한 한 동일한 부호를 가지도록 하고 있음에 유의하여야 한다. 또한, 하기 설명 및 첨부 도면에서 구체적인 처리 흐름과 같은 많은 특정 상세 들이 본 발명의 보다 전반적인 이해를 제공하기 위해 나타나 있다. 이들 특정 상세 들 없이 본 발명이 실시될 수 있다는 것은 이 기술분야에서 통상의 지식을 가진 자에게 자명할 것이다. 그리고, 본 발명의 요지를 불필요하게 흐릴 수 있는 공지 기능 및 구성에 대한 상세한 설명은 생략한다.
본 발명은 특정 정보를 찾기 위해 특정단어를 입력하고, 그에 따른 결과 중에 원하는 정보를 열람하게 하는 포탈에서 제공중인 검색엔진과 그 성격이 유사하나 이동통신 단말에서 이를 구현하고, 입력방식을 타이핑이 아닌 음성입력을하도록 함으로써 특정 단어가 아닌 대화를 하듯이 자연어를 입력하게 함으로써 더욱 자연스런 입력방식을 취했다는 점이 종래기술과의 차이점이라 할 수 있다. 검색을 요청하는 가입자의 위치를 기반으로, 입력되는 자연어를 분석하여 결과를출력하기 때문에 정확성과 함께 실재 쓰임새가 높은 정보를 가입자에게 제공하게된다.
이하, 첨부된 도 1 및 도 2에 의거하여 본 발명의 바람직한 실시예를 보다 상세하게 설명하면 다음과 같다.
도 1은 본 발명에 따른 멀티모달 플랫폼을 이용한 정보검색 시스템의구성을 보인 도이다.
이에 도시된 바와 같이, 상기 시스템은, 이동통신 단말(10)과, 교환기(20)와, Multi-Modal 플랫폼(30)과, ASR(Automatic Speech Recognition) 서버(40)와, LBS(Location Based Service) 플랫폼(50)과 그리고 정보검색 서버(60)로 구성되어 있다.
상기 이동통신 단말(10)은, 통화기능이 가능한 휴대용 단말기 또는 통화기능 이외에 정보 제공용으로만 사용될 수 있는 정보 단말기의 기능 모두를 포함하는 개념으로 이하에서 기술될 것이다. 그리고, 상기 이동 단말기(10)는 위치추적 신호를 수신할 수 있는 위치추적 수신기를 내장함으로써 무선으로 현재 가입자의 위치정보를 제공 받을 수 있으며 아룰러 후술할 LBS(Location Based Service) 플랫폼(50)으로부터 가입자의 위치정보를 제공 받을 수도 있다.
또한, 상기 이동통신 단말기(10)는 위치추적 모듈(미도시)과 위치추적 통신 모듈(미도시)을 내장함으로써, 전자지도 상에서 상세위치를 확인할 수도 있다. 이때, 상기 위치추적 통신 모듈은 상기 LBS 플랫폼(50)과 통신을 하게 된다.
또한, 상기 이동통신 단말(10)은, 위치 서비스를 제공하기 위해서, 상기 Multi-Modal 플랫폼(33)과 쉽게 연동할 수 있는 단말 내의 어플리케이션, 예컨대 DSR API(Distributed Speech Recognition Application Progromming Interface)가 구비 되어야 하고, 단말에 음성인식 엔진을 내장시켜 초기 위치검색 메뉴의 인식에 사용하며, 모든 애플리케이션에 음성인식 메뉴 네비게이션 기능을 부가시킬 수 있는 체계를 구축해야 한다. 또한, 고립어 인식에 그치고 있는 현재의 음성 플랫폼 (Voice Platform)을 자연어 인식이 가능한 버전으로 업그레이드 해야 하며 인식엔진의 튜닝으로 서비스에 바로 적용할 수 있는 문법(Grammar)을 구축해야 한다.
이때, 상기 DSR API(Distributed Speech Recognition Application Progromming Interface)는, 다음과 같은 과정을 통하여 가입자의 발성을 수집하게 된다. 즉, 가입자로부터 녹음 요청에 따른 신호를 입력 받으면, WIPI(Wireless Internet Platform for Interoperability)의 녹음관련 API를 사용하여 단말의 마이크로부터 입력되는 음원을 녹음하고, 상기 녹음된 음원은 단말의 DSP(Digital Signal Processor)에 의해 EVRC로 엔코딩되며, 단말의 소정 메모리에 저장된 후에 실시간으로 상기 Multi-Modal 플랫폼(30)으로 전달된다. 이때, 상기 가입자의 음성 녹음이 진행될 때 단말기 화면의 특정위치에 녹음되는 음성의 볼륨을 나타내는 조그만 아이콘이 표시될 수도 있다.
또한, 상기 EVRC로 엔코딩된 음원은 상기 Multi-Modal 플랫폼(30)과 TCP 통신을 통해 연결되며, Multi-Modal 플랫폼(30)는 상기 음성인식된 결과를 역시 이 TCP 연결을 통해 상기 이동통신 단말로(10)로 내려주게 된다.
상기 교환기(20)는, 상기 이동통신 단말(10)과 상기 각 장치들과의 호설정 역할 만을 하기 때문에 여기서는 그 상세한 기능설명을 생략하기로 한다.
상기 Multi-Modal 플랫폼(30)는 휴대폰 어플리케이션과 연동하여 사용자의 발성을 수집하고, 음성인식에 적당한 형태로 전처리한 후 상기 ASR(Automatic Speech Recognition) 서버(40)로 전달한다.
상기 ASR(Automatic Speech Recognition) 서버(40)는, 현재 표시되는 메뉴항 목을 읽는 단순 음성명령과 여러 단계의 메뉴 트리를 가로지르는 단축 음성명령으로 구분하여 음성을 인식하게 되는데, 단순 음성명령의 경우에는, 사용자가 화면의 메뉴항목을 읽음으로써 이루어지는데, 복합단어로 구성된 메뉴항목의 경우 여러 가지 대체 레이블(Alias)를 고려해야 한다. 예를 들어 "주변 시설물 찾기"와 같은 메뉴는 사용자가 "주변 시설물"과 같이 줄여서 한 단어로 말할 수도 있기 때문에, 사용자의 편의를 위한 여러 가지대체 레이블(Alias)이 문법(Grammar)에 추가된다.
한편, 단축 음성명령의 경우에는, 단말의 애플리케이션을 사용하는 사용자의 발성패턴(Corpus)을 수집하여 메뉴단계를 거치지 않고, 한번에 명령을 내리는 기능이다. 예를들어 "서울 시청으로 길안내"와 같은 발성에 대해서 "길안내" 선택과 더불어 "서울 시청"이라는 POI(Point Of Interest) 까지 선택 해주어 사용자의 편의를 제공한다. 상기 단축 음성명령을 지원하기 위해서는 상기 ASR(Automatic Speech Recognition) 서버(40)가 연속어 인식이 가능해야 하며, 문법(Grammar)이 ABNF(Augmented Backus-Naur Form) 형식이나 이와 동등한 형식의 문법구조를 수용할 수 있도록 구현된다.
상기 LBS 플랫폼(50)은, 상기 ASR(Automatic Speech Recognition) 서버(40)에 의해 인식된 가입자의 위치기반 음성명령을 전달받은 후, 상기 Multi-Modal 플랫폼(30)의 요청에 의해 가입자의 위치를 조회하고, 그 응답을 내려준다.
상기 정보검색 서버(60)는, 내장된 데이터베이스에 지식정보 또는 위치기반 정보를 저장하고 있으며, 상기 Multi-Modal 플랫폼(30)으로부터 가입자의 위치기반 정보검색 요청에 따라, 적절한 정보를 검색한 후 그 검색결과를 상기 Multi-Modal 플랫폼(30)으로 제공한다.
도 2는 본 발명에 따른 멀티모달 플랫폼을 이용한 정보검색 방법을 설명하기 위한 동작 흐름도이다.
먼저, 가입자는 상기 이동통신 단말(10)의 왑 브라우저를 이용해 특정지역에 따른 정보를 검색하기 위하여 소정 컨텐츠에 접속한다.
이후, 상기 이동통신 단말(10)은 가입자의 위치기반 정보검색에 따른 자연어 질의를 음성 형태로 캡쳐하여 상기 Multi-Modal 플랫폼(30)으로 전송한다(S201). 이때, 상기 가입자의 음성명령은, 상기한 바와 같이, 단순 음성명령과 여러 단계의 메뉴 트리를 가로지르는 단축 음성명령으로 구분될 수 있다.
또한, 상기의 경우, 가입자는 상기 이동통신 단말(10)를 통해 왑으로 접속한 후 나타나는 기본 창에서 지역검색을 선택하게 된다. 이때, 가입자로 하여금 음성입력을 유도하기 위해 "어디를 찾고 계신지 말씀해 주세요" 라는 멘트가 출력되고 바로 음성입력을 받기 위한 대기상태로 접어든다. 가입자는 "나와 가장 가깝고 맛있는 자장면 집" 하고 말을 하고, 이를 자연어로 인식하여 상기 정보검색 서버(60)에 접근할 수 있는 몇 단어로 축약 시킨다.
이후, 상기 Multi-Modal 플랫폼(30)은 가입자의 상기 음성명령을 입력받아 상기 ASR(Automatic Speech Recognition) 서버(40)로 음성인식을 요청한다(S202).
이후, 상기 Multi-Modal 플랫폼(30)은 상기 ASR(Automatic Speech Recognition) 서버(40)로부터 음성인식결과를 전달받은 후(S203), 상기 LBS 플랫폼(40)을 통해 가입자의 현재 위치정보를 조회한다(S204). 이때, 상기 Multi-Modal 플랫폼(30)은, 위치추적 신호를 수신할수 있는 위치추적 수신기를 내장한 상기 이동통신 단말(10)로부터 무선으로 현재 가입자의 위치정보를 제공 받을 수도 있다.
이후, 상기 Multi-Modal 플랫폼(30)은 상기 LBS(Location Based Service)
플랫폼(40)으로부터 가입자의 현재 위치정보를 응답 받는다(S205).
이후, 상기 Multi-Modal 플랫폼(30)은, 가입자의 음성인식 결과 및 가입자의 위치정보를 토대로 상기 정보검색 서버(60)로 위치기반 정보검색을 요청하고(S206), 상기 정보검색 서버(50)의 데이터베이스에 저장된 정보의 검색결과를 응답 받는다(S207). 따라서, 상기 Multi-Modal 플랫폼(30)은 자연어를 처리하는 과정을 통해 입력한 가입자의 위치정보를 파악하여 고객과 가장 가까운 장소에 따른 적정정보를 결과로 뽑아 낼 수 있게 된다.
최종적으로, 상기 Multi-Modal 플랫폼(30)은 가입자의 음성명령에 따른 결과를 상기 이동통신 단말(10)로 제공하게 된다(S208). 따라서, 가입자는 해당 장소의 약도와 전화번호를 제공받게 되어 만족한 결과를 얻게 된다.
한편, 상기 Multi-Modal 플랫폼(30)은 상기 자연어를 인식하여 가입자에게 정확한 결과값을 주고자 할 때, 가입자에게 "고객님이 계신 근처에는 원하시는장소가 없습니다. 근처 다른지역을 검색해 드릴까요?" 라는 식으로 한 두번의 질의를 할 수도 있다. 이렇게함으로서 검색고자 하는 결과 값을 좀 더 정확하게 할 수 있으며, 인터렉티브(Interactive)한 사용방법으로 인해 사용상에 편의성을더할 수도 있다.
이상에서 상세히 설명한 바와 같이, 본 발명에 따른 멀티모달 플랫폼을 이용 한 정보검색 시스템 및 그 방법은, 기존의 웹 포탈에서 제공하던 검색엔진 서비스를 단말에서 구현하고, 입력방식을 타이핑이 아닌 음성입력을 하도록 하되, 특정 단어가 아닌 대화를 하듯이 자연어를 입력하도록 함으로써 더욱 자연스런 입력방식을 취하고, 검색을 요청하는 이의 위치를 기반으로 입력하는 자연어 를분석하여 결과를 출력하기 때문에 정확성과 함께 실재 쓰임새가 높은 정보를 가입자는 얻게 된다.
이상에서는 본 발명을 특정의 바람직한 실시예로서 설명하였으나, 본 발명은 상기한 실시예에 한정되지 아니하며, 특허 청구의 범위에서 청구하는 본 발명의 요지를 벗어남이 없이 당해 발명이 속하는 분야에서 통상의 지식을 가진 자라면 누구든지 다양한 변형이 가능할 것이다.
따라서, 본 발명에 의하면, 언제 어디서나 원하는 정보를 검색할 뿐 아니라 가고자 하는 위치를 손쉽게 파악할 수 있다. 또한, 사용자의 위치를 기본으로하기 때문에 먼 곳에 있는 정보가 아닌 자신과 가장 가까운 정보를 제공해 줌으로써 일반적인 정보가 아닌 검색을 하는 목적에 맞는 실재 정보라 할 수 있다. 더불어, 본 발명에 따른 멀티모달 플랫폼은 음성입력 및 출력을 기반으로 하기 때문에 타이핑의 번거로움을 최소화 할 수 있는 장점을 지니며, 향후 TTS(Text To Speech)와 함께 구현되면 운전 중에도 편하게 사용할 수 있게 될 것이며, 다양한 데이터베이스를 갖춰지역정보 뿐만 아니라 다양한 검색 서비스에도 적용할 것으로 기대된다.

Claims (12)

  1. 가입자의 발성을 수집하는 음성인식 엔진을 내장하고, 가입자로부터 음성명령을 입력받은 후 그에 따른 위치기반 검색정보를 가입자에게 제공하는 이동통신 단말;
    가입자의 음성명령을 입력받아 상기 이동통신 단말의 어플리케이션과 연동하여 사용자의 발성을 수집하고, 음성인식에 적당한 형태로 전처리한 후 출력하는 Multi-Modal 플랫폼;
    상기 전처리된 음성을 입력받아 인식한 후 그 결과를 Multi-Modal 플랫폼 으로 출력하는 ASR(Automatic Speech Recognition) 서버;
    상기 Multi-Modal 플랫폼의 요청에 의해 가입자의 위치를 조회하고, 그 응답을 내려주는 LBS(Location Based Service) 플랫폼; 및
    내장된 데이터베이스에 지식정보 또는 위치기반 정보를 저장하고 있으며, 상기 Multi-Modal 플랫폼으로부터 가입자의 위치기반 정보검색 요청에 따라, 적절한 정보를 검색한 후 그 검색결과를 상기 Multi-Modal 플랫폼으로 제공하는 정보검색 서버를 포함하는 것을 특징으로 하는 멀티모달 플랫폼을 이용한 정보검색 시스템.
  2. 제 1 항에 있어서, 가입자의 발성은,
    자연어 인 것을 특징으로 하는 무선 인터넷을 위한 Multi-Modal 브라우저가 내장되는 것을 특징으로 하는 멀티모달 플랫폼을 이용한 정보검색 시스템.
  3. 제 1 항에 있어서, 상기 이동통신 단말은,
    상기 가입자의 음성 녹음이 진행될 때 단말기 화면의 특정위치에 녹음되는 음성의 볼륨을 나타내는 조그만 아이콘이 표시할 수 있는 것을 특징으로 하는멀티모달 플랫폼을 이용한 정보검색 시스템.
  4. 제 1 항에 있어서, 상기 이동통신 단말의 에플리케이션은,
    DSR API(Distributed Speech Recognition Application Progromming Interface)를 구비하며, 가입자로부터 녹음 요청에 따른 신호를 입력 받으면, WIPI(Wireless Internet Platform for Interoperability)의 녹음관련 API를 사용하여 단말의 마이크로부터 입력되는 음원을 녹음하고, 상기 녹음된 음원은 단말의 DSP(Digital Signal Processor)에 의해 EVRC로 엔코딩되며, 단말의 소정 메모리에 저장된 후에 실시간으로 상기 Multi-Modal 플랫폼으로 전달하는 것을 특징으로 하는멀티모달 플랫폼을 이용한 정보검색 시스템.
  5. 제 1 항에 있어서, 상기 이동통신 단말 및 상기 Multi-Modal 플랫폼은,
    가입자의 음성 및 그 음성인식된 결과를 TCP 연결을 통해 상호간에 송수신하는 것을 특징으로 하는 멀티모달 플랫폼을 이용한 정보검색 시스템.
  6. 제 1 항에 있어서, 상기 ASR(Automatic Speech Recognition) 서버는,
    가입자로부터 수집된 음성을, 현재 표시되는 메뉴항목을 읽는 단순 음성명령과 여러 단계의 메뉴 트리를 가로지르는 단축 음성명령으로 구분하여 인식하는 것을 특징으로 하는 멀티모달 플랫폼을 이용한 정보검색 시스템.
  7. 제 1 항 또는 제 6 항에 있어서, 상기 ASR(Automatic Speech Recognition) 서버는,
    가입자로부터 입력되는 음성이 단순 음성명령인 경우, 사용자가 화면의 메뉴항목을 읽음으로써 이루어지는데, 사용자의 편의를 위한 여러 가지대체 레이블(Alias)이 문법(Grammar)에 추가되는 것을 특징으로 하는 멀티모달 플랫폼을 이용한 정보검색 시스템.
  8. 제 1 항 또는 제 6 항에 있어서, 상기 ASR(Automatic Speech Recognition) 서버는,
    가입자로부터 입력되는 음성이 단축 음성명령의 경우, 연속어 인식을 구현하며, ABNF(Augmented Backus-Naur Form) 형식이 문법(Grammar)에 추가되는 것을 특징으로 하는 멀티모달 플랫폼을 이용한 정보검색 시스템.
  9. A) 상기 이동통신 단말가, 가입자의 위치기반 정보검색에 따른 자연어 질의를 음성 형태로 캡쳐하여 Multi-Modal 플랫폼으로 전송하는 단계;
    B) 상기 Multi-Modal 플랫폼이, 가입자의 상기 음성명령을 입력받아 상기 ASR(Automatic Speech Recognition) 서버로 음성인식을 요청하는 단계;
    C) 상기 Multi-Modal 플랫폼가, 상기 ASR(Automatic Speech Recognition) 서버로부터 음성인식 결과를 전달받은 후, LBS 플랫폼으로 가입자의 현재 위치정보를 조회하는 단계;
    D) 상기 Multi-Modal 플랫폼이, 상기 LBS(Location Based Service) 플랫폼으로부터 가입자의 현재 위치정보를 응답 받는 단계;
    E) 상기 Multi-Modal 플랫폼이, 가입자의 음성인식 결과 및 가입자의 위치정보를 토대로 정보검색 서버로 위치기반 정보검색을 요청하고, 상기 정보검색 서버의 데이터베이스에 저장된 정보의 검색결과를 제공 받는 단계; 및
    F) 상기 Multi-Modal 플랫폼이, 가입자의 음성명령에 따른 결과를 상기 이동통신 단말로 제공하는 단계를 포함하는 것을 특징으로 하는 멀티모달 플랫폼을 이용한 정보검색 방법.
  10. 제 9 항에 있어서, 상기 가입자의 음성은, 단순 음성명령과 여러 단계의 메뉴 트리를 가로지르는 단축 음성명령으로 구분되는 것을 특징으로 하는 멀티모달 플랫폼을 이용한 정보검색 방법.
  11. 제 9 항에 있어서, 상기 Multi-Modal 플랫폼은,
    위치추적 신호를 수신할수 있는 위치추적 수신기를 내장한 이동통신 단말로부터 무선으로 현재 가입자의 위치정보를 제공 받을 수 있는 것을 특징으로 하는 멀티모달 플랫폼을 이용한 정보검색 방법.
  12. 제 9 항에 있어서, 상기 단계(F)의 이동통신 단말은,
    가입자에게 해당 장소의 약도와 전화번호를 제공하는 것을 특징으로 하는 멀티모달 플랫폼을 이용한 정보검색 방법.
KR1020050014168A 2005-02-21 2005-02-21 멀티모달 플랫폼을 이용한 정보검색 시스템 및 그 방법 KR100679394B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020050014168A KR100679394B1 (ko) 2005-02-21 2005-02-21 멀티모달 플랫폼을 이용한 정보검색 시스템 및 그 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020050014168A KR100679394B1 (ko) 2005-02-21 2005-02-21 멀티모달 플랫폼을 이용한 정보검색 시스템 및 그 방법

Publications (2)

Publication Number Publication Date
KR20060093424A true KR20060093424A (ko) 2006-08-25
KR100679394B1 KR100679394B1 (ko) 2007-02-05

Family

ID=37601534

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020050014168A KR100679394B1 (ko) 2005-02-21 2005-02-21 멀티모달 플랫폼을 이용한 정보검색 시스템 및 그 방법

Country Status (1)

Country Link
KR (1) KR100679394B1 (ko)

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20020012062A (ko) * 2000-08-05 2002-02-15 김성현 이동통신단말기의 자동위치추적 및 음성명령입력을 통한현지역정보 검색방법
KR20020057045A (ko) * 2000-12-30 2002-07-11 구자홍 음성 인식을 이용한 이동 무선 단말기의 인터넷 검색 방법
KR20020079121A (ko) * 2001-04-13 2002-10-19 김창호 이동통신 단말기를 이용한 정보 검색 시스템과 그시스템을 이용한 정보 검색방법
KR20020088921A (ko) * 2001-05-22 2002-11-29 엘지전자 주식회사 이동통신 단말기를 이용한 무선 인터넷 정보 검색 장치 및방법
KR100486030B1 (ko) * 2002-10-10 2005-04-29 와이더댄 주식회사 음성인식을 이용한 이동통신 단말기의 인터넷 사이트접속장치 및 방법
KR20050114551A (ko) * 2004-06-01 2005-12-06 에스케이 텔레콤주식회사 음성인식을 이용한 지도 검색 시스템 및 검색 방법

Also Published As

Publication number Publication date
KR100679394B1 (ko) 2007-02-05

Similar Documents

Publication Publication Date Title
US8626759B2 (en) Method and system for searching an information retrieval system according to user-specified location information
US7672931B2 (en) Searching for content using voice search queries
US8160614B2 (en) Automated concierge system and method
KR101758302B1 (ko) 컨텍스트에 기초한 음성 인식 문법 선택
US20100094707A1 (en) Method and platform for voice and location-based services for mobile advertising
JPH09330336A (ja) 情報処理装置
US7881705B2 (en) Mobile communication terminal and information acquisition method for position specification information
JP2009500720A5 (ko)
JP2005346692A (ja) ディレクトリ支援問い合わせ結果に対する完全機能型、アクション可能なアクセス
WO2009149340A1 (en) A system and method utilizing voice search to locate a procuct in stores from a phone
KR20130108173A (ko) 유무선 통신 네트워크를 이용한 음성인식 질의응답 시스템 및 그 운용방법
KR100920442B1 (ko) 휴대 단말기에서 정보 검색 방법
JPH10283362A (ja) 携帯情報端末及び記憶媒体
KR100544905B1 (ko) 여행자를 위한 의사소통 지원 시스템 및 그 서비스 방법
KR100822170B1 (ko) 음성 인식 ars 서비스를 위한 데이터베이스 구축 방법및 시스템
WO2003102816A1 (fr) Systeme fournisseur de donnees
JP2000076040A (ja) 音声入力ネットワーク端末装置
KR100679394B1 (ko) 멀티모달 플랫폼을 이용한 정보검색 시스템 및 그 방법
JP2005004782A (ja) 情報処理システム、情報処理装置および情報処理方法、並びに携帯型情報端末装置
KR100702789B1 (ko) 멀티모달 플랫폼을 이용한 모바일 서비스 시스템 및 그 방법
JP2001075968A (ja) 情報検索方法及びそれを記録した記録媒体
KR20020012062A (ko) 이동통신단말기의 자동위치추적 및 음성명령입력을 통한현지역정보 검색방법
KR20140123370A (ko) 유무선 통신 네트워크를 이용한 음성인식 질의응답 시스템 및 그 운용방법
KR101386491B1 (ko) 모바일 단말기를 이용한 다국어 지원 시스템 및 그 방법
KR100574007B1 (ko) 음성 인식 기반의 개인별 전화국 서비스 제공 시스템 및 그 방법, 상기 방법을 실행하기 위한 프로그램이 기록된 기록매체

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20121226

Year of fee payment: 7

FPAY Annual fee payment

Payment date: 20131223

Year of fee payment: 8

FPAY Annual fee payment

Payment date: 20141222

Year of fee payment: 9

FPAY Annual fee payment

Payment date: 20151223

Year of fee payment: 10

FPAY Annual fee payment

Payment date: 20161229

Year of fee payment: 11

FPAY Annual fee payment

Payment date: 20180129

Year of fee payment: 12

FPAY Annual fee payment

Payment date: 20191216

Year of fee payment: 14