KR100679394B1 - 멀티모달 플랫폼을 이용한 정보검색 시스템 및 그 방법 - Google Patents
멀티모달 플랫폼을 이용한 정보검색 시스템 및 그 방법 Download PDFInfo
- Publication number
- KR100679394B1 KR100679394B1 KR1020050014168A KR20050014168A KR100679394B1 KR 100679394 B1 KR100679394 B1 KR 100679394B1 KR 1020050014168 A KR1020050014168 A KR 1020050014168A KR 20050014168 A KR20050014168 A KR 20050014168A KR 100679394 B1 KR100679394 B1 KR 100679394B1
- Authority
- KR
- South Korea
- Prior art keywords
- subscriber
- voice
- modal
- platform
- information
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims description 34
- 230000003190 augmentative effect Effects 0.000 claims abstract description 3
- 238000010295 mobile communication Methods 0.000 claims description 31
- 230000004044 response Effects 0.000 claims description 4
- 230000006870 function Effects 0.000 description 5
- 238000004891 communication Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 230000002093 peripheral effect Effects 0.000 description 2
- 150000001875 compounds Chemical class 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 235000012149 noodles Nutrition 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9537—Spatial or temporal dependent retrieval, e.g. spatiotemporal queries
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/18—Speech classification or search using natural language modelling
- G10L15/183—Speech classification or search using natural language modelling using context dependencies, e.g. language models
- G10L15/19—Grammatical context, e.g. disambiguation of the recognition hypotheses based on word sequence rules
- G10L15/193—Formal grammars, e.g. finite state automata, context free grammars or word networks
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W4/00—Services specially adapted for wireless communication networks; Facilities therefor
- H04W4/02—Services making use of location information
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computer Networks & Wireless Communication (AREA)
- Artificial Intelligence (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Telephonic Communication Services (AREA)
Abstract
Description
예컨대, 상기 Multi-Modal 유저 인터페이스는 이동통신 단말과 같은 소형 단말기에서 음성인식 기술을 구현할 수 있는 분산음성인식기술(DSR; Distributed Speech Recognition)에 의한 API(Application Progromming Interface)로 구현되는 것이 바람직하다. 상기 분산음성인식기술에 의한 API는 이동통신 단말이나 PDA와 같은 휴대형 통신기기에서는 CPU 용량의 한계로 음성인식기술 구현이 어려운 것을 극복한 것으로 최근 주목받고 있는 기술로써, 음성인식을 위한 여러 단계의 프로세스 중에서 일부는 상기 이동통신 단말의 컴퓨팅 장치에서 처리하고, CPU 용량을 많이 차지하는 나머지 프로세스는 Multi-Modal 플랫폼의 중계를 통해 ASR 서버에서 실행하도록 구현된 어플리케이션이다.
더욱 상세하게는, 상기 이동통신 단말의 컴퓨팅 장치에서 실행하는 일부 프로세스는 사용자의 서비스 요청음성을 인가받아 상기 요청음성에 대한 특징을 추출하여 해당 데이터 스트림을 형성하고, 상기 데이터 스트림을 압축하여 상기 Multi-Modal 플랫폼으로 전송하는 과정이다. 또한, 상기 ASR 서버에서 음성인식 프로세스는 압축된 음성특징의 데이터 스트림을 네트워크를 통해 제공받아 기 저장중인 음성특징별 데이터베이스를 기반으로 사용자의 음성에 대한 분석을 실행하여 형성된 음성인식 결과를 상기 Multi-Modal 플랫폼으로 전송하는 과정이 해당된다.
또한, 상기 이동통신 단말은 Multi-Modal 유저 인터페이스의 실행을 통해 단말화면에 사용자로 하여금 서비스 안내를 확인할 수 있도록 하는 메뉴항목을 디스플레이하고, 상기 메뉴항목을 확인한 사용자의 메뉴선택을 위한 단순 음성명령과 사용자의 서비스 요청내용인 단축 음성명령을 해당 단어 또는 순차 나열된 단어의 연속인 자연어로 제공받아 해당 데이터 스트림을 형성하게 된다.
Claims (12)
- 가입자의 음성을 수신하는 Multi-Modal 유저 인터페이스를 내장하고, 상기 Multi-Modal 유저 인터페이스를 통해 가입자로부터 음성명령을 입력받은 후 그에 따른 위치기반 검색정보를 가입자에게 제공하는 이동통신 단말;상기 Multi-Modal 유저 인터페이스와 형성된 데이터 채널을 통해 가입자의 음성을 수집하고, 수집한 가입자의 발성을 취합하여 음성인식을 위한 데이터 포맷으로 변환 후 출력하는 Multi-Modal 플랫폼;상기 데이터 포맷으로 변환된 가입자의 음성을 인식한 후 그 결과를 Multi-Modal 플랫폼으로 출력하는 ASR(Automatic Speech Recognition) 서버;상기 음성인식 결과를 토대로 하는 상기 Multi-Modal 플랫폼에 의해 가입자의 위치를 조회하고, 그 응답을 내려주는 LBS(Location Based Service) 플랫폼; 및내장된 데이터베이스에 지식정보 또는 위치기반 정보를 저장하고 있으며, 상기 Multi-Modal 플랫폼으로부터 상기 음성인식 결과에 기반한 가입자의 위치기반 정보검색 요청에 따라, 상응하는 정보를 검색한 후 그 검색결과를 상기 Multi-Modal 플랫폼으로 전달하여 상기 데이터 채널을 통해 상기 이동통신 단말로 제공하기 위한 정보검색 서버를 포함하는 것을 특징으로 하는 멀티모달 플랫폼을 이용한 정보검색 시스템.
- 제 1 항에 있어서, 가입자의 음성은,자연어인 것을 특징으로 하는 무선 인터넷을 위한 Multi-Modal 브라우저가 내장되는 것을 특징으로 하는 멀티모달 플랫폼을 이용한 정보검색 시스템.
- 제 1 항에 있어서, 상기 이동통신 단말은,상기 가입자의 음성 녹음이 진행될 때, 상기 이동통신 단말기 화면의 일측에 녹음되는 음성의 볼륨을 가르키는 아이콘이 표시되는 것을 특징으로 하는 멀티모달 플랫폼을 이용한 정보검색 시스템.
- 제 1 항에 있어서, 상기 이동통신 단말의 에플리케이션은,DSR API(Distributed Speech Recognition Application Progromming Interface)를 구비하며, 가입자로부터 녹음 요청에 따른 신호를 입력 받으면, WIPI(Wireless Internet Platform for Interoperability)의 녹음관련 API를 사용하여 단말의 마이크로부터 입력되는 음원을 녹음하고, 상기 녹음된 음원은 단말의 DSP(Digital Signal Processor)에 의해 EVRC로 엔코딩되며, 단말의 소정 메모리에 저장된 후에 실시간으로 상기 Multi-Modal 플랫폼으로 전달하는 것을 특징으로 하는멀티모달 플랫폼을 이용한 정보검색 시스템.
- 제 1 항에 있어서, 상기 이동통신 단말 및 상기 Multi-Modal 플랫폼은,가입자의 음성 및 그 음성 인식된 결과를 TCP 연결을 통해 상호 간에 송수신하는 것을 특징으로 하는 멀티모달 플랫폼을 이용한 정보검색 시스템.
- 제 1 항에 있어서, 상기 ASR(Automatic Speech Recognition) 서버는,가입자로부터 수집된 음성을, 현재 표시되는 메뉴항목을 읽는 단순 음성명령과 여러 단계의 메뉴 트리를 가로지르는 단축 음성명령으로 구분하여 인식하는 것을 특징으로 하는 멀티모달 플랫폼을 이용한 정보검색 시스템.
- 제 1 항 또는 제 6 항에 있어서, 상기 ASR(Automatic Speech Recognition) 서버는,가입자로부터 입력되는 음성이 단순 음성명령인 경우, 사용자가 화면의 메뉴항목을 읽음으로써 이루어지는데, 사용자의 편의를 위한 여러가지 대체 레이블(Alias)이 문법(Grammar)에 추가되는 것을 특징으로 하는 멀티모달 플랫폼을 이용한 정보검색 시스템.
- 제 1 항 또는 제 6 항에 있어서, 상기 ASR(Automatic Speech Recognition) 서버는,가입자로부터 입력되는 음성이 단축 음성명령의 경우, 연속어 인식을 구현하며, ABNF(Augmented Backus-Naur Form) 형식이 문법(Grammar)에 추가되는 것을 특징으로 하는 멀티모달 플랫폼을 이용한 정보검색 시스템.
- A) 이동통신 단말의 Multi-Modal 유저 인터페이스가 가입자의 위치기반 정보검색에 따른 자연어 질의를 음성 형태로 캡쳐하여 데이터 채널을 통해 Multi-Modal 플랫폼으로 전송하는 단계;B) 상기 Multi-Modal 플랫폼이 상기 데이터 채널로 소통되는 가입자의 음성명령을 입력받아 음성인식을 위한 데이터 포맷으로 변환한 후, 음성인식 실행을 위한 ASR(Automatic Speech Recognition) 서버로 음성인식을 요청하는 단계;C) 상기 Multi-Modal 플랫폼이 상기 ASR(Automatic Speech Recognition) 서버로부터 음성인식 결과를 전달받은 후, 상기 음성인식 결과를 토대로 LBS 플랫폼으로 가입자의 현재 위치정보를 조회요청하는 단계;D) 상기 LBS 플랫폼이 상기 조회요청에 응답하여 생성한 가입자의 현재 위치정보를 상기 Multi-Modal 플랫폼으로 전송하는 단계;E) 상기 Multi-Modal 플랫폼이 상기 음성인식 결과 및 가입자의 위치정보를 토대로 정보검색 서버로 위치기반 정보검색을 요청하고, 상기 정보검색 서버의 데이터베이스에 저장된 정보의 검색결과를 제공받는 단계; 및F) 상기 Multi-Modal 플랫폼이 가입자의 음성명령에 따른 결과를 상기 데이터 채널을 통해 상기 이동통신 단말로 제공하는 단계를 포함하는 것을 특징으로 하는 멀티모달 플랫폼을 이용한 정보검색 방법.
- 제 9 항에 있어서, 상기 가입자의 음성은, 단순 음성명령과 여러 단계의 메뉴 트리를 가로지르는 단축 음성명령으로 구분되는 것을 특징으로 하는 멀티모달 플랫폼을 이용한 정보검색 방법.
- 제 9 항에 있어서, 상기 Multi-Modal 플랫폼은,위치추적 신호를 수신할수 있는 위치추적 수신기를 내장한 이동통신 단말로부터 무선으로 현재 가입자의 위치정보를 제공 받을 수 있는 것을 특징으로 하는 멀티모달 플랫폼을 이용한 정보검색 방법.
- 제 9 항에 있어서, 상기 단계(F)의 이동통신 단말은,가입자에게 해당 장소의 약도와 전화번호를 제공하는 것을 특징으로 하는 멀티모달 플랫폼을 이용한 정보검색 방법.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020050014168A KR100679394B1 (ko) | 2005-02-21 | 2005-02-21 | 멀티모달 플랫폼을 이용한 정보검색 시스템 및 그 방법 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020050014168A KR100679394B1 (ko) | 2005-02-21 | 2005-02-21 | 멀티모달 플랫폼을 이용한 정보검색 시스템 및 그 방법 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20060093424A KR20060093424A (ko) | 2006-08-25 |
KR100679394B1 true KR100679394B1 (ko) | 2007-02-05 |
Family
ID=37601534
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020050014168A KR100679394B1 (ko) | 2005-02-21 | 2005-02-21 | 멀티모달 플랫폼을 이용한 정보검색 시스템 및 그 방법 |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR100679394B1 (ko) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20020012062A (ko) * | 2000-08-05 | 2002-02-15 | 김성현 | 이동통신단말기의 자동위치추적 및 음성명령입력을 통한현지역정보 검색방법 |
KR20020057045A (ko) * | 2000-12-30 | 2002-07-11 | 구자홍 | 음성 인식을 이용한 이동 무선 단말기의 인터넷 검색 방법 |
KR20020079121A (ko) * | 2001-04-13 | 2002-10-19 | 김창호 | 이동통신 단말기를 이용한 정보 검색 시스템과 그시스템을 이용한 정보 검색방법 |
KR20020088921A (ko) * | 2001-05-22 | 2002-11-29 | 엘지전자 주식회사 | 이동통신 단말기를 이용한 무선 인터넷 정보 검색 장치 및방법 |
KR20040032523A (ko) * | 2002-10-10 | 2004-04-17 | 와이더덴닷컴 주식회사 | 음성인식을 이용한 이동통신 단말기의 인터넷 사이트접속장치 및 방법 |
KR20050114551A (ko) * | 2004-06-01 | 2005-12-06 | 에스케이 텔레콤주식회사 | 음성인식을 이용한 지도 검색 시스템 및 검색 방법 |
-
2005
- 2005-02-21 KR KR1020050014168A patent/KR100679394B1/ko active IP Right Grant
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20020012062A (ko) * | 2000-08-05 | 2002-02-15 | 김성현 | 이동통신단말기의 자동위치추적 및 음성명령입력을 통한현지역정보 검색방법 |
KR20020057045A (ko) * | 2000-12-30 | 2002-07-11 | 구자홍 | 음성 인식을 이용한 이동 무선 단말기의 인터넷 검색 방법 |
KR20020079121A (ko) * | 2001-04-13 | 2002-10-19 | 김창호 | 이동통신 단말기를 이용한 정보 검색 시스템과 그시스템을 이용한 정보 검색방법 |
KR20020088921A (ko) * | 2001-05-22 | 2002-11-29 | 엘지전자 주식회사 | 이동통신 단말기를 이용한 무선 인터넷 정보 검색 장치 및방법 |
KR20040032523A (ko) * | 2002-10-10 | 2004-04-17 | 와이더덴닷컴 주식회사 | 음성인식을 이용한 이동통신 단말기의 인터넷 사이트접속장치 및 방법 |
KR20050114551A (ko) * | 2004-06-01 | 2005-12-06 | 에스케이 텔레콤주식회사 | 음성인식을 이용한 지도 검색 시스템 및 검색 방법 |
Non-Patent Citations (1)
Title |
---|
1020040032523 * |
Also Published As
Publication number | Publication date |
---|---|
KR20060093424A (ko) | 2006-08-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20220121719A1 (en) | State-Dependent Query Response | |
KR101758302B1 (ko) | 컨텍스트에 기초한 음성 인식 문법 선택 | |
US20100094707A1 (en) | Method and platform for voice and location-based services for mobile advertising | |
US7672931B2 (en) | Searching for content using voice search queries | |
US8626759B2 (en) | Method and system for searching an information retrieval system according to user-specified location information | |
JP5584603B2 (ja) | 情報提供システムおよび情報提供装置 | |
JPH09330336A (ja) | 情報処理装置 | |
JP2009500720A5 (ko) | ||
JP2005346692A (ja) | ディレクトリ支援問い合わせ結果に対する完全機能型、アクション可能なアクセス | |
KR20130108173A (ko) | 유무선 통신 네트워크를 이용한 음성인식 질의응답 시스템 및 그 운용방법 | |
KR100920442B1 (ko) | 휴대 단말기에서 정보 검색 방법 | |
JPH10283362A (ja) | 携帯情報端末及び記憶媒体 | |
KR100544905B1 (ko) | 여행자를 위한 의사소통 지원 시스템 및 그 서비스 방법 | |
WO2003102816A1 (fr) | Systeme fournisseur de donnees | |
KR100679394B1 (ko) | 멀티모달 플랫폼을 이용한 정보검색 시스템 및 그 방법 | |
JP2000076040A (ja) | 音声入力ネットワーク端末装置 | |
JP2005004782A (ja) | 情報処理システム、情報処理装置および情報処理方法、並びに携帯型情報端末装置 | |
KR100702789B1 (ko) | 멀티모달 플랫폼을 이용한 모바일 서비스 시스템 및 그 방법 | |
JP2001075968A (ja) | 情報検索方法及びそれを記録した記録媒体 | |
JP4814753B2 (ja) | データ情報と音声情報とを結びつけるための方法及びシステム | |
JP2003315078A (ja) | ナビゲーション装置 | |
KR101445187B1 (ko) | 컨텐츠 검색 방법 및 시스템 | |
KR20140123370A (ko) | 유무선 통신 네트워크를 이용한 음성인식 질의응답 시스템 및 그 운용방법 | |
KR20020012062A (ko) | 이동통신단말기의 자동위치추적 및 음성명령입력을 통한현지역정보 검색방법 | |
KR101386491B1 (ko) | 모바일 단말기를 이용한 다국어 지원 시스템 및 그 방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
FPAY | Annual fee payment |
Payment date: 20121226 Year of fee payment: 7 |
|
FPAY | Annual fee payment |
Payment date: 20131223 Year of fee payment: 8 |
|
FPAY | Annual fee payment |
Payment date: 20141222 Year of fee payment: 9 |
|
FPAY | Annual fee payment |
Payment date: 20151223 Year of fee payment: 10 |
|
FPAY | Annual fee payment |
Payment date: 20161229 Year of fee payment: 11 |
|
FPAY | Annual fee payment |
Payment date: 20180129 Year of fee payment: 12 |
|
FPAY | Annual fee payment |
Payment date: 20191216 Year of fee payment: 14 |