KR20050117101A - 휴대폰을 이용한 음성 인식 방법 - Google Patents
휴대폰을 이용한 음성 인식 방법 Download PDFInfo
- Publication number
- KR20050117101A KR20050117101A KR1020040042294A KR20040042294A KR20050117101A KR 20050117101 A KR20050117101 A KR 20050117101A KR 1020040042294 A KR1020040042294 A KR 1020040042294A KR 20040042294 A KR20040042294 A KR 20040042294A KR 20050117101 A KR20050117101 A KR 20050117101A
- Authority
- KR
- South Korea
- Prior art keywords
- voice recognition
- mobile phone
- voice
- user
- service
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 33
- 230000005540 biological transmission Effects 0.000 claims 1
- 230000006870 function Effects 0.000 description 7
- 238000004891 communication Methods 0.000 description 3
- 230000001419 dependent effect Effects 0.000 description 2
- 238000007429 general method Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
- G10L15/30—Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
- G06F40/58—Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M1/00—Substation equipment, e.g. for use by subscribers
- H04M1/72—Mobile telephones; Cordless telephones, i.e. devices for establishing wireless links to base stations without route selection
- H04M1/724—User interfaces specially adapted for cordless or mobile telephones
- H04M1/72403—User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W4/00—Services specially adapted for wireless communication networks; Facilities therefor
- H04W4/12—Messaging; Mailboxes; Announcements
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W4/00—Services specially adapted for wireless communication networks; Facilities therefor
- H04W4/16—Communication-related supplementary services, e.g. call-transfer or call-hold
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M2250/00—Details of telephonic subscriber devices
- H04M2250/74—Details of telephonic subscriber devices with voice recognition means
Landscapes
- Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Artificial Intelligence (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Telephonic Communication Services (AREA)
- Mobile Radio Communication Systems (AREA)
Abstract
휴대폰 및 음성인식 서버를 이용하여 음성인식 서비스를 수행하는 방법이 개시되어 있다. 이 개시된 음성 인식 서비스를 수행하는 방법은 휴대폰으로 음성인식 서버에 연결하는 단계와;음성인식 서비스를 선택하는 단계와; 음성인식 서비스에 입력할 음성을 휴대폰을 이용하여 전송하는 단계와; 상기 전송된 음성을 이용하여 부가 서비스를 선택하는 단계와; 상기 선택되어 수행된 내용을 사용자 혹은 원하는 여러 사람에게 전달하는 단계를 포함하여 이루어진 것을 특징으로 한다. 이상과 같은 음성인식 서비스를 이용함으로서, 사용자는 보다 다양하고 복잡한 음성인식 서비스를 제공받게 되어 그 편의성이 한층 증대되게 된다.
Description
본 발명은 휴대폰을 이용한 음성인식 방법에 관한 것으로, 특히 기존의 핸드폰 자체의 음성인식 대신, 서버를 이용한 개선된 음성인식 방법에 관한 것이다.
일반적으로 휴대폰을 이용한 음성인식 방법은 도 1에 도시된 바와 같이, 간단한 명령을 핸드폰에서 수행하기 위해 음성 패턴을 인식하는 칩을 이용하여 단순한 단어를 화자 독립적으로 인식할 수 있도록 하고 있다. 이러한 화자 독립적인 방법은 일반인이 말하는 언어를 그대로 인식하여 이에 따르는 기능을 수행하도록 하는 것으로, 기존의 음성인식 휴대폰등에 이용되고 있다. 상기와 같은 화자 독립적인 음성 인식외에 화자 종속 음성 인식 방법도 존재하며, 이러한 화자 종속 음성 인식 방법은 주로 인증 서비스에 이용되며, 시스템에 접속하려는 사람이 정확하게 인증된 사람인지 아닌지를 구별할 수 있는 서비스이다. 개인마다 다른 지문을 가지고 있듯이 개인마다 다른 성문 즉 목소리 정보를 가지고 있기 때문에 가능한 서비스이다. 상기와 같은 방법이외에 또한 고립단어 음성 인식 방법도 있으며, 이러한 방법은 간단한 음성인식을 수행하기 위하여 음성 인식 시스템을 구현하는 방법이다. 일반적인 기계를 음성으로 작동시키기 위하여 단어 단위로 음성 인식을 수행하는 것으로, 많은 계산량을 줄여서 음성 인식 시스템을 구현할 수 있다.
또 다른 방법으로 연속음 음성 인식 방법도 있으며, 이러한 방법은 고립단어 음성이 아닌 연속음 음성인식 방법으로 정확한 음성 인식 DB를 구축해야 하고 많은 계산량이 필요하기 때문에 고성능의 컴퓨팅 파워가 필요한 구현방법이다.
현재 휴대폰에 이용되는 일반적인 방법은 화자 독립 고립단어 방식으로 고립단어 인식이므로 적은 계산량으로 음성 인식을 수행할 수 있다. 정확한 음석인식을 수행하려면 많은 계산을 해야 하고 정확한 음성 인식 DB가 필요하지만 핸드폰은 작고 느린 프로세서를 가지고 있으므로 연속음 음성 인식 방법을 수행할 수 없다.
따라서, 기존의 휴대폰으로 많은 계산이 필요한 연속음 음성 인식이나 긴 문장의 음성인식을 수행하는데에는 많은 어려움이 존재하고 있다.
본 발명은 상기한 문제점을 해결하기 위하여 안출된 것으로서,기존의 핸드폰 자체의 음성인식 칩이 아닌, 서버를 이용한 음성인식 서비스를 제공하여 정확한 음성인식 서비스와 다양한 음성인식 부가서비스를 제공하는데 그 목적이 있다.
상기한 목적을 달성하기 위해 본 발명에 따르는 음성인식 방법은 휴대폰으로 음성인식 서버에 연결하는 단계와; 상기 음성인식 서비스를 선택하는 단계와; 음성인식 서비스에 입력할 음성을 전송하는 단계와; 상기 전송된 음성을 이용하여 다양한 부가 서비스를 선택하는 단계와; 상기 선택되어 수행된 내용을 사용자 혹은 원하는 여러 사람에게 전달하는 단계를 포함하여 구성된 것을 특징으로 한다.
이하 본 발명에 따르는 휴대폰을 이용한 음성인식 방법에 대해 첨부한 도면을 참조하여 상세히 설명한다.
본 발명에 따르는 휴대폰을 이용한 음성인식 방법은 도 2에 상세히 개시되고 있다. 이러한 방법에서는 사용자가 먼저 휴대폰으로 상기 음성인식 서버에 연결하여야 한다. 상기 음성인식 서버는 다양한 서버를 포함하고 있는데,일반적으로 휴대폰의 통신을 담당하는 통신회사(예로서,sk텔레콤,LG텔레콤등)의 서버가 될 수도 있고, 사용자 자신의 홈 서버일 수도 있으며,어떠한 서버를 이용하더라도 상관이 없다. 다만,상기 서버에는 휴대폰의 음성을 인식하고 이에 따르는 다양한 기능을 수행할 수 있는 프로그램이 내장되어 있어야 하며, 이러한 프로그램은 하드웨어적으로 이루어지든, 소프트웨어적으로 이루어지든 별다른 상관이 없다. 사용자가 상기 언급한 바와 같이, 휴대폰을 이용하여 음성인식 서버에 접속한 후에는 상기 서버가 제공하는 음성인식 서비스를 선택하여야 한다. 이러한 음성인식 서비스는 이용하는 서버의 종류에 따라 다양하게 제공되어 질 수 있을 것이며, 어떠한 방법이나 화면으로 제공되어도 무관하다. 음성인식 서비스를 선택한 이후에는,사용자는 휴대폰을 이용하여 음성인식 서버에 수행할 음성을 전송한다. 음성인식 서버에서는 사용자가 전송한 음성을 저장하고, 사용자에게 수행할 수 있는 다양한 부가서비스를 전송한다. 사용자는 서버에 의해 전송된 부가서비스 종류중에서 원하는 서비스를 선택한다. 이러한 부가서비스의 종류는 다양하게 제공될 수 있다. 예를 들면, 사용자가 전송한 음성을 텍스트 문서로 변환하는 기능이나, 혹은 사용자가 전송한 음성을 다른나라의 언어로 번역해주는 기능 혹은 기타 여러가지 기능을 수행할 수 있다.
사용자가 원하는 서비스를 선택한 후, 예를 들면 번역 서비스를 선택하였다면, 서버는 사용자가 전송한 음성을 사용자가 원하는 언어로 번역한 후 이를 사용자에게 전송하여 준다. 사용자가 수신자를 설정할 수 도 있으며, 사용자 자신만 수신받을 수도 있고, 사용자가 지정한 여러 사람이 동시에 수신 받을 수도 있으며,서버에 저장한 후 추후에 전송받을 수도 있다. 전송되는 데이타의 형태로 사용자가 결정할 수 있으며, 사용자가 지정한 메일로 받을 수 도 있고, 사용자 자신의 휴대폰으로 직접 수신할 수 도 있으며, 또한 사용자가 제공하기를 원하는 다른 사람의 이메일,혹은 휴대폰으로 직접 전송할 수도 있다. 이때, 만약 상기 서버를 제공하는 주체가 통신회사라면, 이러한 서비스의 종류에 따라 과금이 이루어지게 된다. 물론, 과금의 여부는 통신회사가 자체적으로 설정할 수 있는 것이다.
본 발명에 따르는 휴대폰을 이용한 음성인식 방법은, 기존의 휴대폰에서 이용되는 간단한 음성인식의 한계를 극복하기 위해, 다양한 계산능력 처리기능의 프로세서를 보유한 서버를 이용하여 음성인식을 수행함으로서 계산량이 많은 음성인식을 수행할 수 있게 함으로써, 기존의 휴대폰에서 이용하지 못하는 다양한 기능의 음성인식 서비스를 제공할 수 있게되어 사용자의 편의성을 향상시킬 수 있게 되었다.
도 1은 종래의 휴대폰을 이용한 음성인식 방법을 도시한 도면.
도 2는 본 발명에 따르는 휴대폰을 이용한 음성인식 방법
Claims (5)
- 휴대폰으로 음성인식 서버에 연결하는 단계와;음성인식 서비스를 선택하는 단계와;음성인식 서비스에 입력할 음성을 휴대폰을 이용하여 전송하는 단계와;상기 전송된 음성을 이용하여 부가 서비스를 선택하는 단계와;상기 선택되어 수행된 내용을 사용자 혹은 원하는 여러 사람에게 전달하는 단계를 포함하여 이루어진 것을 특징으로 하는 휴대폰을 이용한 음성인식 방법.
- 제 1 항에 있어서,상기 부가 서비스는 음성을 텍스트로 변환하는 서비스 인 것을 특징으로 하는 휴대폰을 이용한 음성인식 방법.
- 제 1 항에 있어서상기 부가서비스는 음성을 사용자가 원하는 다른 언어로 번역하는 서비스 인 것을 특징으로 하는 휴대폰을 이용한 음성인식 방법.
- 제 1 항에 있어서,상기 선택되어 수행된 내용을 사용자 혹은 원하는 여러 사람에게 전달하는 단계는 사용자가 원하는 전자우편 주소로 전송하는 것을 특징으로 하는 휴대폰을 이용한 음성인식 방법.
- 제 1 항에 있어서,상기 선택되어 수행된 내용을 사용자 혹은 원하는 여러 사람에게 전달하는 단계는 사용자가 원하는 휴대폰에 메시지로 전송하는 것을 특징으로 하는 휴대폰을 이용한 음성인식 방법.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020040042294A KR20050117101A (ko) | 2004-06-09 | 2004-06-09 | 휴대폰을 이용한 음성 인식 방법 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020040042294A KR20050117101A (ko) | 2004-06-09 | 2004-06-09 | 휴대폰을 이용한 음성 인식 방법 |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20050117101A true KR20050117101A (ko) | 2005-12-14 |
Family
ID=37290554
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020040042294A KR20050117101A (ko) | 2004-06-09 | 2004-06-09 | 휴대폰을 이용한 음성 인식 방법 |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR20050117101A (ko) |
-
2004
- 2004-06-09 KR KR1020040042294A patent/KR20050117101A/ko not_active Application Discontinuation
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9761241B2 (en) | System and method for providing network coordinated conversational services | |
EP1125279B1 (en) | System and method for providing network coordinated conversational services | |
CN1333385C (zh) | 用于通信系统的语音浏览器启用器 | |
CN101609673B (zh) | 一种基于电话银行的用户语音处理方法及服务器 | |
US20160048508A1 (en) | Universal language translator | |
KR20030020768A (ko) | 음성인식을 이용한 개인전화번호부 데이터베이스 구축방법및 그를 이용한 개인전화번호부 음성자동연결서비스 방법 | |
JP2001222294A (ja) | 無線通信装置のためのユーザインターフェースに基づく音声認識 | |
CN101867632A (zh) | 一种手机语音即时翻译系统和翻译方法 | |
US20200211560A1 (en) | Data Processing Device and Method for Performing Speech-Based Human Machine Interaction | |
KR20010076464A (ko) | 음성을 통한 인터넷 서비스 시스템 | |
CN111554280A (zh) | 对利用人工智能的翻译内容和口译专家的口译内容进行混合的实时口译服务系统 | |
US20080147409A1 (en) | System, apparatus and method for providing global communications | |
KR100367579B1 (ko) | 음성을 이용한 인터넷사용시스템 | |
JP2005151553A (ja) | ボイス・ポータル | |
US20020077814A1 (en) | Voice recognition system method and apparatus | |
KR20050117101A (ko) | 휴대폰을 이용한 음성 인식 방법 | |
KR20040039586A (ko) | 음성인식을 이용한 ars정보 추출 시스템 및 방법 | |
US20170185587A1 (en) | Machine translation method and machine translation system | |
KR20020054192A (ko) | 외국인을 위한 전화안내 자동 통역시스템 및 방법 | |
EP3035207A1 (en) | Speech translation device | |
KR20000073936A (ko) | 화자독립 음성인식 기술을 이용한 음성등록 방법 및 장치 | |
KR20090032053A (ko) | 음성인식을 이용한 개인전화번호부 데이터베이스 구축방법과, 그를 이용한 자동 전화연결 서비스 방법 및 시스템 | |
KR20010091677A (ko) | 음성합성을 이용한 선택형 온라인 대화시스템의 구성 및운용방법 | |
KR200201894Y1 (ko) | 전화기를 이용한 정보 검색 시스템 | |
KR100432373B1 (ko) | 독립적 음성처리를 위한 음성인식 시스템 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
WITN | Withdrawal due to no request for examination |