KR20050117101A - 휴대폰을 이용한 음성 인식 방법 - Google Patents

휴대폰을 이용한 음성 인식 방법 Download PDF

Info

Publication number
KR20050117101A
KR20050117101A KR1020040042294A KR20040042294A KR20050117101A KR 20050117101 A KR20050117101 A KR 20050117101A KR 1020040042294 A KR1020040042294 A KR 1020040042294A KR 20040042294 A KR20040042294 A KR 20040042294A KR 20050117101 A KR20050117101 A KR 20050117101A
Authority
KR
South Korea
Prior art keywords
voice recognition
mobile phone
voice
user
service
Prior art date
Application number
KR1020040042294A
Other languages
English (en)
Inventor
박광철
Original Assignee
엘지전자 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 엘지전자 주식회사 filed Critical 엘지전자 주식회사
Priority to KR1020040042294A priority Critical patent/KR20050117101A/ko
Publication of KR20050117101A publication Critical patent/KR20050117101A/ko

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems
    • G10L15/30Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/58Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/72Mobile telephones; Cordless telephones, i.e. devices for establishing wireless links to base stations without route selection
    • H04M1/724User interfaces specially adapted for cordless or mobile telephones
    • H04M1/72403User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W4/00Services specially adapted for wireless communication networks; Facilities therefor
    • H04W4/12Messaging; Mailboxes; Announcements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W4/00Services specially adapted for wireless communication networks; Facilities therefor
    • H04W4/16Communication-related supplementary services, e.g. call-transfer or call-hold
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M2250/00Details of telephonic subscriber devices
    • H04M2250/74Details of telephonic subscriber devices with voice recognition means

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Telephonic Communication Services (AREA)
  • Mobile Radio Communication Systems (AREA)

Abstract

휴대폰 및 음성인식 서버를 이용하여 음성인식 서비스를 수행하는 방법이 개시되어 있다. 이 개시된 음성 인식 서비스를 수행하는 방법은 휴대폰으로 음성인식 서버에 연결하는 단계와;음성인식 서비스를 선택하는 단계와; 음성인식 서비스에 입력할 음성을 휴대폰을 이용하여 전송하는 단계와; 상기 전송된 음성을 이용하여 부가 서비스를 선택하는 단계와; 상기 선택되어 수행된 내용을 사용자 혹은 원하는 여러 사람에게 전달하는 단계를 포함하여 이루어진 것을 특징으로 한다. 이상과 같은 음성인식 서비스를 이용함으로서, 사용자는 보다 다양하고 복잡한 음성인식 서비스를 제공받게 되어 그 편의성이 한층 증대되게 된다.

Description

휴대폰을 이용한 음성 인식 방법 {The voice recognition method using mobile phone}
본 발명은 휴대폰을 이용한 음성인식 방법에 관한 것으로, 특히 기존의 핸드폰 자체의 음성인식 대신, 서버를 이용한 개선된 음성인식 방법에 관한 것이다.
일반적으로 휴대폰을 이용한 음성인식 방법은 도 1에 도시된 바와 같이, 간단한 명령을 핸드폰에서 수행하기 위해 음성 패턴을 인식하는 칩을 이용하여 단순한 단어를 화자 독립적으로 인식할 수 있도록 하고 있다. 이러한 화자 독립적인 방법은 일반인이 말하는 언어를 그대로 인식하여 이에 따르는 기능을 수행하도록 하는 것으로, 기존의 음성인식 휴대폰등에 이용되고 있다. 상기와 같은 화자 독립적인 음성 인식외에 화자 종속 음성 인식 방법도 존재하며, 이러한 화자 종속 음성 인식 방법은 주로 인증 서비스에 이용되며, 시스템에 접속하려는 사람이 정확하게 인증된 사람인지 아닌지를 구별할 수 있는 서비스이다. 개인마다 다른 지문을 가지고 있듯이 개인마다 다른 성문 즉 목소리 정보를 가지고 있기 때문에 가능한 서비스이다. 상기와 같은 방법이외에 또한 고립단어 음성 인식 방법도 있으며, 이러한 방법은 간단한 음성인식을 수행하기 위하여 음성 인식 시스템을 구현하는 방법이다. 일반적인 기계를 음성으로 작동시키기 위하여 단어 단위로 음성 인식을 수행하는 것으로, 많은 계산량을 줄여서 음성 인식 시스템을 구현할 수 있다.
또 다른 방법으로 연속음 음성 인식 방법도 있으며, 이러한 방법은 고립단어 음성이 아닌 연속음 음성인식 방법으로 정확한 음성 인식 DB를 구축해야 하고 많은 계산량이 필요하기 때문에 고성능의 컴퓨팅 파워가 필요한 구현방법이다.
현재 휴대폰에 이용되는 일반적인 방법은 화자 독립 고립단어 방식으로 고립단어 인식이므로 적은 계산량으로 음성 인식을 수행할 수 있다. 정확한 음석인식을 수행하려면 많은 계산을 해야 하고 정확한 음성 인식 DB가 필요하지만 핸드폰은 작고 느린 프로세서를 가지고 있으므로 연속음 음성 인식 방법을 수행할 수 없다.
따라서, 기존의 휴대폰으로 많은 계산이 필요한 연속음 음성 인식이나 긴 문장의 음성인식을 수행하는데에는 많은 어려움이 존재하고 있다.
본 발명은 상기한 문제점을 해결하기 위하여 안출된 것으로서,기존의 핸드폰 자체의 음성인식 칩이 아닌, 서버를 이용한 음성인식 서비스를 제공하여 정확한 음성인식 서비스와 다양한 음성인식 부가서비스를 제공하는데 그 목적이 있다.
상기한 목적을 달성하기 위해 본 발명에 따르는 음성인식 방법은 휴대폰으로 음성인식 서버에 연결하는 단계와; 상기 음성인식 서비스를 선택하는 단계와; 음성인식 서비스에 입력할 음성을 전송하는 단계와; 상기 전송된 음성을 이용하여 다양한 부가 서비스를 선택하는 단계와; 상기 선택되어 수행된 내용을 사용자 혹은 원하는 여러 사람에게 전달하는 단계를 포함하여 구성된 것을 특징으로 한다.
이하 본 발명에 따르는 휴대폰을 이용한 음성인식 방법에 대해 첨부한 도면을 참조하여 상세히 설명한다.
본 발명에 따르는 휴대폰을 이용한 음성인식 방법은 도 2에 상세히 개시되고 있다. 이러한 방법에서는 사용자가 먼저 휴대폰으로 상기 음성인식 서버에 연결하여야 한다. 상기 음성인식 서버는 다양한 서버를 포함하고 있는데,일반적으로 휴대폰의 통신을 담당하는 통신회사(예로서,sk텔레콤,LG텔레콤등)의 서버가 될 수도 있고, 사용자 자신의 홈 서버일 수도 있으며,어떠한 서버를 이용하더라도 상관이 없다. 다만,상기 서버에는 휴대폰의 음성을 인식하고 이에 따르는 다양한 기능을 수행할 수 있는 프로그램이 내장되어 있어야 하며, 이러한 프로그램은 하드웨어적으로 이루어지든, 소프트웨어적으로 이루어지든 별다른 상관이 없다. 사용자가 상기 언급한 바와 같이, 휴대폰을 이용하여 음성인식 서버에 접속한 후에는 상기 서버가 제공하는 음성인식 서비스를 선택하여야 한다. 이러한 음성인식 서비스는 이용하는 서버의 종류에 따라 다양하게 제공되어 질 수 있을 것이며, 어떠한 방법이나 화면으로 제공되어도 무관하다. 음성인식 서비스를 선택한 이후에는,사용자는 휴대폰을 이용하여 음성인식 서버에 수행할 음성을 전송한다. 음성인식 서버에서는 사용자가 전송한 음성을 저장하고, 사용자에게 수행할 수 있는 다양한 부가서비스를 전송한다. 사용자는 서버에 의해 전송된 부가서비스 종류중에서 원하는 서비스를 선택한다. 이러한 부가서비스의 종류는 다양하게 제공될 수 있다. 예를 들면, 사용자가 전송한 음성을 텍스트 문서로 변환하는 기능이나, 혹은 사용자가 전송한 음성을 다른나라의 언어로 번역해주는 기능 혹은 기타 여러가지 기능을 수행할 수 있다.
사용자가 원하는 서비스를 선택한 후, 예를 들면 번역 서비스를 선택하였다면, 서버는 사용자가 전송한 음성을 사용자가 원하는 언어로 번역한 후 이를 사용자에게 전송하여 준다. 사용자가 수신자를 설정할 수 도 있으며, 사용자 자신만 수신받을 수도 있고, 사용자가 지정한 여러 사람이 동시에 수신 받을 수도 있으며,서버에 저장한 후 추후에 전송받을 수도 있다. 전송되는 데이타의 형태로 사용자가 결정할 수 있으며, 사용자가 지정한 메일로 받을 수 도 있고, 사용자 자신의 휴대폰으로 직접 수신할 수 도 있으며, 또한 사용자가 제공하기를 원하는 다른 사람의 이메일,혹은 휴대폰으로 직접 전송할 수도 있다. 이때, 만약 상기 서버를 제공하는 주체가 통신회사라면, 이러한 서비스의 종류에 따라 과금이 이루어지게 된다. 물론, 과금의 여부는 통신회사가 자체적으로 설정할 수 있는 것이다.
본 발명에 따르는 휴대폰을 이용한 음성인식 방법은, 기존의 휴대폰에서 이용되는 간단한 음성인식의 한계를 극복하기 위해, 다양한 계산능력 처리기능의 프로세서를 보유한 서버를 이용하여 음성인식을 수행함으로서 계산량이 많은 음성인식을 수행할 수 있게 함으로써, 기존의 휴대폰에서 이용하지 못하는 다양한 기능의 음성인식 서비스를 제공할 수 있게되어 사용자의 편의성을 향상시킬 수 있게 되었다.
도 1은 종래의 휴대폰을 이용한 음성인식 방법을 도시한 도면.
도 2는 본 발명에 따르는 휴대폰을 이용한 음성인식 방법

Claims (5)

  1. 휴대폰으로 음성인식 서버에 연결하는 단계와;
    음성인식 서비스를 선택하는 단계와;
    음성인식 서비스에 입력할 음성을 휴대폰을 이용하여 전송하는 단계와;
    상기 전송된 음성을 이용하여 부가 서비스를 선택하는 단계와;
    상기 선택되어 수행된 내용을 사용자 혹은 원하는 여러 사람에게 전달하는 단계를 포함하여 이루어진 것을 특징으로 하는 휴대폰을 이용한 음성인식 방법.
  2. 제 1 항에 있어서,
    상기 부가 서비스는 음성을 텍스트로 변환하는 서비스 인 것을 특징으로 하는 휴대폰을 이용한 음성인식 방법.
  3. 제 1 항에 있어서
    상기 부가서비스는 음성을 사용자가 원하는 다른 언어로 번역하는 서비스 인 것을 특징으로 하는 휴대폰을 이용한 음성인식 방법.
  4. 제 1 항에 있어서,
    상기 선택되어 수행된 내용을 사용자 혹은 원하는 여러 사람에게 전달하는 단계는 사용자가 원하는 전자우편 주소로 전송하는 것을 특징으로 하는 휴대폰을 이용한 음성인식 방법.
  5. 제 1 항에 있어서,
    상기 선택되어 수행된 내용을 사용자 혹은 원하는 여러 사람에게 전달하는 단계는 사용자가 원하는 휴대폰에 메시지로 전송하는 것을 특징으로 하는 휴대폰을 이용한 음성인식 방법.
KR1020040042294A 2004-06-09 2004-06-09 휴대폰을 이용한 음성 인식 방법 KR20050117101A (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020040042294A KR20050117101A (ko) 2004-06-09 2004-06-09 휴대폰을 이용한 음성 인식 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020040042294A KR20050117101A (ko) 2004-06-09 2004-06-09 휴대폰을 이용한 음성 인식 방법

Publications (1)

Publication Number Publication Date
KR20050117101A true KR20050117101A (ko) 2005-12-14

Family

ID=37290554

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020040042294A KR20050117101A (ko) 2004-06-09 2004-06-09 휴대폰을 이용한 음성 인식 방법

Country Status (1)

Country Link
KR (1) KR20050117101A (ko)

Similar Documents

Publication Publication Date Title
US9761241B2 (en) System and method for providing network coordinated conversational services
EP1125279B1 (en) System and method for providing network coordinated conversational services
CN1333385C (zh) 用于通信系统的语音浏览器启用器
CN101609673B (zh) 一种基于电话银行的用户语音处理方法及服务器
US20160048508A1 (en) Universal language translator
KR20030020768A (ko) 음성인식을 이용한 개인전화번호부 데이터베이스 구축방법및 그를 이용한 개인전화번호부 음성자동연결서비스 방법
JP2001222294A (ja) 無線通信装置のためのユーザインターフェースに基づく音声認識
CN101867632A (zh) 一种手机语音即时翻译系统和翻译方法
US20200211560A1 (en) Data Processing Device and Method for Performing Speech-Based Human Machine Interaction
KR20010076464A (ko) 음성을 통한 인터넷 서비스 시스템
CN111554280A (zh) 对利用人工智能的翻译内容和口译专家的口译内容进行混合的实时口译服务系统
US20080147409A1 (en) System, apparatus and method for providing global communications
KR100367579B1 (ko) 음성을 이용한 인터넷사용시스템
JP2005151553A (ja) ボイス・ポータル
US20020077814A1 (en) Voice recognition system method and apparatus
KR20050117101A (ko) 휴대폰을 이용한 음성 인식 방법
KR20040039586A (ko) 음성인식을 이용한 ars정보 추출 시스템 및 방법
US20170185587A1 (en) Machine translation method and machine translation system
KR20020054192A (ko) 외국인을 위한 전화안내 자동 통역시스템 및 방법
EP3035207A1 (en) Speech translation device
KR20000073936A (ko) 화자독립 음성인식 기술을 이용한 음성등록 방법 및 장치
KR20090032053A (ko) 음성인식을 이용한 개인전화번호부 데이터베이스 구축방법과, 그를 이용한 자동 전화연결 서비스 방법 및 시스템
KR20010091677A (ko) 음성합성을 이용한 선택형 온라인 대화시스템의 구성 및운용방법
KR200201894Y1 (ko) 전화기를 이용한 정보 검색 시스템
KR100432373B1 (ko) 독립적 음성처리를 위한 음성인식 시스템

Legal Events

Date Code Title Description
WITN Withdrawal due to no request for examination