KR20000037051A - 음성도메인과 음성을 이용한 인터넷 사용기술 - Google Patents

음성도메인과 음성을 이용한 인터넷 사용기술 Download PDF

Info

Publication number
KR20000037051A
KR20000037051A KR1020000017928D KR20000017928D KR20000037051A KR 20000037051 A KR20000037051 A KR 20000037051A KR 1020000017928 D KR1020000017928 D KR 1020000017928D KR 20000017928 D KR20000017928 D KR 20000017928D KR 20000037051 A KR20000037051 A KR 20000037051A
Authority
KR
South Korea
Prior art keywords
voice
domain
user
internet
voice domain
Prior art date
Application number
KR1020000017928D
Other languages
English (en)
Inventor
전화성
조래현
Original Assignee
전화성
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 전화성 filed Critical 전화성
Publication of KR20000037051A publication Critical patent/KR20000037051A/ko

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/487Arrangements for providing information services, e.g. recorded voice services or time announcements
    • H04M3/493Interactive information services, e.g. directory enquiries ; Arrangements therefor, e.g. interactive voice response [IVR] systems or voice portals
    • H04M3/4938Interactive information services, e.g. directory enquiries ; Arrangements therefor, e.g. interactive voice response [IVR] systems or voice portals comprising a voice browser which renders and interprets, e.g. VoiceXML
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/42204Arrangements at the exchange for service or number selection by voice
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Multimedia (AREA)
  • Acoustics & Sound (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Telephonic Communication Services (AREA)
  • Information Transfer Between Computers (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

음성을 이용한 인터넷 기술이다. 보통 우리가 웹사이트에 들어갈 때에는 일반 컴퓨터에서 주소창에 키보드를 이용하여 도메인 이름을 입력하지만 음성도메인은 키보드를 사용한 입력이 아니라 음성으로 도메인 명을 입력하는 것이다. 사용자가 우선 음성으로 "웹"이라고 말하면 웹브라우저의 주소 입력란이 활성화 되고, 그 상태에서 음성도메인 이름을 발성하면, 그 해당 사이트로 들어가는 것이다. 음성인식부은 서버에서 이루어지며, 클라이언트부분인 사용자의 단말기 혹은 PDA에서 양자화된 특징파라미터가 전송된다. 음성인식은 HMM(Hidden Markov Model)기반의 알고리즘으로 구성되고, 인식된 음성도메인에 해당하는 정보를 송신부로 서버가 있는 곳으로 송신한다.
서버는 해당하는 사이트로 FORWARDING 서비스를 이용하여 사이트를 찾아서 TTS를 이용하여, 해당 사이트의 내용을 읽어준다. 이 읽혀진 음성을 사용자가 사용하는 단말기 혹은 PDA로 VOCODER를 이용하여 전달한다. 전달된 압축음성을 VOCODER를 이요하여 사용자에게 SPEAKER나 헤드폰을 통하여 읽어준다.

Description

음성도메인과 음성을 이용한 인터넷 사용기술{Voice Domain and Speech Processing Technic in Internet Environment}
도메인사업분야, 인터넷을 이용하는 모든 기계 기술분야, 음성인식 기술분야, 음성합성기술분야, 음성압축기술분야, 인터넷 홈페이지기술분야, 데이타베이스 기술분야등이 모두 속하는 기술분야이다. 종래기술은 키보드를 이용하여 인터넷을 이용하고 있다.
현재 혹은 미래에는 CELLULAR PHONE 이나 PDA가 인터넷을 사용하는 데에 이용이 되고, CELLULAR PHONE이나, PDA는 제한된 자판을 갖고있으므로, 사용자는 제한된 자판내에서 불편함을 느끼므로 이를 음성으로 발성하여 웹사이트에 접속하는 편리함을 주고, 해당하는 WEB PAGE내에서 서비스의 항목을 음성으로 발성하면, 해당 서비스의 항목을 음성으로 읽어주는 기술이다. 물론 이 기술은 일반 PC에서 인터넷을 사용하는 사용자에게도 적용될 수있다. 불필요하게 여러 단계의 메뉴를 거치지 않고 해당 WEB SITE의 메뉴 혹은 내용을 음성으로 처리할 수있는 기술이다.
기존의 키보드를 이용하는 입력방식의 시스템들을 모두 음성으로 처리하여 사용할 수있게 하는 기술적 과제를 갖고있다. 일단 음성으로 도메인 이름을 입력했을 때 이를 인식할 수있도록 하기위해서는 음성을 인식하기 위한 전단계로 음성의 특징 PARAMETER를 추출하는 기술이 필요하고, 추출된 PARAMETER를 인터넷 망을 통하여 SERVER로 전송하는 기술, SERVER측에서는 전달된 추출 PARAMETER를 이용하여 해당하는 도메인을 검색하여 해당하는 사이트를 찾는 기술, 해당하는 사이트의 서비스 항목을 읽어서 사용자에게 인터넷에 전송하는 기술, 다시 사용자가 원하는 서비스를 음성으로 발성했을 때, 이의 음성 특징 PARAMETER를 추출하는 기술, 이를 인터넷을 통하여 전송하고, 해당 서비스의 항목을 찾아서, 서비스 항목에 해당하는 내용을 TTS를 사용하여 음성으로 전환하는 기술, 전환된 음성을 사용자에게 전달하는 기술이 필요한 기술적 과제이다.
도 1 은 전체 동작 개념도이다.
도 2 는 간단한 HMM 모델 예를 나타내는 개념도이다.
도 3 는 음성신호와 HMM의 관계를 나타내는 개념도이다.
도 4 는 HMM의 구조를 나타내는 개념도이다.
우선 음성으로 주소창에 도메인을 입력한다. 기존의 키보드를 이용하는 것이 아니라, CELLULAR PHONE이나 PDA에서 인터넷을 사용하기 위해서 키보드를 이용하여 인터넷의 주소를 입력하는 것이 아니라, 도메인 주소를 음성으로 입력하게 하는 것이다. 사용자가 우선 음성으로 "웹"이라고 말하면 웹브라우저의 주소 입력란이 활성화 되고, 그 상태에서 음성도메인 이름을 발성하면, 그 해당 사이트로 들어가는 것이다. 음성도메인의 사용은 우선 기존의 도메인 주소를 갖고있거나, 새로 도메인을 신청하는 경우에, 이를 음성도메인을 등록을 하고, 음성도메인이 등록이 되어있는 상태에서 서버는 음성도메인을 등록한 사용자에게 해당 주소를 음성으로 발성한 경우에 대해서 도메인 FORWARDING 서비스를 하는 것이다.
또한, 해당 WEB PAGE에 여러개의 서비스 항목을 만들어서, 해당 서비스에 해당하는 음성을 발성하면, 그에 해당하는 내용을 TTS를 이용하여 사용자에게 음성으로 읽어주는 기술이다.
음성 특징 PARAMETER 추출기술, 특징 PARAMETER를 인터넷 혹은 무선으로 전송하는 기술,음성인식후에 해당도메인으로의 FORWARDING, 등록된 음성도메인의 검색부분
입력할 수있는 키 또는 자판이 제한되어 있는 경우, 또는 자판을 사용하기 힘든 경우에 음성으로 발성하여 인터넷을 이용할 수있으므로, 사용자에게 매우 편리한 환경을 제공하는 효과를 낼 수있다.

Claims (4)

  1. 사용자가 음성으로 음성도메인을 발성하면 해당하는 도메인으로 FORWARDING되어 원하는 홈페이지가 활성화되는 부분.
  2. 청구항 1에 있어서의 음성도메인에 한하여 HMM 기반의 음성도메인 인식기를 서버에서 구현.
  3. CLIENT 부분에서 음성을 인터넷상에서 전송하기 쉽도록 특징 PARAMETER 부분을 추출하여 SERVER로 전송.
  4. SERVER측에서의 음성도메인의 데이타 베이스 구축하였으므로 핸드폰상에서도 음성도메인 인식기와 TTS를 이용하여 WEB SURFING을 할 수있는 구조.
KR1020000017928D 2000-04-06 2000-04-06 음성도메인과 음성을 이용한 인터넷 사용기술 KR20000037051A (ko)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020000017928A KR100367579B1 (ko) 2000-04-06 2000-04-06 음성을 이용한 인터넷사용시스템

Publications (1)

Publication Number Publication Date
KR20000037051A true KR20000037051A (ko) 2000-07-05

Family

ID=19662154

Family Applications (2)

Application Number Title Priority Date Filing Date
KR1020000017928A KR100367579B1 (ko) 2000-04-06 2000-04-06 음성을 이용한 인터넷사용시스템
KR1020000017928D KR20000037051A (ko) 2000-04-06 2000-04-06 음성도메인과 음성을 이용한 인터넷 사용기술

Family Applications Before (1)

Application Number Title Priority Date Filing Date
KR1020000017928A KR100367579B1 (ko) 2000-04-06 2000-04-06 음성을 이용한 인터넷사용시스템

Country Status (2)

Country Link
KR (2) KR100367579B1 (ko)
WO (1) WO2001077810A1 (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100486030B1 (ko) * 2002-10-10 2005-04-29 와이더댄 주식회사 음성인식을 이용한 이동통신 단말기의 인터넷 사이트접속장치 및 방법

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20010025231A (ko) * 2000-11-09 2001-04-06 차정만 음성도메인에 의한 인터넷접속 매개장치
KR100430309B1 (ko) * 2000-12-20 2004-05-04 주식회사 로커스 음성포탈 서비스에서 보이스엑스엠엘 에디터 시스템
KR20010035249A (ko) * 2001-01-27 2001-05-07 임채환 도메인의 포워딩을 통한 가망고객선별방식과 포탈사이트운영
KR20010044510A (ko) * 2001-03-02 2001-06-05 송요섭 음성기반의 도메인 처리 시스템 및 방법
KR20010074228A (ko) * 2001-04-12 2001-08-04 전화성 브이엑스엠엘을 이용한 전화 음성 도메인과 보이스포털
KR20030039956A (ko) * 2001-11-16 2003-05-22 (주)시스윌 분산음성처리 장치를 이용한 데이터 제어 방법과 그 시스템
KR100462812B1 (ko) * 2001-12-22 2004-12-20 주식회사 케이티 음성인식을 통한 웹 경로 인터페이스 시스템 및 그 방법
CN101090413A (zh) * 2006-06-14 2007-12-19 华为技术有限公司 一种电话呼叫的方法和系统

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1078952A (ja) * 1996-07-29 1998-03-24 Internatl Business Mach Corp <Ibm> 音声合成方法、音声合成装置、ハイパーテキストの制御方法及び制御装置
KR0132161Y1 (ko) * 1996-10-31 1999-10-01 대우자동차주식회사 루프 벤틸레이터의 캡 힌지부 강성구조
KR100301219B1 (ko) * 2000-01-25 2001-11-03 백종관 음성 인식/합성을 이용한 통신망에서의 음성 포탈 서비스시스템 및 그 서비스 방법

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100486030B1 (ko) * 2002-10-10 2005-04-29 와이더댄 주식회사 음성인식을 이용한 이동통신 단말기의 인터넷 사이트접속장치 및 방법

Also Published As

Publication number Publication date
KR100367579B1 (ko) 2003-01-10
WO2001077810A1 (en) 2001-10-18
KR20000058312A (en) 2000-10-05

Similar Documents

Publication Publication Date Title
KR100819928B1 (ko) 휴대 단말기의 음성 인식장치 및 그 방법
CN1752975B (zh) 用于支持话音的自动填充的方法和系统
US8073700B2 (en) Retrieval and presentation of network service results for mobile device using a multimodal browser
JP2003044091A (ja) 音声認識システム、携帯情報端末、音声情報処理装置、音声情報処理方法および音声情報処理プログラム
CN101867632A (zh) 一种手机语音即时翻译系统和翻译方法
CA2490430A1 (en) Method and apparatus for automatically building conversational systems
CN101957814A (zh) 一种即时语音翻译系统和翻译方法
CN104202455A (zh) 智能语音拨号的方法及装置
CA2484246A1 (en) Sequential multimodal input
CN101211335A (zh) 具有翻译功能的移动通信终端、翻译系统和翻译方法
KR20000037051A (ko) 음성도메인과 음성을 이용한 인터넷 사용기술
WO2019075829A1 (zh) 语音翻译方法、装置和翻译设备
CN101957813A (zh) 一种网络电话语音翻译系统和翻译方法
CN108810187B (zh) 一种通过区块链对接语音服务的网络系统
JP6448950B2 (ja) 音声対話装置及び電子機器
TWI220205B (en) Device using handheld communication equipment to calculate and process natural language and method thereof
US20020072916A1 (en) Distributed speech recognition for internet access
CN102957711A (zh) 在电视上通过语音进行网址定位的方法及系统
KR101233655B1 (ko) 음성인식 기반 국제회의 통역 장치 및 방법
KR20020080174A (ko) 이동통신 단말기의 음성인식 장치 및 방법
Wang et al. Real-Time Voice-Call Language Translation
KR20050001270A (ko) 키보드와 음성을 함께 이용한 음성도메인 및 음성정보검색시스템
KR20000073936A (ko) 화자독립 음성인식 기술을 이용한 음성등록 방법 및 장치
JP3540736B2 (ja) 必要情報収集システム
KR100986443B1 (ko) 보이스 엑스엠엘 문서에서 음성인식 그래마없이 음성인식및 녹음을 수행하는 방법