KR20010082389A - 음성인식,합성 3차원아바타시스템 - Google Patents

음성인식,합성 3차원아바타시스템 Download PDF

Info

Publication number
KR20010082389A
KR20010082389A KR1020010019447A KR20010019447A KR20010082389A KR 20010082389 A KR20010082389 A KR 20010082389A KR 1020010019447 A KR1020010019447 A KR 1020010019447A KR 20010019447 A KR20010019447 A KR 20010019447A KR 20010082389 A KR20010082389 A KR 20010082389A
Authority
KR
South Korea
Prior art keywords
voice
speech
avatar
internet
client
Prior art date
Application number
KR1020010019447A
Other languages
English (en)
Inventor
전화성
심재현
Original Assignee
전화성
에스엘투(주)
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 전화성, 에스엘투(주) filed Critical 전화성
Priority to KR1020010019447A priority Critical patent/KR20010082389A/ko
Publication of KR20010082389A publication Critical patent/KR20010082389A/ko

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/08Text analysis or generation of parameters for speech synthesis out of text, e.g. grapheme to phoneme translation, prosody generation or stress or intonation determination
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Tourism & Hospitality (AREA)
  • Economics (AREA)
  • Human Resources & Organizations (AREA)
  • Multimedia (AREA)
  • Human Computer Interaction (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Acoustics & Sound (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Processing Or Creating Images (AREA)

Abstract

본 발명은 음성인식,합성기술과 3차원 아바타 기술을 이용한 인터넷 정보안내 키오스크 시스템에 관한 것으로서, 음성인식, 합성기술과 3차원 아바타 기술이 적용된 클리아언트와 인터넷 연동이 가능한 관리서버로 구성되어 있다.
특히 고객들에게 정보를 제공함에 있어 3차원 아바타를 이용하여 편안하고 마치 실제로 사람과 사람이 얼굴을 마주 대하듯 인터넷의 원하는정보를, 실시간으로 읽어주며 안내 할 수 이기 때문에 공공기관, 백화점, 쇼핑몰, 박물관, 전시장, 호텔, 학교, 교육기관, 도서관, 극장, 관광안내소 등 많은 사람이 이용는 장소에서 고객에 따른 차별화된 직접적인 정보 전달기능을 가지고 고객들에게 편안하고 마치 실제로 사람과 사람이 얼굴을 대하듯 여러 정보를 음성합성으로 안내함으로써 고객들에 대한 서비스 향상과 고객만족에 기여할 수 있다.

Description

음성인식,합성 3차원아바타시스템{Kiosk System Using ASR, TTS&3D Avata}
본 발명은 음성인식,합성기술과 3차원 아바타 기술을 이용한 인터넷 정보안내 시스템에 관한 것으로서, 특히 시설을 이용하는 고객들에게 정보를 제공함에 있어 3차원 케릭터 아바타를 이용하여 편안하고 마치 실제로 사람과 사람이 얼굴을 마주 대하듯 인터넷의 원하는정보를, 실시간으로 읽어주며 안내하는 정보 안내 시스템 이다.
본 발명이 이루고자 하는 기술적 과제는 먼저 인터넷등 기존의 텍스트 정보를 실시간으로 인간의 음성과 흡사하게 읽어줄수 있는 음성합성기술 개발과 둘째로고객들에게 편안하고 마치 실제로 사람과 사람이 얼굴을 마주 대하듯 명령을 내릴 수 있는 음성인식기술, 그리고 마지막으로 고객이 원하는 정보를 음성합성으로 읽어줄 수 있는 3차원 케릭터를 이용한 아바타기술을 개발하여 인터넷에 연동된 텍스트 정보를 실시간으로 읽어주며 안내하는 음성인식, 합성 3차원 아바타 정보안내 시스템 기술을 개발한다.
도면 1. 음성인식, 합성 3차원 아바타를 이용한 인터넷 정보 안내 시스템 구성도
도면 2. Client 구성도
도면 3. 음성합성기 구성도
본 발명의 구성은 클라이언트와 서버로 이루어지며 자세한 구성은 다음과 같다.
먼저 인터넷등 기존의 텍스트 정보를 실시간으로 인간의 음성과 흡사하게 읽어줄수 있는 음성합성기와 둘째로 고객들에게 편안하고 마치 실제로 사람과 사람이 얼굴을 마주 대하듯 명령을 내릴수 있는 음성인식기, 그리고 실시간 정보를 음성합성으로 읽어줄 수 있는 3차원 케릭터를 이용한 아바타로 구성된 클라이언트와 인터넷 관리서버로 구성된다.
본 발명의 효과는 기존의 매스 미디어가 전달하지 못하였던 현장에서 고객에 따른 차별화된 직접적인 정보 전달기능을 가지고 고객들에게 편안하고 마치 실제로 사람과 사람이 얼굴을 대하듯 여러 정보를 음성합성으로 안내함으로써 고객들에 대한 서비스 향상과 고객만족에 기여할 수 있다.
-본 발명이 적용될수 있는 시장은 공공기관, 백화점, 쇼핑몰, 박물관, 전시장, 호텔, 학교, 교육기관, 도서관, 극장, 관광안내소 등 많은 사람이 이용하며 여러 가지 안내가 필요한 장소에 적용될 수 있다.

Claims (5)

  1. 본 음성인식,합성 3차원 아바타를 이용한 인터넷 정보 안내 키오스크 시스템은 음성인식기와 음성합성기를 3차원 아바타에 연동시킨 프로그램 소프트웨어를 클라이언트 키오스크 하드웨어에 설치한다.
  2. 제1항의 클라이언트 안내 키오스크 시스템은 관리서버와TCP/IP를 이용하여 인터넷으로 연동된다.
  3. 제1항에 있어서, 상기클라이언트는 음성인식에 대하여 HMM기반의 알고리즘을 이용하여 음성을 인식하는 음성인식기를 이용한다.
  4. 제1항에 있어서, 상기클라이언트는 음성합성에 대하여 TTS(Text To Speech)를 이용하여 텍스트를 음성을 전환하는 음성합성기를 이용한다.
  5. 제1항에 있어서, 상기클라이언트는 3차원 아바타에 대하여 웹상에서 리얼타임으로 HTML과 간단한 스크립트 명령어를 통해 디자이너가 완벽하게 여러가지 상황들을 제어할 수 있게 하는 3차원 매핑기술이 적용된 아바타를 이용한다.
KR1020010019447A 2001-04-12 2001-04-12 음성인식,합성 3차원아바타시스템 KR20010082389A (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020010019447A KR20010082389A (ko) 2001-04-12 2001-04-12 음성인식,합성 3차원아바타시스템

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020010019447A KR20010082389A (ko) 2001-04-12 2001-04-12 음성인식,합성 3차원아바타시스템

Publications (1)

Publication Number Publication Date
KR20010082389A true KR20010082389A (ko) 2001-08-30

Family

ID=19708128

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020010019447A KR20010082389A (ko) 2001-04-12 2001-04-12 음성인식,합성 3차원아바타시스템

Country Status (1)

Country Link
KR (1) KR20010082389A (ko)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20020022885A (ko) * 2000-09-21 2002-03-28 이성웅 가상 캐릭터 생성 시스템 및 방법과 가상 캐릭터 서비스방법
KR102407214B1 (ko) * 2021-12-13 2022-06-10 주식회사 캐어유 노인치매 예방 및 인지건강 증진을 위한 키오스크형 노인상태관리 방법 및 시스템
KR102474399B1 (ko) * 2021-08-23 2022-12-07 박지호 사회적 약자가 손쉽게 활용하도록 접근성을 높인 키오스크와 키오스크의 콘텐츠 제공 방법

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR19990015328A (ko) * 1997-08-05 1999-03-05 정선종 웹 브라우저 상의 음성 인식기 구현방법
KR20000051794A (ko) * 1999-01-26 2000-08-16 조정남 음성 인식을 이용한 교통 정보 안내 서비스 방법
KR20000072128A (ko) * 2000-08-02 2000-12-05 엄주천 캐릭터를 이용한 음성광고시스템 및 광고방법
KR20010017865A (ko) * 1999-08-16 2001-03-05 정선종 아바타 기반 음성 언어 번역 시스템에서의 화상 통신 방법
KR20010025243A (ko) * 2000-11-14 2001-04-06 신정환 인터넷상에서의 보이스 웹 브라우저 서비스 방법
KR20020033469A (ko) * 2000-10-31 2002-05-07 오양근 인터넷 음성 도우미

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR19990015328A (ko) * 1997-08-05 1999-03-05 정선종 웹 브라우저 상의 음성 인식기 구현방법
KR20000051794A (ko) * 1999-01-26 2000-08-16 조정남 음성 인식을 이용한 교통 정보 안내 서비스 방법
KR20010017865A (ko) * 1999-08-16 2001-03-05 정선종 아바타 기반 음성 언어 번역 시스템에서의 화상 통신 방법
KR20000072128A (ko) * 2000-08-02 2000-12-05 엄주천 캐릭터를 이용한 음성광고시스템 및 광고방법
KR20020033469A (ko) * 2000-10-31 2002-05-07 오양근 인터넷 음성 도우미
KR20010025243A (ko) * 2000-11-14 2001-04-06 신정환 인터넷상에서의 보이스 웹 브라우저 서비스 방법

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20020022885A (ko) * 2000-09-21 2002-03-28 이성웅 가상 캐릭터 생성 시스템 및 방법과 가상 캐릭터 서비스방법
KR102474399B1 (ko) * 2021-08-23 2022-12-07 박지호 사회적 약자가 손쉽게 활용하도록 접근성을 높인 키오스크와 키오스크의 콘텐츠 제공 방법
KR102407214B1 (ko) * 2021-12-13 2022-06-10 주식회사 캐어유 노인치매 예방 및 인지건강 증진을 위한 키오스크형 노인상태관리 방법 및 시스템

Similar Documents

Publication Publication Date Title
US10163111B2 (en) Virtual photorealistic digital actor system for remote service of customers
US10628635B1 (en) Artificially intelligent hologram
Cox et al. Tessa, a system to aid communication with deaf people
DE60105995D1 (de) Animation von personen
Karpov et al. Information enquiry kiosk with multimodal user interface
US20210350784A1 (en) Correct pronunciation of names in text-to-speech synthesis
ES2231035B1 (es) Sistema y procedimiento de comunicacion basada en realidad virtual.
KR20010082389A (ko) 음성인식,합성 3차원아바타시스템
Dulyan et al. AUXie: Initial evaluation of a blind-accessible virtual museum tour
Kolesnik Conducting gesture recognition, analysis and performance system
Nijholt et al. Multimodal communication in inhabited virtual environments
Rubin et al. Talking heads
Thomas et al. Universal access and assistive technology
Ritter et al. Face translation: A multimodal translation agent
Nijholt et al. Speech and language interaction in a (virtual) cultural theatre
Kerscher The essential role of libraries serving persons who are blind and print disabled in the information age
Ronzhin et al. Client and Speech Detection System for Intelligent Infokiosk
Melin ATLAS: A generic software platform for speech technology based applications
Kunc et al. ECAF: Authoring language for embodied conversational agents
Gustafson Developing multimodal spoken dialogue systems
Nekola Congregational Music as Phatic Communication: Affect, Atmosphere, and Relational Ways of Listening and Being
Lincoln et al. The development and evaluation of a speech to sign translation system to assist transactions
Badeji Communication Aesthetics of Techno-scenery and Lighting in Bolanle Austen-Peters Queen Moremi the Musical
Collins On being a body listening: vocal expression beyond words in Ant Hampton and Britt Hatzius’ this is not my voice speaking and nature theater of Oklahoma life and times-episodes 3 & 4
Nijholt The Twente virtual theatre environment: Agents and interactions

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E601 Decision to refuse application