KR20070053802A - 대화 시스템의 충실도를 향상시키는 방법 및 컴퓨터이용가능 매체 - Google Patents
대화 시스템의 충실도를 향상시키는 방법 및 컴퓨터이용가능 매체 Download PDFInfo
- Publication number
- KR20070053802A KR20070053802A KR1020077008312A KR20077008312A KR20070053802A KR 20070053802 A KR20070053802 A KR 20070053802A KR 1020077008312 A KR1020077008312 A KR 1020077008312A KR 20077008312 A KR20077008312 A KR 20077008312A KR 20070053802 A KR20070053802 A KR 20070053802A
- Authority
- KR
- South Korea
- Prior art keywords
- input
- document
- user
- output
- audio
- Prior art date
Links
- 238000000034 method Methods 0.000 claims abstract description 34
- 230000008569 process Effects 0.000 claims description 9
- 230000006978 adaptation Effects 0.000 claims description 7
- 238000006243 chemical reaction Methods 0.000 claims description 5
- 230000003416 augmentation Effects 0.000 claims 1
- 230000002708 enhancing effect Effects 0.000 claims 1
- 230000008859 change Effects 0.000 abstract description 52
- 238000004891 communication Methods 0.000 description 10
- 238000012545 processing Methods 0.000 description 8
- 241000282326 Felis catus Species 0.000 description 7
- 230000001413 cellular effect Effects 0.000 description 7
- 238000010586 diagram Methods 0.000 description 7
- 230000004044 response Effects 0.000 description 7
- 230000008878 coupling Effects 0.000 description 2
- 238000010168 coupling process Methods 0.000 description 2
- 238000005859 coupling reaction Methods 0.000 description 2
- 238000013500 data storage Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 241001580935 Aglossa pinguinalis Species 0.000 description 1
- 241000699666 Mus <mouse, genus> Species 0.000 description 1
- 241000699670 Mus sp. Species 0.000 description 1
- 241000009328 Perro Species 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000006073 displacement reaction Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 238000012549 training Methods 0.000 description 1
- 238000000844 transformation Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
- G10L13/08—Text analysis or generation of parameters for speech synthesis out of text, e.g. grapheme to phoneme translation, prosody generation or stress or intonation determination
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
- G10L13/02—Methods for producing synthetic speech; Speech synthesisers
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/06—Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/06—Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
- G10L15/065—Adaptation
Landscapes
- Engineering & Computer Science (AREA)
- Acoustics & Sound (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Multimedia (AREA)
- Artificial Intelligence (AREA)
- Machine Translation (AREA)
- Telephonic Communication Services (AREA)
- Digital Computer Display Output (AREA)
- Inorganic Insulating Materials (AREA)
- Undergarments, Swaddling Clothes, Handkerchiefs Or Underwear Materials (AREA)
- Glass Compositions (AREA)
Abstract
Description
Claims (10)
- 대화 시스템의 충실도(fidelity)를 향상시키는 방법에 있어서,제 1 양상(modality)으로 동작하는 제 1 시스템(211)의 사용자에 의해 생성된 제 1 입력(121)을 액세스하는 단계―상기 제 1 시스템(211)은 상기 제 1 입력(121)에 대응하는 제 1 출력(151)을 생성함―와,제 2 양상으로 동작하는 제 2 시스템(212)의 사용자에 의해 생성된 제 2 입력(152)을 액세스하는 단계―상기 제 1 시스템(211)의 상기 사용자와 상기 제 2 시스템(212)의 상기 사용자가 대화에 참여함―와,상기 제 1 시스템(211)의 상기 제 1 출력(151)을 변경하도록 상기 제 2 입력(152)을 이용하는 단계를 포함하는대화 시스템의 충실도를 향상시키는 방법.
- 제 1 항에 있어서,상기 제 1 시스템(211)은 문자-음성 변환 시스템(text-to-speech system)을 포함하고, 상기 제 2 시스템(212)은 자동 음성 인식 시스템(automatic speech recognition system)을 포함하며, 상기 이용하는 단계는,상기 자동 음성 인식 시스템(212)의 오디오 입력(152)을 이용하여, 상기 문서-음성 변환 시스템(211)의 오디오 출력(151)을 변경하는 단계를 포함하는 대화 시스템의 충실도를 향상시키는 방법.
- 제 1 항에 있어서,데이터베이스(213)를 변경하는 단계를 더 포함하되, 여기서, 본질적으로 사전 적응(dictionary adaptation) 및 사전 증가(dictionary augmentation)로 구성되는 그룹으로부터 선택된 처리가 수행되는 대화 시스템의 충실도를 향상시키는 방법.
- 제 3 항에 있어서,상기 데이터베이스(213)는 상기 제 1 시스템(211)의 구성요소를 포함하는 대화 시스템의 충실도를 향상시키는 방법.
- 제 3 항에 있어서,상기 데이터베이스(213)는 상기 제 2 시스템(212)의 구성요소를 포함하는 대화 시스템의 충실도를 향상시키는 방법.
- 제 3 항에 있어서,상기 데이터베이스(213)는 상기 제 1 시스템(211) 및 상기 제 2 시스템(212)의 공통 구성요소를 포함하는 대화 시스템의 충실도를 향상시키는 방법.
- 제 1 항에 있어서,상기 이용하는 단계는,상기 제 1 출력(121)의 적어도 일부분을 상기 제 2 입력(152)으로 대체하는 단계를 포함하는 대화 시스템의 충실도를 향상시키는 방법.
- 제 1 항에 있어서,상기 제 1 시스템은 자동 음성 인식 시스템(212)을 포함하고, 상기 제 2 시스템은 문서-음성 변환 시스템(211)을 포함하며, 상기 이용하는 단계는,상기 문서-음성 변환 시스템(211)의 문서 입력(121)을 이용하여, 상기 자동 음성 인식 시스템(212)의 문서 출력(122)을 변경하는 단계를 포함하는 대화 시스템의 충실도를 향상시키는 방법.
- 컴퓨터 시스템이 대화 시스템의 충실도를 향상시키는 방법을 수행하도록 하는 컴퓨터 판독가능 프로그램 코드가 내장된 컴퓨터 이용가능 매체에 있어서,상기 방법은,제 1 양상으로 동작하는 제 1 시스템(211)의 사용자에 의해 생성된 제 1 입력(121)을 액세스하는 단계―상기 제 1 시스템(211)은 상기 제 1 입력(121)에 대응하는 제 1 출력(151)을 생성함―와,제 2 양상으로 동작하는 제 2 시스템(212)의 사용자에 의해 생성된 제 2 입력(152)을 액세스하는 단계―상기 제 1 시스템(211)의 상기 사용자와 상기 제 2 시스템(211)의 상기 사용자가 대화에 참여함―와,상기 제 1 시스템(211)의 상기 제 1 출력(151)을 변경하도록 상기 제 2 입력(152)을 이용하는 단계를 포함하는컴퓨터 이용가능 매체.
- 제 9 항에 있어서,상기 제 1 시스템은 문자-음성 변환 시스템(211)을 포함하고, 상기 제 2 시스템은 자동 음성 인식 시스템(212)을 포함하며, 상기 이용하는 단계는,상기 자동 음성 인식 시스템(212)의 오디오 입력(152)을 이용하여, 상기 문서-음성 변환 시스템(211)의 오디오 출력(151)을 변경하는 단계를 포함하는 컴퓨터 이용가능 매체.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US10/965,540 US8463611B2 (en) | 2004-10-13 | 2004-10-13 | Method and system for improving the fidelity of a dialog system |
US10/965,540 | 2004-10-13 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20070053802A true KR20070053802A (ko) | 2007-05-25 |
KR100917552B1 KR100917552B1 (ko) | 2009-09-16 |
Family
ID=35641478
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020077008312A KR100917552B1 (ko) | 2004-10-13 | 2005-10-07 | 대화 시스템의 충실도를 향상시키는 방법 및 컴퓨터이용가능 매체 |
Country Status (7)
Country | Link |
---|---|
US (1) | US8463611B2 (ko) |
EP (1) | EP1800292B1 (ko) |
JP (1) | JP4809358B2 (ko) |
KR (1) | KR100917552B1 (ko) |
AT (1) | ATE417345T1 (ko) |
DE (1) | DE602005011650D1 (ko) |
WO (1) | WO2006044253A1 (ko) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7643687B2 (en) * | 2005-03-18 | 2010-01-05 | Microsoft Corporation | Analysis hints |
US8380512B2 (en) * | 2008-03-10 | 2013-02-19 | Yahoo! Inc. | Navigation using a search engine and phonetic voice recognition |
CN103631802B (zh) * | 2012-08-24 | 2015-05-20 | 腾讯科技(深圳)有限公司 | 歌曲信息检索方法、装置及相应的服务器 |
US9292254B2 (en) * | 2013-05-15 | 2016-03-22 | Maluuba Inc. | Interactive user interface for an intelligent assistant |
TWI508057B (zh) * | 2013-07-15 | 2015-11-11 | Chunghwa Picture Tubes Ltd | 語音辨識系統以及方法 |
US9710071B2 (en) * | 2014-09-22 | 2017-07-18 | Rovi Guides, Inc. | Methods and systems for recalibrating a user device based on age of a user and received verbal input |
US11501765B2 (en) * | 2018-11-05 | 2022-11-15 | Dish Network L.L.C. | Behavior detection |
Family Cites Families (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5995590A (en) | 1998-03-05 | 1999-11-30 | International Business Machines Corporation | Method and apparatus for a communication device for use by a hearing impaired/mute or deaf person or in silent environments |
JP2000242642A (ja) | 1999-02-18 | 2000-09-08 | Sony Corp | 翻訳処理方法及び翻訳処理装置 |
IT251676Y1 (it) * | 2000-03-13 | 2003-12-19 | Giuseppe Baldino | Deaf and telephone "telefono per sordo muti". |
EP1283518A4 (en) | 2000-03-17 | 2004-12-29 | Migaku Takahashi | VERTICAL MAGNETIC RECORDING MEDIUM AND ITS ASSESSMENT METHOD |
US6546082B1 (en) * | 2000-05-02 | 2003-04-08 | International Business Machines Corporation | Method and apparatus for assisting speech and hearing impaired subscribers using the telephone and central office |
JP2001343993A (ja) | 2000-05-30 | 2001-12-14 | Atr Onsei Gengo Tsushin Kenkyusho:Kk | 対話システムにおける音声認識方法、対話システムおよび対話プログラムを記録したコンピュータ読み取り可能な記録媒体 |
US6701162B1 (en) * | 2000-08-31 | 2004-03-02 | Motorola, Inc. | Portable electronic telecommunication device having capabilities for the hearing-impaired |
US7254227B2 (en) * | 2001-10-01 | 2007-08-07 | Inderpal Singh Mumick | Signal-based session management for telephonic applications |
JP2004118720A (ja) | 2002-09-27 | 2004-04-15 | Toshiba Corp | 翻訳装置、翻訳方法及び翻訳プログラム |
KR20040073708A (ko) | 2003-02-14 | 2004-08-21 | (주)모이존 | 음성 및 문자를 이용한 대화가 가능한 온라인 게임 시스템 |
JP4270943B2 (ja) | 2003-05-29 | 2009-06-03 | 三菱電機株式会社 | 音声認識装置 |
JP2005345681A (ja) | 2004-06-02 | 2005-12-15 | Nippon Telegr & Teleph Corp <Ntt> | 異言語間対話処理方法および装置 |
-
2004
- 2004-10-13 US US10/965,540 patent/US8463611B2/en active Active
-
2005
- 2005-10-07 EP EP05802528A patent/EP1800292B1/en not_active Not-in-force
- 2005-10-07 DE DE602005011650T patent/DE602005011650D1/de active Active
- 2005-10-07 WO PCT/US2005/036152 patent/WO2006044253A1/en active Application Filing
- 2005-10-07 JP JP2007536748A patent/JP4809358B2/ja not_active Expired - Fee Related
- 2005-10-07 KR KR1020077008312A patent/KR100917552B1/ko not_active IP Right Cessation
- 2005-10-07 AT AT05802528T patent/ATE417345T1/de not_active IP Right Cessation
Also Published As
Publication number | Publication date |
---|---|
WO2006044253A1 (en) | 2006-04-27 |
EP1800292B1 (en) | 2008-12-10 |
DE602005011650D1 (de) | 2009-01-22 |
EP1800292A1 (en) | 2007-06-27 |
US8463611B2 (en) | 2013-06-11 |
US20060080102A1 (en) | 2006-04-13 |
JP4809358B2 (ja) | 2011-11-09 |
ATE417345T1 (de) | 2008-12-15 |
JP2008516294A (ja) | 2008-05-15 |
KR100917552B1 (ko) | 2009-09-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102582291B1 (ko) | 감정 정보 기반의 음성 합성 방법 및 장치 | |
KR102342172B1 (ko) | 제작자 제공 콘텐츠 기반 인터랙티브 대화 애플리케이션 테일링 | |
RU2352979C2 (ru) | Синхронное понимание семантических объектов для высокоинтерактивного интерфейса | |
CN107039038B (zh) | 学习个性化实体发音 | |
RU2349969C2 (ru) | Синхронное понимание семантических объектов, реализованное с помощью тэгов речевого приложения | |
US20020128840A1 (en) | Artificial language | |
US6456975B1 (en) | Automated centralized updating of speech recognition systems | |
US20080052073A1 (en) | Voice Recognition Device and Method, and Program | |
US20020161580A1 (en) | Two-way speech recognition and dialect system | |
US20100217591A1 (en) | Vowel recognition system and method in speech to text applictions | |
WO2001045088A1 (en) | Electronic translator for assisting communications | |
CN113412514A (zh) | 用于设备上语音识别模型的训练的文本片段的设备上语音合成 | |
JP2014048506A (ja) | 単語登録装置及びそのためのコンピュータプログラム | |
US11776563B2 (en) | Textual echo cancellation | |
CN117043856A (zh) | 高效流式非递归设备上的端到端模型 | |
JP4818683B2 (ja) | 言語モデルを作成する方法 | |
CN1359514A (zh) | 多模式数据输入设备 | |
US20020198712A1 (en) | Artificial language generation and evaluation | |
KR100917552B1 (ko) | 대화 시스템의 충실도를 향상시키는 방법 및 컴퓨터이용가능 매체 | |
TWI768412B (zh) | 發音教學方法 | |
Dodiya et al. | Speech Recognition System for Medical Domain | |
Karat et al. | Speech and language interfaces, applications, and technologies | |
US20240339041A1 (en) | Conversational teaching method and system and server thereof | |
Munteanu et al. | Speech-based interaction | |
Delic et al. | Speech-Enabled Computers as a Tool for Serbian-Speaking Blind Persons |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
PA0105 | International application |
Patent event date: 20070412 Patent event code: PA01051R01D Comment text: International Patent Application |
|
PA0201 | Request for examination | ||
PG1501 | Laying open of application | ||
E902 | Notification of reason for refusal | ||
PE0902 | Notice of grounds for rejection |
Comment text: Notification of reason for refusal Patent event date: 20080715 Patent event code: PE09021S01D |
|
E902 | Notification of reason for refusal | ||
PE0902 | Notice of grounds for rejection |
Comment text: Notification of reason for refusal Patent event date: 20090223 Patent event code: PE09021S01D |
|
E701 | Decision to grant or registration of patent right | ||
PE0701 | Decision of registration |
Patent event code: PE07011S01D Comment text: Decision to Grant Registration Patent event date: 20090824 |
|
GRNT | Written decision to grant | ||
PR0701 | Registration of establishment |
Comment text: Registration of Establishment Patent event date: 20090908 Patent event code: PR07011E01D |
|
PR1002 | Payment of registration fee |
Payment date: 20090908 End annual number: 3 Start annual number: 1 |
|
PG1601 | Publication of registration | ||
FPAY | Annual fee payment |
Payment date: 20120824 Year of fee payment: 4 |
|
PR1001 | Payment of annual fee |
Payment date: 20120824 Start annual number: 4 End annual number: 4 |
|
FPAY | Annual fee payment |
Payment date: 20130909 Year of fee payment: 5 |
|
PR1001 | Payment of annual fee |
Payment date: 20130909 Start annual number: 5 End annual number: 5 |
|
FPAY | Annual fee payment |
Payment date: 20140901 Year of fee payment: 6 |
|
PR1001 | Payment of annual fee |
Payment date: 20140901 Start annual number: 6 End annual number: 6 |
|
LAPS | Lapse due to unpaid annual fee | ||
PC1903 | Unpaid annual fee |
Termination category: Default of registration fee Termination date: 20170705 |