KR100917552B1 - 대화 시스템의 충실도를 향상시키는 방법 및 컴퓨터이용가능 매체 - Google Patents
대화 시스템의 충실도를 향상시키는 방법 및 컴퓨터이용가능 매체 Download PDFInfo
- Publication number
- KR100917552B1 KR100917552B1 KR1020077008312A KR20077008312A KR100917552B1 KR 100917552 B1 KR100917552 B1 KR 100917552B1 KR 1020077008312 A KR1020077008312 A KR 1020077008312A KR 20077008312 A KR20077008312 A KR 20077008312A KR 100917552 B1 KR100917552 B1 KR 100917552B1
- Authority
- KR
- South Korea
- Prior art keywords
- input
- user
- text
- fidelity
- conversation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
- G10L13/08—Text analysis or generation of parameters for speech synthesis out of text, e.g. grapheme to phoneme translation, prosody generation or stress or intonation determination
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
- G10L13/02—Methods for producing synthetic speech; Speech synthesisers
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/06—Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/06—Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
- G10L15/065—Adaptation
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Multimedia (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Acoustics & Sound (AREA)
- Artificial Intelligence (AREA)
- Machine Translation (AREA)
- Telephonic Communication Services (AREA)
- Inorganic Insulating Materials (AREA)
- Undergarments, Swaddling Clothes, Handkerchiefs Or Underwear Materials (AREA)
- Glass Compositions (AREA)
- Digital Computer Display Output (AREA)
Abstract
Description
Claims (10)
- 대화 시스템의 충실도(fidelity)를 향상시키는 방법으로서,제 1 양상(modality)으로 동작하는 제 1 시스템(211)의 사용자에 의해 생성된 제 1 입력(121)을 액세스하는 단계―상기 제 1 시스템(211)은 상기 제 1 입력(121)에 대응하는 제 1 출력(151)을 생성함―와,제 2 양상으로 동작하는 제 2 시스템(212)의 사용자에 의해 생성된 제 2 입력(152)을 액세스하는 단계―상기 제 1 시스템(211)의 상기 사용자와 상기 제 2 시스템(212)의 상기 사용자가 대화에 참여함―와,상기 제 1 시스템(211)의 후속 출력을 변경하도록 상기 제 2 입력(152)을 이용하는 단계를 포함하는대화 시스템의 충실도를 향상시키는 방법.
- 제 1 항에 있어서,상기 제 1 시스템(211)은 문자-음성 변환 시스템(text-to-speech system)을 포함하고,상기 제 2 시스템(212)은 자동 음성 인식 시스템(automatic speech recognition system)을 포함하며,상기 이용하는 단계는,상기 문자-음성 변환 시스템의 오디오 출력을 변경하도록 상기 자동 음성 인식 시스템의 오디오 입력을 이용하는 단계를 포함하는대화 시스템의 충실도를 향상시키는 방법.
- 제 1 항에 있어서,데이터베이스(213)를 변경하되, 본질적으로 사전 적응(dictionary adaptation) 및 사전 증가(dictionary augmentation)로 구성되는 그룹으로부터 선택된 처리가 수행되는 단계를 더 포함하는대화 시스템의 충실도를 향상시키는 방법.
- 제 3 항에 있어서,상기 데이터베이스(213)는 상기 제 1 시스템(211)의 구성요소인대화 시스템의 충실도를 향상시키는 방법.
- 제 3 항에 있어서,상기 데이터베이스(213)는 상기 제 2 시스템(212)의 구성요소인대화 시스템의 충실도를 향상시키는 방법.
- 제 3 항에 있어서,상기 데이터베이스(213)는 상기 제 1 시스템(211) 및 상기 제 2 시스템(212)의 공통 구성요소인대화 시스템의 충실도를 향상시키는 방법.
- 제 1 항에 있어서,상기 이용하는 단계는,상기 후속 출력의 적어도 일부분을 상기 제 2 입력(152)으로 대체하는 단계를 포함하는대화 시스템의 충실도를 향상시키는 방법.
- 제 1 항에 있어서,상기 제 1 시스템은 자동 음성 인식 시스템을 포함하고,상기 제 2 시스템은 문자-음성 변환 시스템을 포함하며,상기 이용하는 단계는,상기 자동 음성 인식 시스템의 문자 출력을 변경하도록 상기 문자-음성 변환 시스템의 문자 입력을 이용하는 단계를 포함하는대화 시스템의 충실도를 향상시키는 방법.
- 컴퓨터 시스템이 대화 시스템의 충실도를 향상시키는 방법을 수행하도록 하는 컴퓨터 판독가능 프로그램 코드가 내장된 컴퓨터 이용가능 매체로서,상기 방법은,제 1 양상으로 동작하는 제 1 시스템(211)의 사용자에 의해 생성된 제 1 입력(121)을 액세스하는 단계―상기 제 1 시스템(211)은 상기 제 1 입력(121)에 대응하는 제 1 출력(151)을 생성함―와,제 2 양상으로 동작하는 제 2 시스템(212)의 사용자에 의해 생성된 제 2 입력(152)을 액세스하는 단계―상기 제 1 시스템(211)의 상기 사용자와 상기 제 2 시스템(212)의 상기 사용자가 대화에 참여함―와,상기 제 1 시스템(211)의 후속 출력을 변경하도록 상기 제 2 입력(152)을 이용하는 단계를 포함하는컴퓨터 이용가능 매체.
- 제 9 항에 있어서,상기 제 1 시스템은 문자-음성 변환 시스템을 포함하고,상기 제 2 시스템은 자동 음성 인식 시스템을 포함하며,상기 이용하는 단계는,상기 문자-음성 변환 시스템의 오디오 출력을 변경하도록 상기 자동 음성 인식 시스템의 오디오 입력을 이용하는컴퓨터 이용가능 매체.
Applications Claiming Priority (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| US10/965,540 US8463611B2 (en) | 2004-10-13 | 2004-10-13 | Method and system for improving the fidelity of a dialog system |
| US10/965,540 | 2004-10-13 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| KR20070053802A KR20070053802A (ko) | 2007-05-25 |
| KR100917552B1 true KR100917552B1 (ko) | 2009-09-16 |
Family
ID=35641478
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| KR1020077008312A Expired - Fee Related KR100917552B1 (ko) | 2004-10-13 | 2005-10-07 | 대화 시스템의 충실도를 향상시키는 방법 및 컴퓨터이용가능 매체 |
Country Status (7)
| Country | Link |
|---|---|
| US (1) | US8463611B2 (ko) |
| EP (1) | EP1800292B1 (ko) |
| JP (1) | JP4809358B2 (ko) |
| KR (1) | KR100917552B1 (ko) |
| AT (1) | ATE417345T1 (ko) |
| DE (1) | DE602005011650D1 (ko) |
| WO (1) | WO2006044253A1 (ko) |
Families Citing this family (7)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US7643687B2 (en) * | 2005-03-18 | 2010-01-05 | Microsoft Corporation | Analysis hints |
| US8380512B2 (en) * | 2008-03-10 | 2013-02-19 | Yahoo! Inc. | Navigation using a search engine and phonetic voice recognition |
| CN103631802B (zh) * | 2012-08-24 | 2015-05-20 | 腾讯科技(深圳)有限公司 | 歌曲信息检索方法、装置及相应的服务器 |
| US9292254B2 (en) * | 2013-05-15 | 2016-03-22 | Maluuba Inc. | Interactive user interface for an intelligent assistant |
| TWI508057B (zh) * | 2013-07-15 | 2015-11-11 | Chunghwa Picture Tubes Ltd | 語音辨識系統以及方法 |
| US9710071B2 (en) * | 2014-09-22 | 2017-07-18 | Rovi Guides, Inc. | Methods and systems for recalibrating a user device based on age of a user and received verbal input |
| US11501765B2 (en) * | 2018-11-05 | 2022-11-15 | Dish Network L.L.C. | Behavior detection |
Citations (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US5995590A (en) | 1998-03-05 | 1999-11-30 | International Business Machines Corporation | Method and apparatus for a communication device for use by a hearing impaired/mute or deaf person or in silent environments |
| WO2001069895A1 (en) * | 2000-03-13 | 2001-09-20 | Giuseppe Baldino | Telephonic device for deaf-mutes |
| KR20040073708A (ko) * | 2003-02-14 | 2004-08-21 | (주)모이존 | 음성 및 문자를 이용한 대화가 가능한 온라인 게임 시스템 |
Family Cites Families (9)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2000242642A (ja) | 1999-02-18 | 2000-09-08 | Sony Corp | 翻訳処理方法及び翻訳処理装置 |
| EP1283518A4 (en) | 2000-03-17 | 2004-12-29 | Migaku Takahashi | VERTICAL MAGNETIC RECORDING MEDIUM AND METHOD FOR ITS EVALUATION |
| US6546082B1 (en) * | 2000-05-02 | 2003-04-08 | International Business Machines Corporation | Method and apparatus for assisting speech and hearing impaired subscribers using the telephone and central office |
| JP2001343993A (ja) | 2000-05-30 | 2001-12-14 | Atr Onsei Gengo Tsushin Kenkyusho:Kk | 対話システムにおける音声認識方法、対話システムおよび対話プログラムを記録したコンピュータ読み取り可能な記録媒体 |
| US6701162B1 (en) * | 2000-08-31 | 2004-03-02 | Motorola, Inc. | Portable electronic telecommunication device having capabilities for the hearing-impaired |
| US7254227B2 (en) * | 2001-10-01 | 2007-08-07 | Inderpal Singh Mumick | Signal-based session management for telephonic applications |
| JP2004118720A (ja) | 2002-09-27 | 2004-04-15 | Toshiba Corp | 翻訳装置、翻訳方法及び翻訳プログラム |
| JP4270943B2 (ja) | 2003-05-29 | 2009-06-03 | 三菱電機株式会社 | 音声認識装置 |
| JP2005345681A (ja) | 2004-06-02 | 2005-12-15 | Nippon Telegr & Teleph Corp <Ntt> | 異言語間対話処理方法および装置 |
-
2004
- 2004-10-13 US US10/965,540 patent/US8463611B2/en not_active Expired - Fee Related
-
2005
- 2005-10-07 AT AT05802528T patent/ATE417345T1/de not_active IP Right Cessation
- 2005-10-07 KR KR1020077008312A patent/KR100917552B1/ko not_active Expired - Fee Related
- 2005-10-07 JP JP2007536748A patent/JP4809358B2/ja not_active Expired - Fee Related
- 2005-10-07 WO PCT/US2005/036152 patent/WO2006044253A1/en not_active Ceased
- 2005-10-07 DE DE602005011650T patent/DE602005011650D1/de not_active Expired - Lifetime
- 2005-10-07 EP EP05802528A patent/EP1800292B1/en not_active Expired - Lifetime
Patent Citations (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US5995590A (en) | 1998-03-05 | 1999-11-30 | International Business Machines Corporation | Method and apparatus for a communication device for use by a hearing impaired/mute or deaf person or in silent environments |
| WO2001069895A1 (en) * | 2000-03-13 | 2001-09-20 | Giuseppe Baldino | Telephonic device for deaf-mutes |
| KR20040073708A (ko) * | 2003-02-14 | 2004-08-21 | (주)모이존 | 음성 및 문자를 이용한 대화가 가능한 온라인 게임 시스템 |
Also Published As
| Publication number | Publication date |
|---|---|
| EP1800292A1 (en) | 2007-06-27 |
| KR20070053802A (ko) | 2007-05-25 |
| JP2008516294A (ja) | 2008-05-15 |
| DE602005011650D1 (de) | 2009-01-22 |
| WO2006044253A1 (en) | 2006-04-27 |
| ATE417345T1 (de) | 2008-12-15 |
| US8463611B2 (en) | 2013-06-11 |
| JP4809358B2 (ja) | 2011-11-09 |
| EP1800292B1 (en) | 2008-12-10 |
| US20060080102A1 (en) | 2006-04-13 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| KR102582291B1 (ko) | 감정 정보 기반의 음성 합성 방법 및 장치 | |
| KR102342172B1 (ko) | 제작자 제공 콘텐츠 기반 인터랙티브 대화 애플리케이션 테일링 | |
| RU2352979C2 (ru) | Синхронное понимание семантических объектов для высокоинтерактивного интерфейса | |
| US8290775B2 (en) | Pronunciation correction of text-to-speech systems between different spoken languages | |
| CN107039038B (zh) | 学习个性化实体发音 | |
| US20020128840A1 (en) | Artificial language | |
| US6366882B1 (en) | Apparatus for converting speech to text | |
| US6853971B2 (en) | Two-way speech recognition and dialect system | |
| US20020198715A1 (en) | Artificial language generation | |
| JP2004355630A (ja) | 音声アプリケーション言語タグとともに実装される理解同期意味オブジェクト | |
| WO2008084476A2 (en) | Vowel recognition system and method in speech to text applications | |
| CN117043856A (zh) | 高效流式非递归设备上的端到端模型 | |
| JP7335460B2 (ja) | テキストエコー消去 | |
| JP4818683B2 (ja) | 言語モデルを作成する方法 | |
| US20020198712A1 (en) | Artificial language generation and evaluation | |
| KR100917552B1 (ko) | 대화 시스템의 충실도를 향상시키는 방법 및 컴퓨터이용가능 매체 | |
| TWI768412B (zh) | 發音教學方法 | |
| Sharma et al. | Exploration of speech enabled system for English | |
| Dodiya et al. | Speech Recognition System for Medical Domain | |
| US20240339041A1 (en) | Conversational teaching method and system and server thereof | |
| Munteanu et al. | Speech-based interaction | |
| JP2025135075A (ja) | 情報処理システム、音声認識システム、情報処理方法、及びプログラム | |
| KR20240119458A (ko) | 다중 인공지능 음성 인식 모델 및 챗봇을 이용하여 인식 정확도가 개선된 음성 인식 처리 장치 및 그 동작 방법 | |
| Delic et al. | Speech-Enabled Computers as a Tool for Serbian-Speaking Blind Persons | |
| JP2007535692A (ja) | 任意に話されたキャラクタのコンピュータによる認識及び解釈のためのシステム及び方法 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A201 | Request for examination | ||
| PA0105 | International application |
St.27 status event code: A-0-1-A10-A15-nap-PA0105 |
|
| PA0201 | Request for examination |
St.27 status event code: A-1-2-D10-D11-exm-PA0201 |
|
| P11-X000 | Amendment of application requested |
St.27 status event code: A-2-2-P10-P11-nap-X000 |
|
| P13-X000 | Application amended |
St.27 status event code: A-2-2-P10-P13-nap-X000 |
|
| PG1501 | Laying open of application |
St.27 status event code: A-1-1-Q10-Q12-nap-PG1501 |
|
| E902 | Notification of reason for refusal | ||
| PE0902 | Notice of grounds for rejection |
St.27 status event code: A-1-2-D10-D21-exm-PE0902 |
|
| T11-X000 | Administrative time limit extension requested |
St.27 status event code: U-3-3-T10-T11-oth-X000 |
|
| P11-X000 | Amendment of application requested |
St.27 status event code: A-2-2-P10-P11-nap-X000 |
|
| P13-X000 | Application amended |
St.27 status event code: A-2-2-P10-P13-nap-X000 |
|
| E902 | Notification of reason for refusal | ||
| PE0902 | Notice of grounds for rejection |
St.27 status event code: A-1-2-D10-D21-exm-PE0902 |
|
| R18-X000 | Changes to party contact information recorded |
St.27 status event code: A-3-3-R10-R18-oth-X000 |
|
| PN2301 | Change of applicant |
St.27 status event code: A-3-3-R10-R13-asn-PN2301 St.27 status event code: A-3-3-R10-R11-asn-PN2301 |
|
| P11-X000 | Amendment of application requested |
St.27 status event code: A-2-2-P10-P11-nap-X000 |
|
| P13-X000 | Application amended |
St.27 status event code: A-2-2-P10-P13-nap-X000 |
|
| E701 | Decision to grant or registration of patent right | ||
| PE0701 | Decision of registration |
St.27 status event code: A-1-2-D10-D22-exm-PE0701 |
|
| GRNT | Written decision to grant | ||
| PR0701 | Registration of establishment |
St.27 status event code: A-2-4-F10-F11-exm-PR0701 |
|
| PR1002 | Payment of registration fee |
St.27 status event code: A-2-2-U10-U12-oth-PR1002 Fee payment year number: 1 |
|
| PG1601 | Publication of registration |
St.27 status event code: A-4-4-Q10-Q13-nap-PG1601 |
|
| FPAY | Annual fee payment |
Payment date: 20120824 Year of fee payment: 4 |
|
| PR1001 | Payment of annual fee |
St.27 status event code: A-4-4-U10-U11-oth-PR1001 Fee payment year number: 4 |
|
| P22-X000 | Classification modified |
St.27 status event code: A-4-4-P10-P22-nap-X000 |
|
| FPAY | Annual fee payment |
Payment date: 20130909 Year of fee payment: 5 |
|
| PR1001 | Payment of annual fee |
St.27 status event code: A-4-4-U10-U11-oth-PR1001 Fee payment year number: 5 |
|
| FPAY | Annual fee payment |
Payment date: 20140901 Year of fee payment: 6 |
|
| PR1001 | Payment of annual fee |
St.27 status event code: A-4-4-U10-U11-oth-PR1001 Fee payment year number: 6 |
|
| PR1001 | Payment of annual fee |
St.27 status event code: A-4-4-U10-U11-oth-PR1001 Fee payment year number: 7 |
|
| LAPS | Lapse due to unpaid annual fee | ||
| PC1903 | Unpaid annual fee |
St.27 status event code: A-4-4-U10-U13-oth-PC1903 Not in force date: 20160909 Payment event data comment text: Termination Category : DEFAULT_OF_REGISTRATION_FEE |
|
| PC1903 | Unpaid annual fee |
St.27 status event code: N-4-6-H10-H13-oth-PC1903 Ip right cessation event data comment text: Termination Category : DEFAULT_OF_REGISTRATION_FEE Not in force date: 20160909 |
|
| R18-X000 | Changes to party contact information recorded |
St.27 status event code: A-5-5-R10-R18-oth-X000 |