WO2013180600A3 - Способ переозвучивания аудиоматериалов и устройство для его осуществления - Google Patents
Способ переозвучивания аудиоматериалов и устройство для его осуществления Download PDFInfo
- Publication number
- WO2013180600A3 WO2013180600A3 PCT/RU2013/000404 RU2013000404W WO2013180600A3 WO 2013180600 A3 WO2013180600 A3 WO 2013180600A3 RU 2013000404 W RU2013000404 W RU 2013000404W WO 2013180600 A3 WO2013180600 A3 WO 2013180600A3
- Authority
- WO
- WIPO (PCT)
- Prior art keywords
- acoustic
- database
- phrases
- materials
- user
- Prior art date
Links
- 238000000034 method Methods 0.000 title abstract 3
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
- G10L13/02—Methods for producing synthetic speech; Speech synthesisers
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/003—Changing voice quality, e.g. pitch or formants
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
- G10L13/02—Methods for producing synthetic speech; Speech synthesisers
- G10L13/033—Voice editing, e.g. manipulating the voice of the synthesiser
Landscapes
- Engineering & Computer Science (AREA)
- Quality & Reliability (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Electrically Operated Instructional Devices (AREA)
Abstract
Способ и устройство позволяют повысить качество проведения фазы обучения, улучшить степень совпадения голоса пользователя в конвертированном речевом сигнале, обеспечить возможность одноразового проведения фазы обучения для различных аудиоматериалов. В программно управляемом электронном устройстве обработки информации (ПУЭУОИ) формируют акустическую базу исходных аудиоматериалов (АБИА) и акустическую обучающую базу (АОБ). Передают данные из АБИА для отображения списка исходных аудиоматериалов на экране монитора. Осуществляют выбор из АОБ обучающих фраз диктора файлы, которые преобразуют в звуковые фразы и передают их пользователю. Пользователь воспроизводит звуковые фразы, в процессе воспроизведения которых отображают текст воспроизводимой фразы и курсор, перемещающийся по тексту фразы в соответствии с тем, как пользователь должен ее воспроизвести. Создают файлы в соответствии с воспроизводимыми фразами, которые сохраняют по порядку воспроизведения фраз в формируемой акустической базе целевого диктора (АБЦД). ПУЭУОИ производит контроль скорости воспроизводимой фразы и ее громкости. Формируют файл функции конверсии. Файлы АБИА конвертируют для сохранения в формируемой акустической базе конвертированных аудиоматериалов (АБКА) и предоставления пользователю данных о конвертированных аудиоматериалах на экране монитора.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US14/402,084 US20150112687A1 (en) | 2012-05-18 | 2013-05-16 | Method for rerecording audio materials and device for implementation thereof |
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
RU2012120562/08A RU2510954C2 (ru) | 2012-05-18 | 2012-05-18 | Способ переозвучивания аудиоматериалов и устройство для его осуществления |
RU2012120562 | 2012-05-18 |
Publications (2)
Publication Number | Publication Date |
---|---|
WO2013180600A2 WO2013180600A2 (ru) | 2013-12-05 |
WO2013180600A3 true WO2013180600A3 (ru) | 2014-02-20 |
Family
ID=49624902
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
PCT/RU2013/000404 WO2013180600A2 (ru) | 2012-05-18 | 2013-05-16 | Способ переозвучивания аудиоматериалов и устройство для его осуществления |
Country Status (3)
Country | Link |
---|---|
US (1) | US20150112687A1 (ru) |
RU (1) | RU2510954C2 (ru) |
WO (1) | WO2013180600A2 (ru) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10008198B2 (en) * | 2013-03-28 | 2018-06-26 | Korea Advanced Institute Of Science And Technology | Nested segmentation method for speech recognition based on sound processing of brain |
US9302393B1 (en) * | 2014-04-15 | 2016-04-05 | Alan Rosen | Intelligent auditory humanoid robot and computerized verbalization system programmed to perform auditory and verbal artificial intelligence processes |
US11069334B2 (en) * | 2018-08-13 | 2021-07-20 | Carnegie Mellon University | System and method for acoustic activity recognition |
US11361760B2 (en) * | 2018-12-13 | 2022-06-14 | Learning Squared, Inc. | Variable-speed phonetic pronunciation machine |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5847303A (en) * | 1997-03-25 | 1998-12-08 | Yamaha Corporation | Voice processor with adaptive configuration by parameter setting |
US20070038455A1 (en) * | 2005-08-09 | 2007-02-15 | Murzina Marina V | Accent detection and correction system |
RU2393548C1 (ru) * | 2008-11-28 | 2010-06-27 | Общество с ограниченной ответственностью "Конвент Люкс" | Устройство для изменения входящего голосового сигнала в выходящий голосовой сигнал в соответствии с целевым голосовым сигналом |
RU2427044C1 (ru) * | 2010-05-14 | 2011-08-20 | Закрытое акционерное общество "Ай-Ти Мобайл" | Текстозависимый способ конверсии голоса |
Family Cites Families (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6006187A (en) * | 1996-10-01 | 1999-12-21 | Lucent Technologies Inc. | Computer prosody user interface |
DE69826446T2 (de) * | 1997-01-27 | 2005-01-20 | Microsoft Corp., Redmond | Stimmumwandlung |
JP4267101B2 (ja) * | 1997-11-17 | 2009-05-27 | インターナショナル・ビジネス・マシーンズ・コーポレーション | 音声識別装置、発音矯正装置およびこれらの方法 |
US7292980B1 (en) * | 1999-04-30 | 2007-11-06 | Lucent Technologies Inc. | Graphical user interface and method for modifying pronunciations in text-to-speech and speech recognition systems |
US6836761B1 (en) * | 1999-10-21 | 2004-12-28 | Yamaha Corporation | Voice converter for assimilation by frame synthesis with temporal alignment |
DE102004012208A1 (de) * | 2004-03-12 | 2005-09-29 | Siemens Ag | Individualisierung von Sprachausgabe durch Anpassen einer Synthesestimme an eine Zielstimme |
JP4829477B2 (ja) * | 2004-03-18 | 2011-12-07 | 日本電気株式会社 | 声質変換装置および声質変換方法ならびに声質変換プログラム |
JP4093252B2 (ja) * | 2005-05-12 | 2008-06-04 | セイコーエプソン株式会社 | 話者音質変換方法および話者音質変換装置 |
RU66103U1 (ru) * | 2007-05-21 | 2007-08-27 | Общество с ограниченной ответственностью "ТЕЛЕКОНТЕНТ" | Устройство обработки речевой информации для модуляции входного голосового сигнала путем его преобразования в выходной голосовой сигнал |
US8751239B2 (en) * | 2007-10-04 | 2014-06-10 | Core Wireless Licensing, S.a.r.l. | Method, apparatus and computer program product for providing text independent voice conversion |
US8996376B2 (en) * | 2008-04-05 | 2015-03-31 | Apple Inc. | Intelligent text-to-speech conversion |
WO2010031437A1 (en) * | 2008-09-19 | 2010-03-25 | Asociacion Centro De Tecnologias De Interaccion Visual Y Comunicaciones Vicomtech | Method and system of voice conversion |
RU2421827C2 (ru) * | 2009-08-07 | 2011-06-20 | Общество с ограниченной ответственностью "Центр речевых технологий" | Способ синтеза речи |
US20110208508A1 (en) * | 2010-02-25 | 2011-08-25 | Shane Allan Criddle | Interactive Language Training System |
US9679496B2 (en) * | 2011-12-01 | 2017-06-13 | Arkady Zilberman | Reverse language resonance systems and methods for foreign language acquisition |
US9275633B2 (en) * | 2012-01-09 | 2016-03-01 | Microsoft Technology Licensing, Llc | Crowd-sourcing pronunciation corrections in text-to-speech engines |
US9075760B2 (en) * | 2012-05-07 | 2015-07-07 | Audible, Inc. | Narration settings distribution for content customization |
US20140258858A1 (en) * | 2012-05-07 | 2014-09-11 | Douglas Hwang | Content customization |
-
2012
- 2012-05-18 RU RU2012120562/08A patent/RU2510954C2/ru not_active IP Right Cessation
-
2013
- 2013-05-16 US US14/402,084 patent/US20150112687A1/en not_active Abandoned
- 2013-05-16 WO PCT/RU2013/000404 patent/WO2013180600A2/ru active Application Filing
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5847303A (en) * | 1997-03-25 | 1998-12-08 | Yamaha Corporation | Voice processor with adaptive configuration by parameter setting |
US20070038455A1 (en) * | 2005-08-09 | 2007-02-15 | Murzina Marina V | Accent detection and correction system |
RU2393548C1 (ru) * | 2008-11-28 | 2010-06-27 | Общество с ограниченной ответственностью "Конвент Люкс" | Устройство для изменения входящего голосового сигнала в выходящий голосовой сигнал в соответствии с целевым голосовым сигналом |
RU2427044C1 (ru) * | 2010-05-14 | 2011-08-20 | Закрытое акционерное общество "Ай-Ти Мобайл" | Текстозависимый способ конверсии голоса |
Also Published As
Publication number | Publication date |
---|---|
US20150112687A1 (en) | 2015-04-23 |
RU2510954C2 (ru) | 2014-04-10 |
WO2013180600A2 (ru) | 2013-12-05 |
RU2012120562A (ru) | 2013-11-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2015184196A3 (en) | Speech summary and action item generation | |
CA3058928A1 (en) | Hands-free annotations of audio text | |
JP2017515134A5 (ru) | ||
WO2007027596A3 (en) | System, device, and method for conveying information using a rapid serial presentation technique | |
RU2012150997A (ru) | Способ обучения информационной диалоговой системы пользователем | |
US20140013192A1 (en) | Techniques for touch-based digital document audio and user interface enhancement | |
WO2015013633A3 (en) | Synchronizing e-books with original or custom-created scores | |
WO2013180600A3 (ru) | Способ переозвучивания аудиоматериалов и устройство для его осуществления | |
WO2014069220A1 (ja) | 再生装置、設定装置、再生方法およびプログラム | |
WO2011053052A3 (en) | Apparatus and method for reproducing multimedia content | |
JP2016071029A5 (ru) | ||
JP2014222290A5 (ru) | ||
CN103177621A (zh) | 一种乐器教学多媒体教学技术 | |
KR101326275B1 (ko) | 문자 및 음성 동기화 출력 장치 | |
Lin et al. | The relationship between fluency, intelligibility, and acceptability of non-native spoken English | |
KR20110110382A (ko) | 언어 학습을 위해 멀티미디어 자막으로 음성 인식 시스템을 사용하는 방법 | |
US8990087B1 (en) | Providing text to speech from digital content on an electronic device | |
Katsika et al. | The scope of boundary lengthening as a function of lexical stress and pitch accent | |
Leonard et al. | Human superior temporal gyrus encoding of speech sequence probabilities | |
US20160111081A1 (en) | Med Say | |
Gubbins et al. | Foreign accent production and perception: An acoustic analysis of non-native Japanese | |
Hirata et al. | A limited role of hand gestures and head nods in native English speakers’ production of Mandarin tones | |
CN105304102A (zh) | 一种音频处理方法及装置 | |
Neel | Vowels and intelligibility in dysarthric speech | |
US20170116880A1 (en) | Integrated and interactive multi-modal framework for speech therapy |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
121 | Ep: the epo has been informed by wipo that ep was designated in this application |
Ref document number: 13797556 Country of ref document: EP Kind code of ref document: A2 |
|
WWE | Wipo information: entry into national phase |
Ref document number: 14402084 Country of ref document: US |
|
122 | Ep: pct application non-entry in european phase |
Ref document number: 13797556 Country of ref document: EP Kind code of ref document: A2 |