WO2013180600A3 - Способ переозвучивания аудиоматериалов и устройство для его осуществления - Google Patents

Способ переозвучивания аудиоматериалов и устройство для его осуществления Download PDF

Info

Publication number
WO2013180600A3
WO2013180600A3 PCT/RU2013/000404 RU2013000404W WO2013180600A3 WO 2013180600 A3 WO2013180600 A3 WO 2013180600A3 RU 2013000404 W RU2013000404 W RU 2013000404W WO 2013180600 A3 WO2013180600 A3 WO 2013180600A3
Authority
WO
WIPO (PCT)
Prior art keywords
acoustic
database
phrases
materials
user
Prior art date
Application number
PCT/RU2013/000404
Other languages
English (en)
French (fr)
Other versions
WO2013180600A2 (ru
Inventor
Александр Юрьевич БРЕДИХИН
Original Assignee
Bredikhin Aleksandr Yurevich
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Bredikhin Aleksandr Yurevich filed Critical Bredikhin Aleksandr Yurevich
Priority to US14/402,084 priority Critical patent/US20150112687A1/en
Publication of WO2013180600A2 publication Critical patent/WO2013180600A2/ru
Publication of WO2013180600A3 publication Critical patent/WO2013180600A3/ru

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/02Methods for producing synthetic speech; Speech synthesisers
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/003Changing voice quality, e.g. pitch or formants
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/02Methods for producing synthetic speech; Speech synthesisers
    • G10L13/033Voice editing, e.g. manipulating the voice of the synthesiser

Landscapes

  • Engineering & Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Electrically Operated Instructional Devices (AREA)

Abstract

 Способ и устройство позволяют повысить качество проведения фазы обучения, улучшить степень совпадения голоса пользователя в конвертированном речевом сигнале, обеспечить возможность одноразового проведения фазы обучения для различных аудиоматериалов. В программно управляемом электронном устройстве обработки информации (ПУЭУОИ) формируют акустическую базу исходных аудиоматериалов (АБИА) и акустическую обучающую базу (АОБ). Передают данные из АБИА для отображения списка исходных аудиоматериалов на экране монитора. Осуществляют выбор из АОБ обучающих фраз диктора файлы, которые преобразуют в звуковые фразы и передают их пользователю. Пользователь воспроизводит звуковые фразы, в процессе воспроизведения которых отображают текст воспроизводимой фразы и курсор, перемещающийся по тексту фразы в соответствии с тем, как пользователь должен ее воспроизвести. Создают файлы в соответствии с воспроизводимыми фразами, которые сохраняют по порядку воспроизведения фраз в формируемой акустической базе целевого диктора (АБЦД). ПУЭУОИ производит контроль скорости воспроизводимой фразы и ее громкости. Формируют файл функции конверсии. Файлы АБИА конвертируют для сохранения в формируемой акустической базе конвертированных аудиоматериалов (АБКА) и предоставления пользователю данных о конвертированных аудиоматериалах на экране монитора.
PCT/RU2013/000404 2012-05-18 2013-05-16 Способ переозвучивания аудиоматериалов и устройство для его осуществления WO2013180600A2 (ru)

Priority Applications (1)

Application Number Priority Date Filing Date Title
US14/402,084 US20150112687A1 (en) 2012-05-18 2013-05-16 Method for rerecording audio materials and device for implementation thereof

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
RU2012120562/08A RU2510954C2 (ru) 2012-05-18 2012-05-18 Способ переозвучивания аудиоматериалов и устройство для его осуществления
RU2012120562 2012-05-18

Publications (2)

Publication Number Publication Date
WO2013180600A2 WO2013180600A2 (ru) 2013-12-05
WO2013180600A3 true WO2013180600A3 (ru) 2014-02-20

Family

ID=49624902

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/RU2013/000404 WO2013180600A2 (ru) 2012-05-18 2013-05-16 Способ переозвучивания аудиоматериалов и устройство для его осуществления

Country Status (3)

Country Link
US (1) US20150112687A1 (ru)
RU (1) RU2510954C2 (ru)
WO (1) WO2013180600A2 (ru)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10008198B2 (en) * 2013-03-28 2018-06-26 Korea Advanced Institute Of Science And Technology Nested segmentation method for speech recognition based on sound processing of brain
US9302393B1 (en) * 2014-04-15 2016-04-05 Alan Rosen Intelligent auditory humanoid robot and computerized verbalization system programmed to perform auditory and verbal artificial intelligence processes
US11069334B2 (en) * 2018-08-13 2021-07-20 Carnegie Mellon University System and method for acoustic activity recognition
US11361760B2 (en) * 2018-12-13 2022-06-14 Learning Squared, Inc. Variable-speed phonetic pronunciation machine

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5847303A (en) * 1997-03-25 1998-12-08 Yamaha Corporation Voice processor with adaptive configuration by parameter setting
US20070038455A1 (en) * 2005-08-09 2007-02-15 Murzina Marina V Accent detection and correction system
RU2393548C1 (ru) * 2008-11-28 2010-06-27 Общество с ограниченной ответственностью "Конвент Люкс" Устройство для изменения входящего голосового сигнала в выходящий голосовой сигнал в соответствии с целевым голосовым сигналом
RU2427044C1 (ru) * 2010-05-14 2011-08-20 Закрытое акционерное общество "Ай-Ти Мобайл" Текстозависимый способ конверсии голоса

Family Cites Families (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6006187A (en) * 1996-10-01 1999-12-21 Lucent Technologies Inc. Computer prosody user interface
DE69826446T2 (de) * 1997-01-27 2005-01-20 Microsoft Corp., Redmond Stimmumwandlung
JP4267101B2 (ja) * 1997-11-17 2009-05-27 インターナショナル・ビジネス・マシーンズ・コーポレーション 音声識別装置、発音矯正装置およびこれらの方法
US7292980B1 (en) * 1999-04-30 2007-11-06 Lucent Technologies Inc. Graphical user interface and method for modifying pronunciations in text-to-speech and speech recognition systems
US6836761B1 (en) * 1999-10-21 2004-12-28 Yamaha Corporation Voice converter for assimilation by frame synthesis with temporal alignment
DE102004012208A1 (de) * 2004-03-12 2005-09-29 Siemens Ag Individualisierung von Sprachausgabe durch Anpassen einer Synthesestimme an eine Zielstimme
JP4829477B2 (ja) * 2004-03-18 2011-12-07 日本電気株式会社 声質変換装置および声質変換方法ならびに声質変換プログラム
JP4093252B2 (ja) * 2005-05-12 2008-06-04 セイコーエプソン株式会社 話者音質変換方法および話者音質変換装置
RU66103U1 (ru) * 2007-05-21 2007-08-27 Общество с ограниченной ответственностью "ТЕЛЕКОНТЕНТ" Устройство обработки речевой информации для модуляции входного голосового сигнала путем его преобразования в выходной голосовой сигнал
US8751239B2 (en) * 2007-10-04 2014-06-10 Core Wireless Licensing, S.a.r.l. Method, apparatus and computer program product for providing text independent voice conversion
US8996376B2 (en) * 2008-04-05 2015-03-31 Apple Inc. Intelligent text-to-speech conversion
WO2010031437A1 (en) * 2008-09-19 2010-03-25 Asociacion Centro De Tecnologias De Interaccion Visual Y Comunicaciones Vicomtech Method and system of voice conversion
RU2421827C2 (ru) * 2009-08-07 2011-06-20 Общество с ограниченной ответственностью "Центр речевых технологий" Способ синтеза речи
US20110208508A1 (en) * 2010-02-25 2011-08-25 Shane Allan Criddle Interactive Language Training System
US9679496B2 (en) * 2011-12-01 2017-06-13 Arkady Zilberman Reverse language resonance systems and methods for foreign language acquisition
US9275633B2 (en) * 2012-01-09 2016-03-01 Microsoft Technology Licensing, Llc Crowd-sourcing pronunciation corrections in text-to-speech engines
US9075760B2 (en) * 2012-05-07 2015-07-07 Audible, Inc. Narration settings distribution for content customization
US20140258858A1 (en) * 2012-05-07 2014-09-11 Douglas Hwang Content customization

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5847303A (en) * 1997-03-25 1998-12-08 Yamaha Corporation Voice processor with adaptive configuration by parameter setting
US20070038455A1 (en) * 2005-08-09 2007-02-15 Murzina Marina V Accent detection and correction system
RU2393548C1 (ru) * 2008-11-28 2010-06-27 Общество с ограниченной ответственностью "Конвент Люкс" Устройство для изменения входящего голосового сигнала в выходящий голосовой сигнал в соответствии с целевым голосовым сигналом
RU2427044C1 (ru) * 2010-05-14 2011-08-20 Закрытое акционерное общество "Ай-Ти Мобайл" Текстозависимый способ конверсии голоса

Also Published As

Publication number Publication date
US20150112687A1 (en) 2015-04-23
RU2510954C2 (ru) 2014-04-10
WO2013180600A2 (ru) 2013-12-05
RU2012120562A (ru) 2013-11-27

Similar Documents

Publication Publication Date Title
WO2015184196A3 (en) Speech summary and action item generation
CA3058928A1 (en) Hands-free annotations of audio text
JP2017515134A5 (ru)
WO2007027596A3 (en) System, device, and method for conveying information using a rapid serial presentation technique
RU2012150997A (ru) Способ обучения информационной диалоговой системы пользователем
US20140013192A1 (en) Techniques for touch-based digital document audio and user interface enhancement
WO2015013633A3 (en) Synchronizing e-books with original or custom-created scores
WO2013180600A3 (ru) Способ переозвучивания аудиоматериалов и устройство для его осуществления
WO2014069220A1 (ja) 再生装置、設定装置、再生方法およびプログラム
WO2011053052A3 (en) Apparatus and method for reproducing multimedia content
JP2016071029A5 (ru)
JP2014222290A5 (ru)
CN103177621A (zh) 一种乐器教学多媒体教学技术
KR101326275B1 (ko) 문자 및 음성 동기화 출력 장치
Lin et al. The relationship between fluency, intelligibility, and acceptability of non-native spoken English
KR20110110382A (ko) 언어 학습을 위해 멀티미디어 자막으로 음성 인식 시스템을 사용하는 방법
US8990087B1 (en) Providing text to speech from digital content on an electronic device
Katsika et al. The scope of boundary lengthening as a function of lexical stress and pitch accent
Leonard et al. Human superior temporal gyrus encoding of speech sequence probabilities
US20160111081A1 (en) Med Say
Gubbins et al. Foreign accent production and perception: An acoustic analysis of non-native Japanese
Hirata et al. A limited role of hand gestures and head nods in native English speakers’ production of Mandarin tones
CN105304102A (zh) 一种音频处理方法及装置
Neel Vowels and intelligibility in dysarthric speech
US20170116880A1 (en) Integrated and interactive multi-modal framework for speech therapy

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 13797556

Country of ref document: EP

Kind code of ref document: A2

WWE Wipo information: entry into national phase

Ref document number: 14402084

Country of ref document: US

122 Ep: pct application non-entry in european phase

Ref document number: 13797556

Country of ref document: EP

Kind code of ref document: A2