RU153322U1 - Устройство для обучения разговорной(устной) речи с визуальной обратной связью - Google Patents

Устройство для обучения разговорной(устной) речи с визуальной обратной связью Download PDF

Info

Publication number
RU153322U1
RU153322U1 RU2014139488/12U RU2014139488U RU153322U1 RU 153322 U1 RU153322 U1 RU 153322U1 RU 2014139488/12 U RU2014139488/12 U RU 2014139488/12U RU 2014139488 U RU2014139488 U RU 2014139488U RU 153322 U1 RU153322 U1 RU 153322U1
Authority
RU
Russia
Prior art keywords
unit
block
output
pronunciation
speech signal
Prior art date
Application number
RU2014139488/12U
Other languages
English (en)
Inventor
Эммануил Григорьевич Кнеллер
Денис Владимирович Караульных
Original Assignee
Закрытое акционерное общество "ИстраСофт"
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Закрытое акционерное общество "ИстраСофт" filed Critical Закрытое акционерное общество "ИстраСофт"
Priority to RU2014139488/12U priority Critical patent/RU153322U1/ru
Application granted granted Critical
Publication of RU153322U1 publication Critical patent/RU153322U1/ru

Links

Images

Landscapes

  • Electrically Operated Instructional Devices (AREA)

Abstract

1. Устройство для помощи в обучении разговорной (устной) речи с визуальной обратной связью, содержащее блок приема речевого сигнала, аналого-цифровой преобразователь, блок шумоочистки, блок хранения входящего речевого сигнала, преобразователь-нормализатор в частотные зоны, блок управления, блок хранения акустических эталонов языка, блок настроек параметров зон фильтров на выбранный язык, блок анализа траекторий энергии в частотных зонах во времени, блок сравнения траекторий произношения звуков, блок вычисления оценки произношения, блок памяти, обеспечивающий возможности записи и хранения акустических эталонов языка, блок признаков параметров траекторий звуков, блок вывода речевого сигнала, блок вывода визуальных признаков и блок отображения информации, причем блок приема речевого сигнала соединен с аналого-цифровым преобразователем, выход которого подключен к входу блока шумоочистки, выход которого подключен к входу блока хранения входящего речевого сигнала, выход которого подключен к входу преобразователя-нормализатора, вход которого подключен к выходу блока хранения акустических эталонов языка, также вход подключен к выходу блока настроек параметров зон фильтров на выбранный язык, выход преобразователя-нормализатора подключен к блоку управления и блоку анализа траекторий энергии в частотных зонах, выход которого подключен к блоку сравнения траекторий произношения звуков, выход которого подключен к блоку вычисления.2. Устройство по п. 1, характеризующееся тем, что аналого-цифровой преобразователь имеет фиксированную частоту дискредитации.3. Устройство по п. 1, характеризующееся тем, что при пре�

Description

ОБЛАСТЬ ТЕХНИКИ
Устройство предназначено для обучения произношения разговорной речью с визуальной обратной связью и может быть использовано для обучению иностранным языкам, слабослышащих людей говорению, в логопедии, коррекции произношения, автоматической стенографии, обучении диалектам.
УРОВЕНЬ ТЕХНИКИ
Полезная модель относится к устройствам, предназначенным для обучения разговорной речи иностранным языкам, и диалектам родной речи посредством тренировки и развития способности восприятия речи на слух и правильного произношения, в частности для отработки навыка аудирования слабослышащих людей.
Из предшествующего уровня техники, известны различные способы изучения иностранных языков. Широко известны способы обучения с запоминанием иностранных слов по бумажным карточкам, на которых они нанесены с одной стороны, а их перевод - с другой, применяемые в вузах.
Однако эти способы требуют немалых усилий и затрат времени, особенно при усвоении большого количества иностранных слов и выражений. Также известно и широко распространено обучение обычным заучиванием иностранных слов со словаря, учебника и т.п. с самостоятельным их речевым произношением по написанной транскрипции. Здесь возможны ошибки в произношении этих слов обучающимся.
Существуют традиционные методы обучения иностранному языку, которые учат произносить слова, проговаривать фразы. Данные метода также подойдут для обучения, например, слабослышащего человека.
Однако все эти методы практически не направленны на отработку таких важных аспектов речи как умение правильно говорить (артикулировать) и слышать (различать) звуки речи, являющих основой устной речи.
Известны средства обучения иностранным языкам с использованием звукового воспроизведения языковых фрагментов с прослушиванием. Такие средства используются для отработки правильного произношения. Например, известно средство отработки правильного произношения, осуществляющее анализ произносимых фрагментов, разделение речи на фонемы и анализ их частотного спектра (WO 2004049283 (A1), опубликовано 2004.06.10). В изобретении используются так называемые форманты для оценки произношения, которые выводят для сравнения. Следует отметить, что данное техническое средство имеет узкое применение и предназначено для пользователей, владеющих иностранным языком, для дальнейшего совершенствования их знаний и не может быть использовано для развития навыков аудирования, т.е. дословного повторения.
Недостатком данного технического решения является низкая различительная способность, связанная с тем, что форманты не являются теми характеристиками, которые определяют звук - это только один из способов создания в речевом сигнале соответствующих физических характеристик, создающих ощущение звука. Известно, например, что звук А может иметь от одной до трех формант в зависимости от голоса говорящего.
Известно устройство для фонетического анализа и обучения речи (патент на полезную модель RU 90251, G10L 15/00, опубликовано 27.12.2009). Устройство содержит последовательно соединенные микрофон, блок сегментного анализа, спектроанализатор, блок нормализации, блок измерения сходства, блок памяти эталонов, блок оперативной памяти и блок коммутации, последовательно соединенные второй блок принятия решений, второй блок измерения сходства и блок визуализации данных, выход которого является выходом устройства.
Недостатком этого устройства является то, что вычисление сходства произношения с каким-либо эталоном производится на основании анализа всего сигнала. В то же время при обучении произношению, скажем, отдельных слов, интерес представляет, прежде всего, коррекция произношения отдельного звука (например, фонемы или слога) внутри выбранного слова. Однако предложенное устройство не позволяет проводить анализ качества произношения отдельных частей слова, учитывая информацию об интонации, акценте, ритмике, тоне (мелодики речи), громкости, темпе речи и ее отдельных отрезков, особенностей фонации.
СУЩНОСТЬ ПОЛЕЗНОЙ МОДЕЛИ
Данная полезная модель направлена на устранение недостатков, присущих существующим аналогам.
Предполагаемый технический результат, достигаемый заявленной полезной моделью, состоит в повышении эффективности обучения за счет качества определения правильности произношения звуков, звуков в словах и предложениях, интонации, ритмики и акцента, и ввода визуальной обратной связи позволяющей обучаемому не только услышать, но и увидеть на специальных графиках, отличия произносимых звуков, слов, и предложений, а также других характеристик речи таких как ритмика, и акцент от эталонного произношения. Применения аудиовизуального анализа и оригинальной системы распознавания речи, позволяет визуально сравнить правильность произношения характеристик звукового объекта относительно эталона, получить оценку его произнесения, поскольку обучающемуся необходимо знать не только то, что он совершает ошибку, но также конкретный неправильный звук, акцент, интонацию, ритмику, и получить рекомендации как ее исправить.
Указанный технический результат достигается тем, что устройство перевода речевого сигнала в транскрипционное представление, содержит блок приема речевого сигнала, последовательно соединенный с аналого-цифровым преобразователем, блок шумоотчистки, блок хранения входящего речевого сигнала, выход которого соединен с блоком преобразователя-нормализатора в частотные зоны, превышение относительной энергии в которых создает ощущение звука речи, соединенного с блоком анализа траекторий энергии в частотных зонах во времени, выходы которого соединены блоком сравнения траекторий произношения звуков, блок определения символа транскрипции, блок вычисления оценки произношения, блок управления и блок памяти, обеспечивающий возможности записи и хранения акустических эталонов языка, траекторий параметров признаков звуков, вывода речевого сигнала и визуализации параметров признаков.
КРАТКОЕ ОПИСАНИЕ ЧЕРТЕЖЕЙ
Сущность полезной модели поясняется чертежами.
На фиг. 1 - представлена блок-схема предлагаемого устройства;
ПОДРОБНОЕ ОПИСАНИЕ ПОЛЕЗНОЙ МОДЕЛИ
Данная полезная модель в различных своих вариантах осуществления может быть выполнена в виде устройства, реализующего способ.
Устройство работает следующим образом:
Блок приема речевого сигнала (1) (Фиг. 1) принимает речевой сигнал в виде звукового потока данных на вход. В качестве блока приема речевого сигнала может быть использован микрофон, как встроенный, так и внешний.
Далее речевой сигнал преобразовывается в дискретный код (цифровой сигнал) в аналого-цифровом преобразователе (2) с частотой дискретизации не менее 22 кГ (точность сигнала 16 бит). Блок приема речевого сигнала соединяется с аналого-цифровым преобразователем последовательно.
Акустический сигнал подается на блок шумоотчистки (3), в котором происходит предварительная очистка от шумов и нормализация динамического диапазона. Это осуществляется путем дополнительного усиления сигналов малого уровня, чтобы поднять их выше уровня шумов передающего тракта.
Блок хранения входящего речевого сигнала (4) соединен с преобразователем-нормализатором (5) в частотные зоны, создающие ощущение звука речи, который состоит из группы цифровых фильтров с параметрами преобразования, нормализованными с учетом характеристик чувствительности улитки уха по частоте, амплитуде и времени. Блок (5) соединен с Блоком (7), анализа траекторий энергии в частотных зонах во времени, который определяет наличие превышения энергии в частотных зонах. Блок (7) соединен с Блоком (8) сравнения траекторий произношения звуков, определения символов транскрипций формирует последовательности символов, обозначающих группы фонем, который соединен с Блоком (9) вычисления оценки правильности произнесения символов дополнительно соединенным с выходом Блока (10) признаков параметров траекторий звуков. Также Блок (5) соединен с Блоком (12) хранения акустических эталонов языка, Блоком (13) настроек параметров зон фильтров на выбранный язык.
Блок управления (6), выполненный на основе многоканального центрального микропроцессора, организует процесс взаимодействия всех блоков. Блок управления соединен по стандартным мультиплексным каналам информационного обмена с последовательно соединенными друг с другом блоком анализа траекторий энергии (7) в частотных зонах во времени, блоком сравнения траекторий произношения звуков(8), определения символов транскрипций.
Мультиплексный канал связи предназначен для связи с медленно действующими компонентами, которые могут работать одновременно. Мультиплексный канал обеспечивает работу, как в монопольном, так и мультиплексном режиме. В данной полезной модели могут применяться мультиплексные каналы по ГОСТ 26765.52-87 (отечественный аналог интерфейса по международному стандарту MIL STD 1553 В).
Также для связи блока управления (6) с периферийными блоками, могут использоваться каналы с интерфейсами EIA RS-232C (известный также как интерфейс CCITT V. 24), PCI (Peripheral Component Interconnect - Соединение внешних компонентов), PCMCIA (Personal Computer Memory Card International Association - Стандарт международной ассоциации производителей плат памяти для персональных компьютеров), USB (Universal Serial Bus - Универсальная последовательная шина).
Блок памяти (11), соединенный с блоком управления (6), также соединен по каналам интерфейсной связи с блоком признаков параметров траекторий звуков (10). Блок (6) обеспечивает возможность вызова из блока памяти (11) любого признака параметра траектории, определяющей символ звука предустановленного тематического словаря или группы словарей, размеченных по символам групп фонем, и осуществляет отбор слов, соответствующих комбинациям символов групп фонем в текущей последовательности.
Блок памяти (11) через блок управления (6), соединен с устройством (14) вывода визуальных признаков, один выход которого соединен с блоком отображения информации (15), выполненного, например, в виде дисплея, обеспечивающего возможность отображения цифровой, графической и символьной информации.
Блок отображения информации (15) может быть реализован на основе миниатюрных технических решений, широко используемых в мобильных телефонах, плеерах и других портативных устройствах.
Также блок памяти (11) через блок управления (6), соединен с блоком (16) вывода речевого сигнала, который выводит данные на порт A/V для воспроизведения посредством внешнего звукового проигрывателя или устройства, имеющего поддержку воспроизведения звука. Блок (16) вывода речевого сигнала может содержать стандартные разъемы, например, такие как S/PDIF; TOSLINK или RCA-разъем с коаксиальным кабелем.

Claims (5)

1. Устройство для помощи в обучении разговорной (устной) речи с визуальной обратной связью, содержащее блок приема речевого сигнала, аналого-цифровой преобразователь, блок шумоочистки, блок хранения входящего речевого сигнала, преобразователь-нормализатор в частотные зоны, блок управления, блок хранения акустических эталонов языка, блок настроек параметров зон фильтров на выбранный язык, блок анализа траекторий энергии в частотных зонах во времени, блок сравнения траекторий произношения звуков, блок вычисления оценки произношения, блок памяти, обеспечивающий возможности записи и хранения акустических эталонов языка, блок признаков параметров траекторий звуков, блок вывода речевого сигнала, блок вывода визуальных признаков и блок отображения информации, причем блок приема речевого сигнала соединен с аналого-цифровым преобразователем, выход которого подключен к входу блока шумоочистки, выход которого подключен к входу блока хранения входящего речевого сигнала, выход которого подключен к входу преобразователя-нормализатора, вход которого подключен к выходу блока хранения акустических эталонов языка, также вход подключен к выходу блока настроек параметров зон фильтров на выбранный язык, выход преобразователя-нормализатора подключен к блоку управления и блоку анализа траекторий энергии в частотных зонах, выход которого подключен к блоку сравнения траекторий произношения звуков, выход которого подключен к блоку вычисления.
2. Устройство по п. 1, характеризующееся тем, что аналого-цифровой преобразователь имеет фиксированную частоту дискредитации.
3. Устройство по п. 1, характеризующееся тем, что при преобразовании речевого сигнала в частотные зоны, формируют последовательности символов транскрипции звука, слова, предложения и производят визуализацию параметров звуков и оценку их правильности произношения относительно акустических эталонов.
4. Устройство по п. 1, характеризующееся тем, что блок отображения информации отображает акустические параметры звука в виде 2D- и 3D-графических представлений, позволяющие сравнить правильность произношения характеристик звукового объекта относительно акустического эталона.
5. Устройство по п. 1, характеризующееся тем, что блок сравнения траекторий произношения звуков в частотных зонах анализирует данные частотные зоны и выделяет группы звуков по похожим траекториям энергий.
Figure 00000001
RU2014139488/12U 2014-09-30 2014-09-30 Устройство для обучения разговорной(устной) речи с визуальной обратной связью RU153322U1 (ru)

Priority Applications (1)

Application Number Priority Date Filing Date Title
RU2014139488/12U RU153322U1 (ru) 2014-09-30 2014-09-30 Устройство для обучения разговорной(устной) речи с визуальной обратной связью

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
RU2014139488/12U RU153322U1 (ru) 2014-09-30 2014-09-30 Устройство для обучения разговорной(устной) речи с визуальной обратной связью

Publications (1)

Publication Number Publication Date
RU153322U1 true RU153322U1 (ru) 2015-07-10

Family

ID=53539164

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2014139488/12U RU153322U1 (ru) 2014-09-30 2014-09-30 Устройство для обучения разговорной(устной) речи с визуальной обратной связью

Country Status (1)

Country Link
RU (1) RU153322U1 (ru)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2641222C2 (ru) * 2016-09-26 2018-01-16 Владимир Анатольевич Ефремов Способ автоматического перевода устной речи с одного языка на другой и устройство для его реализации
RU2688277C1 (ru) * 2016-02-05 2019-05-21 ГУГЛ ЭлЭлСи Повторное распознавание речи с внешними источниками данных

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2688277C1 (ru) * 2016-02-05 2019-05-21 ГУГЛ ЭлЭлСи Повторное распознавание речи с внешними источниками данных
RU2641222C2 (ru) * 2016-09-26 2018-01-16 Владимир Анатольевич Ефремов Способ автоматического перевода устной речи с одного языка на другой и устройство для его реализации

Similar Documents

Publication Publication Date Title
US8972259B2 (en) System and method for teaching non-lexical speech effects
Daniels et al. The suitability of cloud-based speech recognition engines for language learning.
KR20140071070A (ko) 음소기호를 이용한 외국어 발음 학습방법 및 학습장치
Stemberger et al. Phonetic transcription for speech-language pathology in the 21st century
RU153322U1 (ru) Устройство для обучения разговорной(устной) речи с визуальной обратной связью
Kabashima et al. Dnn-based scoring of language learners’ proficiency using learners’ shadowings and native listeners’ responsive shadowings
CN205354415U (zh) 一种英语发音训练器
Simmons et al. Cross-modal transfer of talker-identity learning
JP2844817B2 (ja) 発声練習用音声合成方式
Koffi A tutorial on acoustic phonetic feature extraction for automatic speech recognition (ASR) and text-to-speech (TTS) applications in African languages
Derrick et al. Aero-tactile integration in fricatives: Converting audio to air flow information for speech perception enhancement
Martens et al. Applying adaptive recognition of the learner’s vowel space to English pronunciation training of native speakers of Japanese
US8768697B2 (en) Method for measuring speech characteristics
Malatji et al. Creating accented text-to-speech English voices to facilitate second language learning
WO2016053141A1 (ru) Устройство для обучения разговорной (устной) речи с визуальной обратной связью
Kasrani et al. A Mobile Cloud Computing Based Independent Language Learning System with Automatic Intelligibility Assessment and Instant Feedback.
CN111508523A (zh) 一种语音训练提示方法及系统
KR100780531B1 (ko) 구화 교육용 게임 시스템
JP7039637B2 (ja) 情報処理装置、情報処理方法、情報処理システム、情報処理プログラム
Choe The effect of pronunciation teaching on the realization of English rhythm by Korean learners of English
KR102610871B1 (ko) 청각장애인 음성언어훈련 시스템
Fuchs The phonology of English
Sarvinoz MISPRONUNCIATION DETECTION IN NONNATIVE ENGLISH
Takahashi et al. Perception of American and Australian English “can” and “can’t” by Japanese Listeners: How to Teach “can” and “can’t”
Antonova The use of software tools Praat and Audacity in teaching Chinese L2 pronunciation

Legal Events

Date Code Title Description
MM1K Utility model has become invalid (non-payment of fees)

Effective date: 20161001