RU153322U1 - Устройство для обучения разговорной(устной) речи с визуальной обратной связью - Google Patents
Устройство для обучения разговорной(устной) речи с визуальной обратной связью Download PDFInfo
- Publication number
- RU153322U1 RU153322U1 RU2014139488/12U RU2014139488U RU153322U1 RU 153322 U1 RU153322 U1 RU 153322U1 RU 2014139488/12 U RU2014139488/12 U RU 2014139488/12U RU 2014139488 U RU2014139488 U RU 2014139488U RU 153322 U1 RU153322 U1 RU 153322U1
- Authority
- RU
- Russia
- Prior art keywords
- unit
- block
- output
- pronunciation
- speech signal
- Prior art date
Links
Images
Landscapes
- Electrically Operated Instructional Devices (AREA)
Abstract
1. Устройство для помощи в обучении разговорной (устной) речи с визуальной обратной связью, содержащее блок приема речевого сигнала, аналого-цифровой преобразователь, блок шумоочистки, блок хранения входящего речевого сигнала, преобразователь-нормализатор в частотные зоны, блок управления, блок хранения акустических эталонов языка, блок настроек параметров зон фильтров на выбранный язык, блок анализа траекторий энергии в частотных зонах во времени, блок сравнения траекторий произношения звуков, блок вычисления оценки произношения, блок памяти, обеспечивающий возможности записи и хранения акустических эталонов языка, блок признаков параметров траекторий звуков, блок вывода речевого сигнала, блок вывода визуальных признаков и блок отображения информации, причем блок приема речевого сигнала соединен с аналого-цифровым преобразователем, выход которого подключен к входу блока шумоочистки, выход которого подключен к входу блока хранения входящего речевого сигнала, выход которого подключен к входу преобразователя-нормализатора, вход которого подключен к выходу блока хранения акустических эталонов языка, также вход подключен к выходу блока настроек параметров зон фильтров на выбранный язык, выход преобразователя-нормализатора подключен к блоку управления и блоку анализа траекторий энергии в частотных зонах, выход которого подключен к блоку сравнения траекторий произношения звуков, выход которого подключен к блоку вычисления.2. Устройство по п. 1, характеризующееся тем, что аналого-цифровой преобразователь имеет фиксированную частоту дискредитации.3. Устройство по п. 1, характеризующееся тем, что при пре�
Description
ОБЛАСТЬ ТЕХНИКИ
Устройство предназначено для обучения произношения разговорной речью с визуальной обратной связью и может быть использовано для обучению иностранным языкам, слабослышащих людей говорению, в логопедии, коррекции произношения, автоматической стенографии, обучении диалектам.
УРОВЕНЬ ТЕХНИКИ
Полезная модель относится к устройствам, предназначенным для обучения разговорной речи иностранным языкам, и диалектам родной речи посредством тренировки и развития способности восприятия речи на слух и правильного произношения, в частности для отработки навыка аудирования слабослышащих людей.
Из предшествующего уровня техники, известны различные способы изучения иностранных языков. Широко известны способы обучения с запоминанием иностранных слов по бумажным карточкам, на которых они нанесены с одной стороны, а их перевод - с другой, применяемые в вузах.
Однако эти способы требуют немалых усилий и затрат времени, особенно при усвоении большого количества иностранных слов и выражений. Также известно и широко распространено обучение обычным заучиванием иностранных слов со словаря, учебника и т.п. с самостоятельным их речевым произношением по написанной транскрипции. Здесь возможны ошибки в произношении этих слов обучающимся.
Существуют традиционные методы обучения иностранному языку, которые учат произносить слова, проговаривать фразы. Данные метода также подойдут для обучения, например, слабослышащего человека.
Однако все эти методы практически не направленны на отработку таких важных аспектов речи как умение правильно говорить (артикулировать) и слышать (различать) звуки речи, являющих основой устной речи.
Известны средства обучения иностранным языкам с использованием звукового воспроизведения языковых фрагментов с прослушиванием. Такие средства используются для отработки правильного произношения. Например, известно средство отработки правильного произношения, осуществляющее анализ произносимых фрагментов, разделение речи на фонемы и анализ их частотного спектра (WO 2004049283 (A1), опубликовано 2004.06.10). В изобретении используются так называемые форманты для оценки произношения, которые выводят для сравнения. Следует отметить, что данное техническое средство имеет узкое применение и предназначено для пользователей, владеющих иностранным языком, для дальнейшего совершенствования их знаний и не может быть использовано для развития навыков аудирования, т.е. дословного повторения.
Недостатком данного технического решения является низкая различительная способность, связанная с тем, что форманты не являются теми характеристиками, которые определяют звук - это только один из способов создания в речевом сигнале соответствующих физических характеристик, создающих ощущение звука. Известно, например, что звук А может иметь от одной до трех формант в зависимости от голоса говорящего.
Известно устройство для фонетического анализа и обучения речи (патент на полезную модель RU 90251, G10L 15/00, опубликовано 27.12.2009). Устройство содержит последовательно соединенные микрофон, блок сегментного анализа, спектроанализатор, блок нормализации, блок измерения сходства, блок памяти эталонов, блок оперативной памяти и блок коммутации, последовательно соединенные второй блок принятия решений, второй блок измерения сходства и блок визуализации данных, выход которого является выходом устройства.
Недостатком этого устройства является то, что вычисление сходства произношения с каким-либо эталоном производится на основании анализа всего сигнала. В то же время при обучении произношению, скажем, отдельных слов, интерес представляет, прежде всего, коррекция произношения отдельного звука (например, фонемы или слога) внутри выбранного слова. Однако предложенное устройство не позволяет проводить анализ качества произношения отдельных частей слова, учитывая информацию об интонации, акценте, ритмике, тоне (мелодики речи), громкости, темпе речи и ее отдельных отрезков, особенностей фонации.
СУЩНОСТЬ ПОЛЕЗНОЙ МОДЕЛИ
Данная полезная модель направлена на устранение недостатков, присущих существующим аналогам.
Предполагаемый технический результат, достигаемый заявленной полезной моделью, состоит в повышении эффективности обучения за счет качества определения правильности произношения звуков, звуков в словах и предложениях, интонации, ритмики и акцента, и ввода визуальной обратной связи позволяющей обучаемому не только услышать, но и увидеть на специальных графиках, отличия произносимых звуков, слов, и предложений, а также других характеристик речи таких как ритмика, и акцент от эталонного произношения. Применения аудиовизуального анализа и оригинальной системы распознавания речи, позволяет визуально сравнить правильность произношения характеристик звукового объекта относительно эталона, получить оценку его произнесения, поскольку обучающемуся необходимо знать не только то, что он совершает ошибку, но также конкретный неправильный звук, акцент, интонацию, ритмику, и получить рекомендации как ее исправить.
Указанный технический результат достигается тем, что устройство перевода речевого сигнала в транскрипционное представление, содержит блок приема речевого сигнала, последовательно соединенный с аналого-цифровым преобразователем, блок шумоотчистки, блок хранения входящего речевого сигнала, выход которого соединен с блоком преобразователя-нормализатора в частотные зоны, превышение относительной энергии в которых создает ощущение звука речи, соединенного с блоком анализа траекторий энергии в частотных зонах во времени, выходы которого соединены блоком сравнения траекторий произношения звуков, блок определения символа транскрипции, блок вычисления оценки произношения, блок управления и блок памяти, обеспечивающий возможности записи и хранения акустических эталонов языка, траекторий параметров признаков звуков, вывода речевого сигнала и визуализации параметров признаков.
КРАТКОЕ ОПИСАНИЕ ЧЕРТЕЖЕЙ
Сущность полезной модели поясняется чертежами.
На фиг. 1 - представлена блок-схема предлагаемого устройства;
ПОДРОБНОЕ ОПИСАНИЕ ПОЛЕЗНОЙ МОДЕЛИ
Данная полезная модель в различных своих вариантах осуществления может быть выполнена в виде устройства, реализующего способ.
Устройство работает следующим образом:
Блок приема речевого сигнала (1) (Фиг. 1) принимает речевой сигнал в виде звукового потока данных на вход. В качестве блока приема речевого сигнала может быть использован микрофон, как встроенный, так и внешний.
Далее речевой сигнал преобразовывается в дискретный код (цифровой сигнал) в аналого-цифровом преобразователе (2) с частотой дискретизации не менее 22 кГ (точность сигнала 16 бит). Блок приема речевого сигнала соединяется с аналого-цифровым преобразователем последовательно.
Акустический сигнал подается на блок шумоотчистки (3), в котором происходит предварительная очистка от шумов и нормализация динамического диапазона. Это осуществляется путем дополнительного усиления сигналов малого уровня, чтобы поднять их выше уровня шумов передающего тракта.
Блок хранения входящего речевого сигнала (4) соединен с преобразователем-нормализатором (5) в частотные зоны, создающие ощущение звука речи, который состоит из группы цифровых фильтров с параметрами преобразования, нормализованными с учетом характеристик чувствительности улитки уха по частоте, амплитуде и времени. Блок (5) соединен с Блоком (7), анализа траекторий энергии в частотных зонах во времени, который определяет наличие превышения энергии в частотных зонах. Блок (7) соединен с Блоком (8) сравнения траекторий произношения звуков, определения символов транскрипций формирует последовательности символов, обозначающих группы фонем, который соединен с Блоком (9) вычисления оценки правильности произнесения символов дополнительно соединенным с выходом Блока (10) признаков параметров траекторий звуков. Также Блок (5) соединен с Блоком (12) хранения акустических эталонов языка, Блоком (13) настроек параметров зон фильтров на выбранный язык.
Блок управления (6), выполненный на основе многоканального центрального микропроцессора, организует процесс взаимодействия всех блоков. Блок управления соединен по стандартным мультиплексным каналам информационного обмена с последовательно соединенными друг с другом блоком анализа траекторий энергии (7) в частотных зонах во времени, блоком сравнения траекторий произношения звуков(8), определения символов транскрипций.
Мультиплексный канал связи предназначен для связи с медленно действующими компонентами, которые могут работать одновременно. Мультиплексный канал обеспечивает работу, как в монопольном, так и мультиплексном режиме. В данной полезной модели могут применяться мультиплексные каналы по ГОСТ 26765.52-87 (отечественный аналог интерфейса по международному стандарту MIL STD 1553 В).
Также для связи блока управления (6) с периферийными блоками, могут использоваться каналы с интерфейсами EIA RS-232C (известный также как интерфейс CCITT V. 24), PCI (Peripheral Component Interconnect - Соединение внешних компонентов), PCMCIA (Personal Computer Memory Card International Association - Стандарт международной ассоциации производителей плат памяти для персональных компьютеров), USB (Universal Serial Bus - Универсальная последовательная шина).
Блок памяти (11), соединенный с блоком управления (6), также соединен по каналам интерфейсной связи с блоком признаков параметров траекторий звуков (10). Блок (6) обеспечивает возможность вызова из блока памяти (11) любого признака параметра траектории, определяющей символ звука предустановленного тематического словаря или группы словарей, размеченных по символам групп фонем, и осуществляет отбор слов, соответствующих комбинациям символов групп фонем в текущей последовательности.
Блок памяти (11) через блок управления (6), соединен с устройством (14) вывода визуальных признаков, один выход которого соединен с блоком отображения информации (15), выполненного, например, в виде дисплея, обеспечивающего возможность отображения цифровой, графической и символьной информации.
Блок отображения информации (15) может быть реализован на основе миниатюрных технических решений, широко используемых в мобильных телефонах, плеерах и других портативных устройствах.
Также блок памяти (11) через блок управления (6), соединен с блоком (16) вывода речевого сигнала, который выводит данные на порт A/V для воспроизведения посредством внешнего звукового проигрывателя или устройства, имеющего поддержку воспроизведения звука. Блок (16) вывода речевого сигнала может содержать стандартные разъемы, например, такие как S/PDIF; TOSLINK или RCA-разъем с коаксиальным кабелем.
Claims (5)
1. Устройство для помощи в обучении разговорной (устной) речи с визуальной обратной связью, содержащее блок приема речевого сигнала, аналого-цифровой преобразователь, блок шумоочистки, блок хранения входящего речевого сигнала, преобразователь-нормализатор в частотные зоны, блок управления, блок хранения акустических эталонов языка, блок настроек параметров зон фильтров на выбранный язык, блок анализа траекторий энергии в частотных зонах во времени, блок сравнения траекторий произношения звуков, блок вычисления оценки произношения, блок памяти, обеспечивающий возможности записи и хранения акустических эталонов языка, блок признаков параметров траекторий звуков, блок вывода речевого сигнала, блок вывода визуальных признаков и блок отображения информации, причем блок приема речевого сигнала соединен с аналого-цифровым преобразователем, выход которого подключен к входу блока шумоочистки, выход которого подключен к входу блока хранения входящего речевого сигнала, выход которого подключен к входу преобразователя-нормализатора, вход которого подключен к выходу блока хранения акустических эталонов языка, также вход подключен к выходу блока настроек параметров зон фильтров на выбранный язык, выход преобразователя-нормализатора подключен к блоку управления и блоку анализа траекторий энергии в частотных зонах, выход которого подключен к блоку сравнения траекторий произношения звуков, выход которого подключен к блоку вычисления.
2. Устройство по п. 1, характеризующееся тем, что аналого-цифровой преобразователь имеет фиксированную частоту дискредитации.
3. Устройство по п. 1, характеризующееся тем, что при преобразовании речевого сигнала в частотные зоны, формируют последовательности символов транскрипции звука, слова, предложения и производят визуализацию параметров звуков и оценку их правильности произношения относительно акустических эталонов.
4. Устройство по п. 1, характеризующееся тем, что блок отображения информации отображает акустические параметры звука в виде 2D- и 3D-графических представлений, позволяющие сравнить правильность произношения характеристик звукового объекта относительно акустического эталона.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
RU2014139488/12U RU153322U1 (ru) | 2014-09-30 | 2014-09-30 | Устройство для обучения разговорной(устной) речи с визуальной обратной связью |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
RU2014139488/12U RU153322U1 (ru) | 2014-09-30 | 2014-09-30 | Устройство для обучения разговорной(устной) речи с визуальной обратной связью |
Publications (1)
Publication Number | Publication Date |
---|---|
RU153322U1 true RU153322U1 (ru) | 2015-07-10 |
Family
ID=53539164
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
RU2014139488/12U RU153322U1 (ru) | 2014-09-30 | 2014-09-30 | Устройство для обучения разговорной(устной) речи с визуальной обратной связью |
Country Status (1)
Country | Link |
---|---|
RU (1) | RU153322U1 (ru) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
RU2641222C2 (ru) * | 2016-09-26 | 2018-01-16 | Владимир Анатольевич Ефремов | Способ автоматического перевода устной речи с одного языка на другой и устройство для его реализации |
RU2688277C1 (ru) * | 2016-02-05 | 2019-05-21 | ГУГЛ ЭлЭлСи | Повторное распознавание речи с внешними источниками данных |
-
2014
- 2014-09-30 RU RU2014139488/12U patent/RU153322U1/ru not_active IP Right Cessation
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
RU2688277C1 (ru) * | 2016-02-05 | 2019-05-21 | ГУГЛ ЭлЭлСи | Повторное распознавание речи с внешними источниками данных |
RU2641222C2 (ru) * | 2016-09-26 | 2018-01-16 | Владимир Анатольевич Ефремов | Способ автоматического перевода устной речи с одного языка на другой и устройство для его реализации |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8972259B2 (en) | System and method for teaching non-lexical speech effects | |
Daniels et al. | The suitability of cloud-based speech recognition engines for language learning. | |
KR20140071070A (ko) | 음소기호를 이용한 외국어 발음 학습방법 및 학습장치 | |
Stemberger et al. | Phonetic transcription for speech-language pathology in the 21st century | |
RU153322U1 (ru) | Устройство для обучения разговорной(устной) речи с визуальной обратной связью | |
Kabashima et al. | Dnn-based scoring of language learners’ proficiency using learners’ shadowings and native listeners’ responsive shadowings | |
CN205354415U (zh) | 一种英语发音训练器 | |
Simmons et al. | Cross-modal transfer of talker-identity learning | |
JP2844817B2 (ja) | 発声練習用音声合成方式 | |
Koffi | A tutorial on acoustic phonetic feature extraction for automatic speech recognition (ASR) and text-to-speech (TTS) applications in African languages | |
Derrick et al. | Aero-tactile integration in fricatives: Converting audio to air flow information for speech perception enhancement | |
Martens et al. | Applying adaptive recognition of the learner’s vowel space to English pronunciation training of native speakers of Japanese | |
US8768697B2 (en) | Method for measuring speech characteristics | |
Malatji et al. | Creating accented text-to-speech English voices to facilitate second language learning | |
WO2016053141A1 (ru) | Устройство для обучения разговорной (устной) речи с визуальной обратной связью | |
Kasrani et al. | A Mobile Cloud Computing Based Independent Language Learning System with Automatic Intelligibility Assessment and Instant Feedback. | |
CN111508523A (zh) | 一种语音训练提示方法及系统 | |
KR100780531B1 (ko) | 구화 교육용 게임 시스템 | |
JP7039637B2 (ja) | 情報処理装置、情報処理方法、情報処理システム、情報処理プログラム | |
Choe | The effect of pronunciation teaching on the realization of English rhythm by Korean learners of English | |
KR102610871B1 (ko) | 청각장애인 음성언어훈련 시스템 | |
Fuchs | The phonology of English | |
Sarvinoz | MISPRONUNCIATION DETECTION IN NONNATIVE ENGLISH | |
Takahashi et al. | Perception of American and Australian English “can” and “can’t” by Japanese Listeners: How to Teach “can” and “can’t” | |
Antonova | The use of software tools Praat and Audacity in teaching Chinese L2 pronunciation |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
MM1K | Utility model has become invalid (non-payment of fees) |
Effective date: 20161001 |