RU153322U1

RU153322U1 - Устройство для обучения разговорной(устной) речи с визуальной обратной связью

Info

Publication number: RU153322U1
Application number: RU2014139488/12U
Authority: RU
Inventors: Эммануил Григорьевич Кнеллер; Денис Владимирович Караульных
Original assignee: Закрытое акционерное общество "ИстраСофт"
Priority date: 2014-09-30
Filing date: 2014-09-30
Publication date: 2015-07-10

Abstract

1. Устройство для помощи в обучении разговорной (устной) речи с визуальной обратной связью, содержащее блок приема речевого сигнала, аналого-цифровой преобразователь, блок шумоочистки, блок хранения входящего речевого сигнала, преобразователь-нормализатор в частотные зоны, блок управления, блок хранения акустических эталонов языка, блок настроек параметров зон фильтров на выбранный язык, блок анализа траекторий энергии в частотных зонах во времени, блок сравнения траекторий произношения звуков, блок вычисления оценки произношения, блок памяти, обеспечивающий возможности записи и хранения акустических эталонов языка, блок признаков параметров траекторий звуков, блок вывода речевого сигнала, блок вывода визуальных признаков и блок отображения информации, причем блок приема речевого сигнала соединен с аналого-цифровым преобразователем, выход которого подключен к входу блока шумоочистки, выход которого подключен к входу блока хранения входящего речевого сигнала, выход которого подключен к входу преобразователя-нормализатора, вход которого подключен к выходу блока хранения акустических эталонов языка, также вход подключен к выходу блока настроек параметров зон фильтров на выбранный язык, выход преобразователя-нормализатора подключен к блоку управления и блоку анализа траекторий энергии в частотных зонах, выход которого подключен к блоку сравнения траекторий произношения звуков, выход которого подключен к блоку вычисления.2. Устройство по п. 1, характеризующееся тем, что аналого-цифровой преобразователь имеет фиксированную частоту дискредитации.3. Устройство по п. 1, характеризующееся тем, что при пре�

Description

ОБЛАСТЬ ТЕХНИКИ

Устройство предназначено для обучения произношения разговорной речью с визуальной обратной связью и может быть использовано для обучению иностранным языкам, слабослышащих людей говорению, в логопедии, коррекции произношения, автоматической стенографии, обучении диалектам.

УРОВЕНЬ ТЕХНИКИ

Полезная модель относится к устройствам, предназначенным для обучения разговорной речи иностранным языкам, и диалектам родной речи посредством тренировки и развития способности восприятия речи на слух и правильного произношения, в частности для отработки навыка аудирования слабослышащих людей.

Из предшествующего уровня техники, известны различные способы изучения иностранных языков. Широко известны способы обучения с запоминанием иностранных слов по бумажным карточкам, на которых они нанесены с одной стороны, а их перевод - с другой, применяемые в вузах.

Однако эти способы требуют немалых усилий и затрат времени, особенно при усвоении большого количества иностранных слов и выражений. Также известно и широко распространено обучение обычным заучиванием иностранных слов со словаря, учебника и т.п. с самостоятельным их речевым произношением по написанной транскрипции. Здесь возможны ошибки в произношении этих слов обучающимся.

Существуют традиционные методы обучения иностранному языку, которые учат произносить слова, проговаривать фразы. Данные метода также подойдут для обучения, например, слабослышащего человека.

Однако все эти методы практически не направленны на отработку таких важных аспектов речи как умение правильно говорить (артикулировать) и слышать (различать) звуки речи, являющих основой устной речи.

Известны средства обучения иностранным языкам с использованием звукового воспроизведения языковых фрагментов с прослушиванием. Такие средства используются для отработки правильного произношения. Например, известно средство отработки правильного произношения, осуществляющее анализ произносимых фрагментов, разделение речи на фонемы и анализ их частотного спектра (WO 2004049283 (A1), опубликовано 2004.06.10). В изобретении используются так называемые форманты для оценки произношения, которые выводят для сравнения. Следует отметить, что данное техническое средство имеет узкое применение и предназначено для пользователей, владеющих иностранным языком, для дальнейшего совершенствования их знаний и не может быть использовано для развития навыков аудирования, т.е. дословного повторения.

Недостатком данного технического решения является низкая различительная способность, связанная с тем, что форманты не являются теми характеристиками, которые определяют звук - это только один из способов создания в речевом сигнале соответствующих физических характеристик, создающих ощущение звука. Известно, например, что звук А может иметь от одной до трех формант в зависимости от голоса говорящего.

Известно устройство для фонетического анализа и обучения речи (патент на полезную модель RU 90251, G10L 15/00, опубликовано 27.12.2009). Устройство содержит последовательно соединенные микрофон, блок сегментного анализа, спектроанализатор, блок нормализации, блок измерения сходства, блок памяти эталонов, блок оперативной памяти и блок коммутации, последовательно соединенные второй блок принятия решений, второй блок измерения сходства и блок визуализации данных, выход которого является выходом устройства.

Недостатком этого устройства является то, что вычисление сходства произношения с каким-либо эталоном производится на основании анализа всего сигнала. В то же время при обучении произношению, скажем, отдельных слов, интерес представляет, прежде всего, коррекция произношения отдельного звука (например, фонемы или слога) внутри выбранного слова. Однако предложенное устройство не позволяет проводить анализ качества произношения отдельных частей слова, учитывая информацию об интонации, акценте, ритмике, тоне (мелодики речи), громкости, темпе речи и ее отдельных отрезков, особенностей фонации.

СУЩНОСТЬ ПОЛЕЗНОЙ МОДЕЛИ

Данная полезная модель направлена на устранение недостатков, присущих существующим аналогам.

Предполагаемый технический результат, достигаемый заявленной полезной моделью, состоит в повышении эффективности обучения за счет качества определения правильности произношения звуков, звуков в словах и предложениях, интонации, ритмики и акцента, и ввода визуальной обратной связи позволяющей обучаемому не только услышать, но и увидеть на специальных графиках, отличия произносимых звуков, слов, и предложений, а также других характеристик речи таких как ритмика, и акцент от эталонного произношения. Применения аудиовизуального анализа и оригинальной системы распознавания речи, позволяет визуально сравнить правильность произношения характеристик звукового объекта относительно эталона, получить оценку его произнесения, поскольку обучающемуся необходимо знать не только то, что он совершает ошибку, но также конкретный неправильный звук, акцент, интонацию, ритмику, и получить рекомендации как ее исправить.

Указанный технический результат достигается тем, что устройство перевода речевого сигнала в транскрипционное представление, содержит блок приема речевого сигнала, последовательно соединенный с аналого-цифровым преобразователем, блок шумоотчистки, блок хранения входящего речевого сигнала, выход которого соединен с блоком преобразователя-нормализатора в частотные зоны, превышение относительной энергии в которых создает ощущение звука речи, соединенного с блоком анализа траекторий энергии в частотных зонах во времени, выходы которого соединены блоком сравнения траекторий произношения звуков, блок определения символа транскрипции, блок вычисления оценки произношения, блок управления и блок памяти, обеспечивающий возможности записи и хранения акустических эталонов языка, траекторий параметров признаков звуков, вывода речевого сигнала и визуализации параметров признаков.

КРАТКОЕ ОПИСАНИЕ ЧЕРТЕЖЕЙ

Сущность полезной модели поясняется чертежами.

На фиг. 1 - представлена блок-схема предлагаемого устройства;

ПОДРОБНОЕ ОПИСАНИЕ ПОЛЕЗНОЙ МОДЕЛИ

Данная полезная модель в различных своих вариантах осуществления может быть выполнена в виде устройства, реализующего способ.

Устройство работает следующим образом:

Блок приема речевого сигнала (1) (Фиг. 1) принимает речевой сигнал в виде звукового потока данных на вход. В качестве блока приема речевого сигнала может быть использован микрофон, как встроенный, так и внешний.

Далее речевой сигнал преобразовывается в дискретный код (цифровой сигнал) в аналого-цифровом преобразователе (2) с частотой дискретизации не менее 22 кГ (точность сигнала 16 бит). Блок приема речевого сигнала соединяется с аналого-цифровым преобразователем последовательно.

Акустический сигнал подается на блок шумоотчистки (3), в котором происходит предварительная очистка от шумов и нормализация динамического диапазона. Это осуществляется путем дополнительного усиления сигналов малого уровня, чтобы поднять их выше уровня шумов передающего тракта.

Блок хранения входящего речевого сигнала (4) соединен с преобразователем-нормализатором (5) в частотные зоны, создающие ощущение звука речи, который состоит из группы цифровых фильтров с параметрами преобразования, нормализованными с учетом характеристик чувствительности улитки уха по частоте, амплитуде и времени. Блок (5) соединен с Блоком (7), анализа траекторий энергии в частотных зонах во времени, который определяет наличие превышения энергии в частотных зонах. Блок (7) соединен с Блоком (8) сравнения траекторий произношения звуков, определения символов транскрипций формирует последовательности символов, обозначающих группы фонем, который соединен с Блоком (9) вычисления оценки правильности произнесения символов дополнительно соединенным с выходом Блока (10) признаков параметров траекторий звуков. Также Блок (5) соединен с Блоком (12) хранения акустических эталонов языка, Блоком (13) настроек параметров зон фильтров на выбранный язык.

Блок управления (6), выполненный на основе многоканального центрального микропроцессора, организует процесс взаимодействия всех блоков. Блок управления соединен по стандартным мультиплексным каналам информационного обмена с последовательно соединенными друг с другом блоком анализа траекторий энергии (7) в частотных зонах во времени, блоком сравнения траекторий произношения звуков(8), определения символов транскрипций.

Мультиплексный канал связи предназначен для связи с медленно действующими компонентами, которые могут работать одновременно. Мультиплексный канал обеспечивает работу, как в монопольном, так и мультиплексном режиме. В данной полезной модели могут применяться мультиплексные каналы по ГОСТ 26765.52-87 (отечественный аналог интерфейса по международному стандарту MIL STD 1553 В).

Также для связи блока управления (6) с периферийными блоками, могут использоваться каналы с интерфейсами EIA RS-232C (известный также как интерфейс CCITT V. 24), PCI (Peripheral Component Interconnect - Соединение внешних компонентов), PCMCIA (Personal Computer Memory Card International Association - Стандарт международной ассоциации производителей плат памяти для персональных компьютеров), USB (Universal Serial Bus - Универсальная последовательная шина).

Блок памяти (11), соединенный с блоком управления (6), также соединен по каналам интерфейсной связи с блоком признаков параметров траекторий звуков (10). Блок (6) обеспечивает возможность вызова из блока памяти (11) любого признака параметра траектории, определяющей символ звука предустановленного тематического словаря или группы словарей, размеченных по символам групп фонем, и осуществляет отбор слов, соответствующих комбинациям символов групп фонем в текущей последовательности.

Блок памяти (11) через блок управления (6), соединен с устройством (14) вывода визуальных признаков, один выход которого соединен с блоком отображения информации (15), выполненного, например, в виде дисплея, обеспечивающего возможность отображения цифровой, графической и символьной информации.

Блок отображения информации (15) может быть реализован на основе миниатюрных технических решений, широко используемых в мобильных телефонах, плеерах и других портативных устройствах.

Также блок памяти (11) через блок управления (6), соединен с блоком (16) вывода речевого сигнала, который выводит данные на порт A/V для воспроизведения посредством внешнего звукового проигрывателя или устройства, имеющего поддержку воспроизведения звука. Блок (16) вывода речевого сигнала может содержать стандартные разъемы, например, такие как S/PDIF; TOSLINK или RCA-разъем с коаксиальным кабелем.

Claims

1. Устройство для помощи в обучении разговорной (устной) речи с визуальной обратной связью, содержащее блок приема речевого сигнала, аналого-цифровой преобразователь, блок шумоочистки, блок хранения входящего речевого сигнала, преобразователь-нормализатор в частотные зоны, блок управления, блок хранения акустических эталонов языка, блок настроек параметров зон фильтров на выбранный язык, блок анализа траекторий энергии в частотных зонах во времени, блок сравнения траекторий произношения звуков, блок вычисления оценки произношения, блок памяти, обеспечивающий возможности записи и хранения акустических эталонов языка, блок признаков параметров траекторий звуков, блок вывода речевого сигнала, блок вывода визуальных признаков и блок отображения информации, причем блок приема речевого сигнала соединен с аналого-цифровым преобразователем, выход которого подключен к входу блока шумоочистки, выход которого подключен к входу блока хранения входящего речевого сигнала, выход которого подключен к входу преобразователя-нормализатора, вход которого подключен к выходу блока хранения акустических эталонов языка, также вход подключен к выходу блока настроек параметров зон фильтров на выбранный язык, выход преобразователя-нормализатора подключен к блоку управления и блоку анализа траекторий энергии в частотных зонах, выход которого подключен к блоку сравнения траекторий произношения звуков, выход которого подключен к блоку вычисления.

2. Устройство по п. 1, характеризующееся тем, что аналого-цифровой преобразователь имеет фиксированную частоту дискредитации.

3. Устройство по п. 1, характеризующееся тем, что при преобразовании речевого сигнала в частотные зоны, формируют последовательности символов транскрипции звука, слова, предложения и производят визуализацию параметров звуков и оценку их правильности произношения относительно акустических эталонов.

4. Устройство по п. 1, характеризующееся тем, что блок отображения информации отображает акустические параметры звука в виде 2D- и 3D-графических представлений, позволяющие сравнить правильность произношения характеристик звукового объекта относительно акустического эталона.

5. Устройство по п. 1, характеризующееся тем, что блок сравнения траекторий произношения звуков в частотных зонах анализирует данные частотные зоны и выделяет группы звуков по похожим траекториям энергий.