SU1453442A1

SU1453442A1 - Способ идентификации говор щего

Info

Publication number: SU1453442A1
Application number: SU864082720A
Authority: SU
Inventors: Гурам Соломонович Рамишвили; Роман Рачикович Саакян; Михаил Акакиевич Тушишвили
Original assignee: Институт Систем Управления Ан Гсср
Priority date: 1986-05-05
Filing date: 1986-05-05
Publication date: 1989-01-23

Abstract

Изобретение касаетс анализа речевых сигналов и автоматического распознавани образов и может быть использовано дл автоматизации контрольно-пропускных пунктов и разработки голосовых клкмей ; Применение способа повышает надежность идентификации личности и обеспечение устойчивости система к попыткам имитации голоса. Способ заключаетс в сравнении временной последовательности комплекса параметров речевого сигнала с индивидуальными дл диктора эталонами.

Description

Изобретение относитс к анализу речевых сигналов и автоматическом распознаванию образов и может быть использовано дл автоматизации контрольно-пропускных пунктов (КПП) уч- реждений и разработки голосовых ключей, обеспечивающих санкциониро- ванньй доступ определенных лиц к банкам или механизмам специального назначени на основе предъ влени этими лицами в качестве свидетельства о личности своей речи.

Целью изобретени вл етс повышение надежности идентификации гово- р щего путем анализа наиболее информативных с точки зрени различени голосов гласных фонем, выдел емых лишь по признаку наибольшей интенсив ности и звонкости звука.

Способ свободен от необходимости осуществлени сложных процедур нелинейной нормализации продолжительности звучани фразы. Действительно, проста по своей природе операци не вносит больших интраиндивидуаль- ных вариаций при различных произнесени х одного и того же диктора, ив то же врем может обеспечить существенный вклад при отстранении чужих :ГОЛОСОВ за счет возможной неидентичной зкстракции опорных гласных дл разных дикторов даже в случае, если мистификатору известна парольна фраза.

На фиг. 1 показан пример устройства, реализующего способ; на фиг. 2 - вреЧ менные диaгpa Iмы, иллюстрирующие спо- 1соб идантификации.

, Устройство содержит кнопку 1 запус- 1ка, усилитель 2, выделитель 3 звонких участков сигнала, механический фикса- ;тор 4 кода дл установки числа вьще- п емых опорных сегментов, экстрактор 5 интенсивных фонем, а также начального и конечного сегментов сигнала, измеритель 6 длительности между опорными сегментами, счетчик-определитель 7 числа экстремальных точек, детектор 8 первой гармоники сигнала, счетчик 9 числа нулевых точек, формирова- тель 10 матрицы признаков, переключатель 11 режимов обучени и верификации , блок 12 обучени , блок 13 сра- )внени и блок 14 прин ти решени .

Пусть в качестве парольной фразы идентифицируемым лицом выбрана фра- Sa: Мой голос-мой код (фиг. 2). Характер огибающего речевого сигна

.Q

с

5

0

5

ла, соответствующего этой парольной , фразе, приводитс на фиг. 2а. Дл удобства под иллюстрацией даетс буквенна (а не фонематическа ) запись парольной фразы.

С произнесением фразы сигнал через усилитель 2 поступает на вьщелитель звонких участков сигнала 3. Этот блок состоит из набора узкополосных фильтров с частотным диапазоном 100- 500 Гц. Ширина полосы пропускани каждого фильтра не больше возможного периода основного тона голоса и составл ет примерно 70-80 Гц. Во врем произнесени звонких звуков это позвол ет определить линейчатость структуры сигнала, так как гармоники сигнала не смогут одновременно попасть во все фильтры. Обратна картина имеет место при произнесении глухих звуков.

Разделение сигнала на звонкие и не звонкие участки сигнала показано на фиг. 26. Заштрихованна часть диаграммы указывает на звонкий характер сигнала.

Далее с помощью экстрактора 5 из сигнала выдел ютс интенсивные участки на местах ударных гласных звуков, а также в начале и в конце произнесени . Этот блок представл ет собой микропроцессор, включающий в себ запоминающее устройство и вычислитель числа (задаваемого заранее с помощью фиксатора 4) энергетически мощных участков сигнала, а также стандартных по длительности участков в начальной и конечной части сигнала, Дл случа п 5 эта операци показана на фиг. 2в.

Далее с помощью блока 6 определ ютс длительности Т,- Т между началами вьйранных мощных учатсков (опорных сегментов) сигнала, а также длительность времени Т от запуска (кнопкой 1) устройства до начала произнесени . Эти параметры показаны на фиг.2г.

Счетчик 7 определ ет число экст- ремумой речевого сигнала за стандартный период выбранньк опорных сегментов (фиг. 2д), счетчик 9 - число нулевых точек после детектировани блоком 7 (этот блок представл ет собой низкочастотный фильтр с крутизной спада 18 дБ/окт., начина с 200 Гц) первой гармоники сигнала (фиг. 2е). Эти последние параметры испол1 эуют в дальнейшем дл вычислени значени

Ыц/Ыц, где N° - число нулевых точек первой гармоники сигнала в начальном, опорном сегменте; N - в конечном опорном cerMisHTe.

Формирователь 10 признаков (матрицы ) представл ет собой буферное запоминающее устройство, куда поступают перечисленные данные из блока 6 и счетчиков 7 и 9: Тр-Тд, N,- Nj и NS/N°.

Необходимо отметить,.что.число столбцов матрицы дл разных случаев задани будет разным и, таким образом , оно также, как и другие признаки индивидуальности голоса, участвует в правильной верификации диктора,

В режиме обучени , т.е. в режиме запоминани голосовых и произносительных характеристик идентифицируемого лица, переключатель 11 находитс в правом положении. В этом случае все данные из формировател 10 матрицы передаютс в блок 12, который представл ет собой долговременное запоминающее устройство (ДЗУ).

В режиме идентификации (переключатель 11 находитс в левом положении) данные анализа контрольной фразы из блока 10 формировани признаков подаютс уже на блок 13, которьй производит сопоставление и сравнение этих данных с данными обучени из блока 12, В результате формируетс разностный

ные интервалы между сегментами, определ ют выдержку времени до начала произнесени парольной фразы, подсчитывают число экстремальных точек в каждом из вьщеленных сегментов ,определ ют отношение числа нулей, подсчитанных на первой гармонике сигнала в начальном и конечном сегмен 0 тах,и сравнивают полученный комплекс параметров с индивидуальными дл диктора эталонами. При этом из звонких участков на местах интенсивных гласных звуков, и в начале и в конце

15 парольной фразы вьщел ют заранее выбранное число сегментов одинаковой

, длительности; определ ют временные интервалы между этими сегментами; определ ют выдержку времени до нача20 ла произнесени парольной фразы; подсчитывают число экстремальных точек в каждом из выделенн(х сегментов; определ ют отнощение числа нулей, подсчитанных по первой гармонике сиг25 нала в начальном и конечном сегментах,

Claims

Формула изобретени

Способ идентификации говор щего путем произнесени им парольной фра30 зы, вьщелени временных параметров этой фразы и порогового сравнени с ; эталонными параметрами, о т л и ч а ю щ и и с тем, что, с целью повышени надежности идентификации.

сигнал и между сравниваемыми матрица- параметры произнесени контрольной ми, который подаетс на блок 14 при-фразы устанавливают индивидуально

н ти решени . В этом блоке, также представл ющем сравнивающее устройпо трудно имитируемьм неконтролируе- мым на слух особенност м речевого поведени говор щего, при этом пара- некоторым заранее установленным поре- Q метры дл идентификации выбирают из совокупности временных интервалов

между заранее выбранными наиболее ин- тенсивными сегментами одинаковой длительности на звонких участках и в 45 начале и конце парольной фразы, опрество , происходит сопоставление Л с

гом 0 . При происходит отстранение лица,произнос щего испытательную фразу, при й.в диктор квалифицируетс как личность, на которую настроен верификатор.

--jT- ----- .-.

Таким образом, сущность способа сое- дел ют вьщержк.у времени до начала

состоит в том, что преобразовангалй из парольной фразы речевой сигнал усиливают, выдел ют из него звонкие участки, из которых выдел ют заранее выбранное число сегментов одинаковой длительности на местах интенсивных гласных звуков и в начале и в конце парольной фразы, определ ют времен50

произнесени парольной фразы,, опре- дел ют интервалы между переходами через нуль речевых колебаний, соот- ветствун цих этим сегментам, и определ ют соотношение фильтрованных в частотной области первой гармоники сигнала числа нулей в начальной и конечном сегментах.

ные интервалы между сегментами, определ ют выдержку времени до начала произнесени парольной фразы, подсчитывают число экстремальных точек в каждом из вьщеленных сегментов ,определ ют отношение числа нулей, подсчитанных на первой гармонике сигнала в начальном и конечном сегмен0 тах,и сравнивают полученный комплекс параметров с индивидуальными дл диктора эталонами. При этом из звонких участков на местах интенсивных гласных звуков, и в начале и в конце

5 парольной фразы вьщел ют заранее выбранное число сегментов одинаковой

длительности; определ ют временные интервалы между этими сегментами; определ ют выдержку времени до нача0 ла произнесени парольной фразы; подсчитывают число экстремальных точек в каждом из выделенн(х сегментов; определ ют отнощение числа нулей, подсчитанных по первой гармонике сиг5 нала в начальном и конечном сегментах,

Формула изобретени

Способ идентификации говор щего путем произнесени им парольной фра0 зы, вьщелени временных параметров этой фразы и порогового сравнени с ; эталонными параметрами, о т л и ч аю щ и и с тем, что, с целью повышени надежности идентификации.

дел ют вьщержк.у времени до начала

произнесени парольной фразы,, опре- дел ют интервалы между переходами через нуль речевых колебаний, соот- ветствун цих этим сегментам, и определ ют соотношение фильтрованных в частотной области первой гармоники сигнала числа нулей в начальной и конечном сегментах.

Редактор С, Патрушева

Составитель В. Махонин Техред М.Дидык

Заказ 7289/48

Тираж 343

ВНИИПИ Государственного комитета по изобретени м и открыти м при ГКНТ СГСр 113035, Москва, Ж-35, Раушска наб., д. 4/5

Корректор А. Ворович

Подписное