SU1453442A1 - Способ идентификации говор щего - Google Patents

Способ идентификации говор щего Download PDF

Info

Publication number
SU1453442A1
SU1453442A1 SU864082720A SU4082720A SU1453442A1 SU 1453442 A1 SU1453442 A1 SU 1453442A1 SU 864082720 A SU864082720 A SU 864082720A SU 4082720 A SU4082720 A SU 4082720A SU 1453442 A1 SU1453442 A1 SU 1453442A1
Authority
SU
USSR - Soviet Union
Prior art keywords
segments
passphrase
speaker
phrase
time
Prior art date
Application number
SU864082720A
Other languages
English (en)
Inventor
Гурам Соломонович Рамишвили
Роман Рачикович Саакян
Михаил Акакиевич Тушишвили
Original Assignee
Институт Систем Управления Ан Гсср
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Институт Систем Управления Ан Гсср filed Critical Институт Систем Управления Ан Гсср
Priority to SU864082720A priority Critical patent/SU1453442A1/ru
Application granted granted Critical
Publication of SU1453442A1 publication Critical patent/SU1453442A1/ru

Links

Landscapes

  • Electrically Operated Instructional Devices (AREA)

Abstract

Изобретение касаетс  анализа речевых сигналов и автоматического распознавани  образов и может быть использовано дл  автоматизации контрольно-пропускных пунктов и разработки голосовых клкмей ; Применение способа повышает надежность идентификации личности и обеспечение устойчивости система к попыткам имитации голоса. Способ заключаетс  в сравнении временной последовательности комплекса параметров речевого сигнала с индивидуальными дл  диктора эталонами.

Description

Изобретение относитс  к анализу речевых сигналов и автоматическом распознаванию образов и может быть использовано дл  автоматизации контрольно-пропускных пунктов (КПП) уч- реждений и разработки голосовых ключей, обеспечивающих санкциониро- ванньй доступ определенных лиц к банкам или механизмам специального назначени  на основе предъ влени  этими лицами в качестве свидетельства о личности своей речи.
Целью изобретени   вл етс  повышение надежности идентификации гово- р щего путем анализа наиболее информативных с точки зрени  различени  голосов гласных фонем, выдел емых лишь по признаку наибольшей интенсив ности и звонкости звука.
Способ свободен от необходимости осуществлени  сложных процедур нелинейной нормализации продолжительности звучани  фразы. Действительно, проста  по своей природе операци  не вносит больших интраиндивидуаль- ных вариаций при различных произнесени х одного и того же диктора, ив то же врем  может обеспечить существенный вклад при отстранении чужих :ГОЛОСОВ за счет возможной неидентичной зкстракции опорных гласных дл  разных дикторов даже в случае, если мистификатору известна парольна  фраза.
На фиг. 1 показан пример устройства, реализующего способ; на фиг. 2 - вреЧ менные диaгpa Iмы, иллюстрирующие спо- 1соб идантификации.
, Устройство содержит кнопку 1 запус- 1ка, усилитель 2, выделитель 3 звонких участков сигнала, механический фикса- ;тор 4 кода дл  установки числа вьще- п емых опорных сегментов, экстрактор 5 интенсивных фонем, а также начального и конечного сегментов сигнала, измеритель 6 длительности между опорными сегментами, счетчик-определитель 7 числа экстремальных точек, детектор 8 первой гармоники сигнала, счетчик 9 числа нулевых точек, формирова- тель 10 матрицы признаков, переключатель 11 режимов обучени  и верификации , блок 12 обучени , блок 13 сра- )внени  и блок 14 прин ти  решени .
Пусть в качестве парольной фразы идентифицируемым лицом выбрана фра- Sa: Мой голос-мой код (фиг. 2). Характер огибающего речевого сигна
.Q
с
5
5
0
5
ла, соответствующего этой парольной , фразе, приводитс  на фиг. 2а. Дл  удобства под иллюстрацией даетс  буквенна  (а не фонематическа ) запись парольной фразы.
С произнесением фразы сигнал через усилитель 2 поступает на вьщелитель звонких участков сигнала 3. Этот блок состоит из набора узкополосных фильтров с частотным диапазоном 100- 500 Гц. Ширина полосы пропускани  каждого фильтра не больше возможного периода основного тона голоса и составл ет примерно 70-80 Гц. Во врем  произнесени  звонких звуков это позвол ет определить линейчатость структуры сигнала, так как гармоники сигнала не смогут одновременно попасть во все фильтры. Обратна  картина имеет место при произнесении глухих звуков.
Разделение сигнала на звонкие и не звонкие участки сигнала показано на фиг. 26. Заштрихованна  часть диаграммы указывает на звонкий характер сигнала.
Далее с помощью экстрактора 5 из сигнала выдел ютс  интенсивные участки на местах ударных гласных звуков, а также в начале и в конце произнесени . Этот блок представл ет собой микропроцессор, включающий в себ  запоминающее устройство и вычислитель числа (задаваемого заранее с помощью фиксатора 4) энергетически мощных участков сигнала, а также стандартных по длительности участков в начальной и конечной части сигнала, Дл  случа  п 5 эта операци  показана на фиг. 2в.
Далее с помощью блока 6 определ ютс  длительности Т,- Т между началами вьйранных мощных учатсков (опорных сегментов) сигнала, а также длительность времени Т от запуска (кнопкой 1) устройства до начала произнесени . Эти параметры показаны на фиг.2г.
Счетчик 7 определ ет число экст- ремумой речевого сигнала за стандартный период выбранньк опорных сегментов (фиг. 2д), счетчик 9 - число нулевых точек после детектировани  блоком 7 (этот блок представл ет собой низкочастотный фильтр с крутизной спада 18 дБ/окт., начина  с 200 Гц) первой гармоники сигнала (фиг. 2е). Эти последние параметры испол1 эуют в дальнейшем дл  вычислени  значени 
Ыц/Ыц, где N° - число нулевых точек первой гармоники сигнала в начальном, опорном сегменте; N - в конечном опорном cerMisHTe.
Формирователь 10 признаков (матрицы ) представл ет собой буферное запоминающее устройство, куда поступают перечисленные данные из блока 6 и счетчиков 7 и 9: Тр-Тд, N,- Nj и NS/N°.
Необходимо отметить,.что.число столбцов матрицы дл  разных случаев задани  будет разным и, таким образом , оно также, как и другие признаки индивидуальности голоса, участвует в правильной верификации диктора,
В режиме обучени , т.е. в режиме запоминани  голосовых и произносительных характеристик идентифицируемого лица, переключатель 11 находитс  в правом положении. В этом случае все данные из формировател  10 матрицы передаютс  в блок 12, который представл ет собой долговременное запоминающее устройство (ДЗУ).
В режиме идентификации (переключатель 11 находитс  в левом положении) данные анализа контрольной фразы из блока 10 формировани  признаков подаютс  уже на блок 13, которьй производит сопоставление и сравнение этих данных с данными обучени  из блока 12, В результате формируетс  разностный
ные интервалы между сегментами, определ ют выдержку времени до начала произнесени  парольной фразы, подсчитывают число экстремальных точек в каждом из вьщеленных сегментов ,определ ют отношение числа нулей, подсчитанных на первой гармонике сигнала в начальном и конечном сегмен 0 тах,и сравнивают полученный комплекс параметров с индивидуальными дл  диктора эталонами. При этом из звонких участков на местах интенсивных гласных звуков, и в начале и в конце
15 парольной фразы вьщел ют заранее выбранное число сегментов одинаковой
, длительности; определ ют временные интервалы между этими сегментами; определ ют выдержку времени до нача20 ла произнесени  парольной фразы; подсчитывают число экстремальных точек в каждом из выделенн(х сегментов; определ ют отнощение числа нулей, подсчитанных по первой гармонике сиг25 нала в начальном и конечном сегментах,

Claims (1)

  1. Формула изобретени 
    Способ идентификации говор щего путем произнесени  им парольной фра30 зы, вьщелени  временных параметров этой фразы и порогового сравнени  с ; эталонными параметрами, о т л и ч а ю щ и и с   тем, что, с целью повышени  надежности идентификации.
    сигнал и между сравниваемыми матрица- параметры произнесени  контрольной ми, который подаетс  на блок 14 при-фразы устанавливают индивидуально
    н ти  решени . В этом блоке, также представл ющем сравнивающее устройпо трудно имитируемьм неконтролируе- мым на слух особенност м речевого поведени  говор щего, при этом пара- некоторым заранее установленным поре- Q метры дл  идентификации выбирают из совокупности временных интервалов
    между заранее выбранными наиболее ин- тенсивными сегментами одинаковой длительности на звонких участках и в 45 начале и конце парольной фразы, опрество , происходит сопоставление Л с
    гом 0 . При происходит отстранение лица,произнос щего испытательную фразу, при й.в диктор квалифицируетс  как личность, на которую настроен верификатор.
    --jT- ----- .-.
    Таким образом, сущность способа сое- дел ют вьщержк.у времени до начала
    состоит в том, что преобразовангалй из парольной фразы речевой сигнал усиливают, выдел ют из него звонкие участки, из которых выдел ют заранее выбранное число сегментов одинаковой длительности на местах интенсивных гласных звуков и в начале и в конце парольной фразы, определ ют времен50
    произнесени  парольной фразы,, опре- дел ют интервалы между переходами через нуль речевых колебаний, соот- ветствун цих этим сегментам, и определ ют соотношение фильтрованных в частотной области первой гармоники сигнала числа нулей в начальной и конечном сегментах.
    ные интервалы между сегментами, определ ют выдержку времени до начала произнесени  парольной фразы, подсчитывают число экстремальных точек в каждом из вьщеленных сегментов ,определ ют отношение числа нулей, подсчитанных на первой гармонике сигнала в начальном и конечном сегмен0 тах,и сравнивают полученный комплекс параметров с индивидуальными дл  диктора эталонами. При этом из звонких участков на местах интенсивных гласных звуков, и в начале и в конце
    5 парольной фразы вьщел ют заранее выбранное число сегментов одинаковой
    длительности; определ ют временные интервалы между этими сегментами; определ ют выдержку времени до нача0 ла произнесени  парольной фразы; подсчитывают число экстремальных точек в каждом из выделенн(х сегментов; определ ют отнощение числа нулей, подсчитанных по первой гармонике сиг5 нала в начальном и конечном сегментах,
    Формула изобретени 
    Способ идентификации говор щего путем произнесени  им парольной фра0 зы, вьщелени  временных параметров этой фразы и порогового сравнени  с ; эталонными параметрами, о т л и ч аю щ и и с   тем, что, с целью повышени  надежности идентификации.
    дел ют вьщержк.у времени до начала
    произнесени  парольной фразы,, опре- дел ют интервалы между переходами через нуль речевых колебаний, соот- ветствун цих этим сегментам, и определ ют соотношение фильтрованных в частотной области первой гармоники сигнала числа нулей в начальной и конечном сегментах.
    Редактор С, Патрушева
    Составитель В. Махонин Техред М.Дидык
    Заказ 7289/48
    Тираж 343
    ВНИИПИ Государственного комитета по изобретени м и открыти м при ГКНТ СГСр 113035, Москва, Ж-35, Раушска  наб., д. 4/5
    Корректор А. Ворович
    Подписное
SU864082720A 1986-05-05 1986-05-05 Способ идентификации говор щего SU1453442A1 (ru)

Priority Applications (1)

Application Number Priority Date Filing Date Title
SU864082720A SU1453442A1 (ru) 1986-05-05 1986-05-05 Способ идентификации говор щего

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
SU864082720A SU1453442A1 (ru) 1986-05-05 1986-05-05 Способ идентификации говор щего

Publications (1)

Publication Number Publication Date
SU1453442A1 true SU1453442A1 (ru) 1989-01-23

Family

ID=21243370

Family Applications (1)

Application Number Title Priority Date Filing Date
SU864082720A SU1453442A1 (ru) 1986-05-05 1986-05-05 Способ идентификации говор щего

Country Status (1)

Country Link
SU (1) SU1453442A1 (ru)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5774858A (en) * 1995-10-23 1998-06-30 Taubkin; Vladimir L. Speech analysis method of protecting a vehicle from unauthorized accessing and controlling

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Авторское свидетельство СССР № 1117687, кл. G 10 L 9/06, 1983. За вка JP 9 56-80100 кл. G 10 L 9/06, 1981. *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5774858A (en) * 1995-10-23 1998-06-30 Taubkin; Vladimir L. Speech analysis method of protecting a vehicle from unauthorized accessing and controlling

Similar Documents

Publication Publication Date Title
US5791904A (en) Speech training aid
US4994983A (en) Automatic speech recognition system using seed templates
US5634086A (en) Method and apparatus for voice-interactive language instruction
JPS6147440B2 (ru)
JPS5944639B2 (ja) 音声による異同認識方式における標準パタ−ン更新方法
Karlsson et al. Speaker verification with elicited speaking styles in the VeriVox project
JPS62232691A (ja) 音声認識装置
Brubaker Rate and pause characteristics of oral reading
SU1453442A1 (ru) Способ идентификации говор щего
JP2844817B2 (ja) 発声練習用音声合成方式
Efremova et al. Intelligibility of tonic accents
Clapper Automatic word recognition
Karlsson et al. Within-speaker variability due to speaking manners.
Do et al. Vietnamese Text-To-Speech system with precise tone generation
Sevenster et al. Evaluation and training of second-language learners’ pronunciation using phoneme-based HMMs
Bull Voice identification by man and machine: A review of research
JPS60129796A (ja) 音声入力装置
SU1394233A1 (ru) Способ идентификации говор щего
KR20080065775A (ko) 구화 교육용 발성 시각화 시스템
Robinson et al. Phonological ambiguity vs the biuniqueness condition
Mirza Learning english basic sounds through syllabic utterances
Cooper Intonation and iambic pentameter
JPS6296998A (ja) 発声訓練装置
Cox et al. A reference standard for speech recognisers
Suen Computer simulation, development and evaluation of a high speed spelled speech code