SU1453442A1 - Способ идентификации говор щего - Google Patents
Способ идентификации говор щего Download PDFInfo
- Publication number
- SU1453442A1 SU1453442A1 SU864082720A SU4082720A SU1453442A1 SU 1453442 A1 SU1453442 A1 SU 1453442A1 SU 864082720 A SU864082720 A SU 864082720A SU 4082720 A SU4082720 A SU 4082720A SU 1453442 A1 SU1453442 A1 SU 1453442A1
- Authority
- SU
- USSR - Soviet Union
- Prior art keywords
- segments
- passphrase
- speaker
- phrase
- time
- Prior art date
Links
Landscapes
- Electrically Operated Instructional Devices (AREA)
Abstract
Изобретение касаетс анализа речевых сигналов и автоматического распознавани образов и может быть использовано дл автоматизации контрольно-пропускных пунктов и разработки голосовых клкмей ; Применение способа повышает надежность идентификации личности и обеспечение устойчивости система к попыткам имитации голоса. Способ заключаетс в сравнении временной последовательности комплекса параметров речевого сигнала с индивидуальными дл диктора эталонами.
Description
Изобретение относитс к анализу речевых сигналов и автоматическом распознаванию образов и может быть использовано дл автоматизации контрольно-пропускных пунктов (КПП) уч- реждений и разработки голосовых ключей, обеспечивающих санкциониро- ванньй доступ определенных лиц к банкам или механизмам специального назначени на основе предъ влени этими лицами в качестве свидетельства о личности своей речи.
Целью изобретени вл етс повышение надежности идентификации гово- р щего путем анализа наиболее информативных с точки зрени различени голосов гласных фонем, выдел емых лишь по признаку наибольшей интенсив ности и звонкости звука.
Способ свободен от необходимости осуществлени сложных процедур нелинейной нормализации продолжительности звучани фразы. Действительно, проста по своей природе операци не вносит больших интраиндивидуаль- ных вариаций при различных произнесени х одного и того же диктора, ив то же врем может обеспечить существенный вклад при отстранении чужих :ГОЛОСОВ за счет возможной неидентичной зкстракции опорных гласных дл разных дикторов даже в случае, если мистификатору известна парольна фраза.
На фиг. 1 показан пример устройства, реализующего способ; на фиг. 2 - вреЧ менные диaгpa Iмы, иллюстрирующие спо- 1соб идантификации.
, Устройство содержит кнопку 1 запус- 1ка, усилитель 2, выделитель 3 звонких участков сигнала, механический фикса- ;тор 4 кода дл установки числа вьще- п емых опорных сегментов, экстрактор 5 интенсивных фонем, а также начального и конечного сегментов сигнала, измеритель 6 длительности между опорными сегментами, счетчик-определитель 7 числа экстремальных точек, детектор 8 первой гармоники сигнала, счетчик 9 числа нулевых точек, формирова- тель 10 матрицы признаков, переключатель 11 режимов обучени и верификации , блок 12 обучени , блок 13 сра- )внени и блок 14 прин ти решени .
Пусть в качестве парольной фразы идентифицируемым лицом выбрана фра- Sa: Мой голос-мой код (фиг. 2). Характер огибающего речевого сигна
.Q
с
5
5
0
5
ла, соответствующего этой парольной , фразе, приводитс на фиг. 2а. Дл удобства под иллюстрацией даетс буквенна (а не фонематическа ) запись парольной фразы.
С произнесением фразы сигнал через усилитель 2 поступает на вьщелитель звонких участков сигнала 3. Этот блок состоит из набора узкополосных фильтров с частотным диапазоном 100- 500 Гц. Ширина полосы пропускани каждого фильтра не больше возможного периода основного тона голоса и составл ет примерно 70-80 Гц. Во врем произнесени звонких звуков это позвол ет определить линейчатость структуры сигнала, так как гармоники сигнала не смогут одновременно попасть во все фильтры. Обратна картина имеет место при произнесении глухих звуков.
Разделение сигнала на звонкие и не звонкие участки сигнала показано на фиг. 26. Заштрихованна часть диаграммы указывает на звонкий характер сигнала.
Далее с помощью экстрактора 5 из сигнала выдел ютс интенсивные участки на местах ударных гласных звуков, а также в начале и в конце произнесени . Этот блок представл ет собой микропроцессор, включающий в себ запоминающее устройство и вычислитель числа (задаваемого заранее с помощью фиксатора 4) энергетически мощных участков сигнала, а также стандартных по длительности участков в начальной и конечной части сигнала, Дл случа п 5 эта операци показана на фиг. 2в.
Далее с помощью блока 6 определ ютс длительности Т,- Т между началами вьйранных мощных учатсков (опорных сегментов) сигнала, а также длительность времени Т от запуска (кнопкой 1) устройства до начала произнесени . Эти параметры показаны на фиг.2г.
Счетчик 7 определ ет число экст- ремумой речевого сигнала за стандартный период выбранньк опорных сегментов (фиг. 2д), счетчик 9 - число нулевых точек после детектировани блоком 7 (этот блок представл ет собой низкочастотный фильтр с крутизной спада 18 дБ/окт., начина с 200 Гц) первой гармоники сигнала (фиг. 2е). Эти последние параметры испол1 эуют в дальнейшем дл вычислени значени
Ыц/Ыц, где N° - число нулевых точек первой гармоники сигнала в начальном, опорном сегменте; N - в конечном опорном cerMisHTe.
Формирователь 10 признаков (матрицы ) представл ет собой буферное запоминающее устройство, куда поступают перечисленные данные из блока 6 и счетчиков 7 и 9: Тр-Тд, N,- Nj и NS/N°.
Необходимо отметить,.что.число столбцов матрицы дл разных случаев задани будет разным и, таким образом , оно также, как и другие признаки индивидуальности голоса, участвует в правильной верификации диктора,
В режиме обучени , т.е. в режиме запоминани голосовых и произносительных характеристик идентифицируемого лица, переключатель 11 находитс в правом положении. В этом случае все данные из формировател 10 матрицы передаютс в блок 12, который представл ет собой долговременное запоминающее устройство (ДЗУ).
В режиме идентификации (переключатель 11 находитс в левом положении) данные анализа контрольной фразы из блока 10 формировани признаков подаютс уже на блок 13, которьй производит сопоставление и сравнение этих данных с данными обучени из блока 12, В результате формируетс разностный
ные интервалы между сегментами, определ ют выдержку времени до начала произнесени парольной фразы, подсчитывают число экстремальных точек в каждом из вьщеленных сегментов ,определ ют отношение числа нулей, подсчитанных на первой гармонике сигнала в начальном и конечном сегмен 0 тах,и сравнивают полученный комплекс параметров с индивидуальными дл диктора эталонами. При этом из звонких участков на местах интенсивных гласных звуков, и в начале и в конце
15 парольной фразы вьщел ют заранее выбранное число сегментов одинаковой
, длительности; определ ют временные интервалы между этими сегментами; определ ют выдержку времени до нача20 ла произнесени парольной фразы; подсчитывают число экстремальных точек в каждом из выделенн(х сегментов; определ ют отнощение числа нулей, подсчитанных по первой гармонике сиг25 нала в начальном и конечном сегментах,
Claims (1)
- Формула изобретениСпособ идентификации говор щего путем произнесени им парольной фра30 зы, вьщелени временных параметров этой фразы и порогового сравнени с ; эталонными параметрами, о т л и ч а ю щ и и с тем, что, с целью повышени надежности идентификации.сигнал и между сравниваемыми матрица- параметры произнесени контрольной ми, который подаетс на блок 14 при-фразы устанавливают индивидуальнон ти решени . В этом блоке, также представл ющем сравнивающее устройпо трудно имитируемьм неконтролируе- мым на слух особенност м речевого поведени говор щего, при этом пара- некоторым заранее установленным поре- Q метры дл идентификации выбирают из совокупности временных интерваловмежду заранее выбранными наиболее ин- тенсивными сегментами одинаковой длительности на звонких участках и в 45 начале и конце парольной фразы, опрество , происходит сопоставление Л сгом 0 . При происходит отстранение лица,произнос щего испытательную фразу, при й.в диктор квалифицируетс как личность, на которую настроен верификатор.--jT- ----- .-.Таким образом, сущность способа сое- дел ют вьщержк.у времени до началасостоит в том, что преобразовангалй из парольной фразы речевой сигнал усиливают, выдел ют из него звонкие участки, из которых выдел ют заранее выбранное число сегментов одинаковой длительности на местах интенсивных гласных звуков и в начале и в конце парольной фразы, определ ют времен50произнесени парольной фразы,, опре- дел ют интервалы между переходами через нуль речевых колебаний, соот- ветствун цих этим сегментам, и определ ют соотношение фильтрованных в частотной области первой гармоники сигнала числа нулей в начальной и конечном сегментах.ные интервалы между сегментами, определ ют выдержку времени до начала произнесени парольной фразы, подсчитывают число экстремальных точек в каждом из вьщеленных сегментов ,определ ют отношение числа нулей, подсчитанных на первой гармонике сигнала в начальном и конечном сегмен0 тах,и сравнивают полученный комплекс параметров с индивидуальными дл диктора эталонами. При этом из звонких участков на местах интенсивных гласных звуков, и в начале и в конце5 парольной фразы вьщел ют заранее выбранное число сегментов одинаковойдлительности; определ ют временные интервалы между этими сегментами; определ ют выдержку времени до нача0 ла произнесени парольной фразы; подсчитывают число экстремальных точек в каждом из выделенн(х сегментов; определ ют отнощение числа нулей, подсчитанных по первой гармонике сиг5 нала в начальном и конечном сегментах,Формула изобретениСпособ идентификации говор щего путем произнесени им парольной фра0 зы, вьщелени временных параметров этой фразы и порогового сравнени с ; эталонными параметрами, о т л и ч аю щ и и с тем, что, с целью повышени надежности идентификации.дел ют вьщержк.у времени до началапроизнесени парольной фразы,, опре- дел ют интервалы между переходами через нуль речевых колебаний, соот- ветствун цих этим сегментам, и определ ют соотношение фильтрованных в частотной области первой гармоники сигнала числа нулей в начальной и конечном сегментах.Редактор С, ПатрушеваСоставитель В. Махонин Техред М.ДидыкЗаказ 7289/48Тираж 343ВНИИПИ Государственного комитета по изобретени м и открыти м при ГКНТ СГСр 113035, Москва, Ж-35, Раушска наб., д. 4/5Корректор А. ВоровичПодписное
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
SU864082720A SU1453442A1 (ru) | 1986-05-05 | 1986-05-05 | Способ идентификации говор щего |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
SU864082720A SU1453442A1 (ru) | 1986-05-05 | 1986-05-05 | Способ идентификации говор щего |
Publications (1)
Publication Number | Publication Date |
---|---|
SU1453442A1 true SU1453442A1 (ru) | 1989-01-23 |
Family
ID=21243370
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
SU864082720A SU1453442A1 (ru) | 1986-05-05 | 1986-05-05 | Способ идентификации говор щего |
Country Status (1)
Country | Link |
---|---|
SU (1) | SU1453442A1 (ru) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5774858A (en) * | 1995-10-23 | 1998-06-30 | Taubkin; Vladimir L. | Speech analysis method of protecting a vehicle from unauthorized accessing and controlling |
-
1986
- 1986-05-05 SU SU864082720A patent/SU1453442A1/ru active
Non-Patent Citations (1)
Title |
---|
Авторское свидетельство СССР № 1117687, кл. G 10 L 9/06, 1983. За вка JP 9 56-80100 кл. G 10 L 9/06, 1981. * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5774858A (en) * | 1995-10-23 | 1998-06-30 | Taubkin; Vladimir L. | Speech analysis method of protecting a vehicle from unauthorized accessing and controlling |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US5791904A (en) | Speech training aid | |
US4994983A (en) | Automatic speech recognition system using seed templates | |
US5634086A (en) | Method and apparatus for voice-interactive language instruction | |
JPS6147440B2 (ru) | ||
JPS5944639B2 (ja) | 音声による異同認識方式における標準パタ−ン更新方法 | |
Karlsson et al. | Speaker verification with elicited speaking styles in the VeriVox project | |
JPS62232691A (ja) | 音声認識装置 | |
Brubaker | Rate and pause characteristics of oral reading | |
SU1453442A1 (ru) | Способ идентификации говор щего | |
JP2844817B2 (ja) | 発声練習用音声合成方式 | |
Efremova et al. | Intelligibility of tonic accents | |
Clapper | Automatic word recognition | |
Karlsson et al. | Within-speaker variability due to speaking manners. | |
Do et al. | Vietnamese Text-To-Speech system with precise tone generation | |
Sevenster et al. | Evaluation and training of second-language learners’ pronunciation using phoneme-based HMMs | |
Bull | Voice identification by man and machine: A review of research | |
JPS60129796A (ja) | 音声入力装置 | |
SU1394233A1 (ru) | Способ идентификации говор щего | |
KR20080065775A (ko) | 구화 교육용 발성 시각화 시스템 | |
Robinson et al. | Phonological ambiguity vs the biuniqueness condition | |
Mirza | Learning english basic sounds through syllabic utterances | |
Cooper | Intonation and iambic pentameter | |
JPS6296998A (ja) | 発声訓練装置 | |
Cox et al. | A reference standard for speech recognisers | |
Suen | Computer simulation, development and evaluation of a high speed spelled speech code |