RU2598314C2 - Способ оценки вариативности парольной фразы (варианты) - Google Patents

Способ оценки вариативности парольной фразы (варианты) Download PDF

Info

Publication number
RU2598314C2
RU2598314C2 RU2013136376/08A RU2013136376A RU2598314C2 RU 2598314 C2 RU2598314 C2 RU 2598314C2 RU 2013136376/08 A RU2013136376/08 A RU 2013136376/08A RU 2013136376 A RU2013136376 A RU 2013136376A RU 2598314 C2 RU2598314 C2 RU 2598314C2
Authority
RU
Russia
Prior art keywords
passphrase
variability
sequence
acoustic
phrase
Prior art date
Application number
RU2013136376/08A
Other languages
English (en)
Other versions
RU2013136376A (ru
Inventor
Михаил Васильевич Хитров
Дмитрий Викторович Дырмовский
Original Assignee
Общество с ограниченной ответственностью "Центр речевых технологий" (ООО "ЦРТ")
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Общество с ограниченной ответственностью "Центр речевых технологий" (ООО "ЦРТ") filed Critical Общество с ограниченной ответственностью "Центр речевых технологий" (ООО "ЦРТ")
Priority to RU2013136376/08A priority Critical patent/RU2598314C2/ru
Publication of RU2013136376A publication Critical patent/RU2013136376A/ru
Application granted granted Critical
Publication of RU2598314C2 publication Critical patent/RU2598314C2/ru

Links

Images

Abstract

Изобретение относится к области распознавания речи. Технический результат - обеспечение надежной оценки вариативности парольных фраз. Способ оценки вариативности парольной фразы, включающий получение парольной фразы от пользователя и оценку ее вариативности, отличающийся тем, что получают от пользователя парольную фразу в виде акустической фразы, преобразуют акустическую парольную фразу в последовательность акустических признаков, рассчитывают последовательность предопределенных речевых признаков по этой акустической фразе и определяют вариативность парольной фразы по этим признакам, после чего сравнивают определенную вариативность парольной фразы с предустановленным лимитом. 2 н. и 4 з.п. ф-лы, 7 ил.

Description

Изобретение относится главным образом к технологиям распознавания речи, в частности к системам, сравнивающим голос пользователя с записанным голосом другого пользователя и выдающим оценку схожести голосов, и может быть использовано в системах ограничения несанкционированного доступа в помещения или информационным ресурсам.
Распознавание речи - это процесс автоматического распознавания говорящего на основании индивидуальной информации, содержащейся в звуковых сигналах. Этот процесс может быть разделен на идентификацию и верификацию. Идентификация определяет, кто именно говорит из имеющегося числа дикторов. Верификация определяет соответствие или несоответствие личности говорящего. Верификация может быть использована для контроля доступа к ограниченным сервисам, к примеру телефонный доступ к банковским операциям, совершение покупок или доступ к секретному оборудованию.
Способ использования технологии обычно представляет собой процесс, когда пользователь произносит короткую фразу в микрофон. Затем измеряются и определяются различные акустические параметры (звуки, частота, высота тона и другие физические характеристики голосовых каналов, которые обычно называют звуковыми характеристиками). Затем эти элементы используются для установления набора уникальных звуковых параметров пользователя (которые обычно называются «отпечаток голоса» или «голосовая модель»). Данный процесс обычно называют регистрацией. Регистрация в этом случае представляет собой получение образца голоса. Затем полученный образец голоса обрабатывается (трансформируется в соответствующий отпечаток голоса), и отпечаток голоса хранится совместно с идентификаторами личности для использования в протоколах безопасности. Во время процесса верификации диктору предлагается повторить фразу, которая использовалась при регистрации. Алгоритм верификации голоса сравнивает голос диктора с записью голоса, сделанной во время регистрации. Технология верификации затем принимает или отклоняет попытку диктора установить соответствие голосовому образцу. Если голосовой образец соответствует, то пользователю предоставляется защищенный доступ. Если нет - то пользователю будет отказано в предоставлении доступа. Системы верификации диктора могут быть текстозависимыми или текстонезависимыми, либо являться их комбинацией. В текстозависимых системах человек произносит заранее заданное слово или фразу. Данная информация (обычно называемая «голосовой пароль» «кодовая фраза», «голосовой отпечаток») может представлять собой такую информацию, как имя, место рождения, любимый цвет или последовательность чисел. В текстозависимых системах распознавание диктора происходит без требования заранее установленной кодовой фразы.
Для оценки новизны и технического уровня заявленного решения рассмотрим ряд известных заявителю технических средств аналогичного назначения, характеризуемых совокупностью сходных с заявленным изобретением признаков, известных из сведений, ставших общедоступными до даты приоритета изобретения.
Известен способ аутентификации диктора по входному речевому сигналу диктора в виде парольной фразы, включающий сравнение параметров этого сигнала с заданной точностью с заранее сохраненными эталонами параметров входных речевых сигналов в виде той же парольной фразы, произносимой заранее известными дикторами, с последующей аутентификацией, отличающийся тем, что в качестве упомянутых параметров берется низкочастотная часть вейвлет преобразования от нормированной функции распределения особых точек вдоль звукового файла, отвечающего входному речевому сигналу диктора в виде парольной фразы, выделенных сравнением отсчета в этой точке в звуковом файле с предшествующими и последующими отсчетами посредством обобщенных коэффициентов линейного предсказания и порога Т, при этом нормирование функции распределения сводится к приведению ее к стандартной длине Len, принятой при подсчете эталонных параметров входных речевых сигналов в виде парольной фразы, произносимой заранее известным дикторами, см. патент РФ №2422921.
Известен способ аутентификации диктора по парольной фразе, включающий посегментное сравнение входного речевого сигнала диктора с заранее сохраненными эталонами параметров эталонных фраз, произносимых заранее известными дикторами, для чего осуществляют сравнение параметрических описаний последовательных сегментов входного речевого сигнала с параметрическими описаниями последовательных сегментов из выбранных для сравнения с упомянутым эталоном с последующей аутентификацией диктора, отличающийся тем, что в качестве упомянутых параметрических описаний берут матрицу переходов, построенную в соответствии с правилом, заключающимся в том, что строят последовательность особых точек, выделенных сравнением отсчета в сегменте с окружением отсчета, определенным посредством обобщенных коэффициентов линейного предсказания и порога Т, далее агрегируют последовательности особых точек в блоки длины L, строят матрицу переходов, аналогичную матрице переходов в цепи Маркова, по числу особых точек в блоке и сравнивают полученную матрицу с образцом эталонной матрицы с заданной точностью и принимают решение о правильности аутентификации диктора, см. патент РФ №2422920.
Существуют определенное число различных технологий, используемых для создания голосовых отпечатков: скрытые модели Маркова (HMMs), Gaussian Mixture Models (GMMs), искусственные нейронные сети или совокупности вышеуказанных техник. Одной из проблем с вышеописанной технологией распознавания является вариативность голосового пароля (кодовой фразы, голосового отпечатка). Кодовая фраза может быть фонетически богата или фонетически скудна. «Фонетически скудная кодовая фраза» означает, что эта кодовая фраза содержит только ограниченное количество уникальных звуков (фонем) и, соответственно, вариативность этой кодовой фразы мала. Если вариативность кодовой фразы мала (в крайних случаях кодовая фраза содержит только набор идентичных звуков, например, «а-а-а-а»), невозможно оценить соответствующие физические характеристики голосовых каналов диктора. В результате создается неэффективный голосовой отпечаток и эффективность системы распознавания диктора резко снижается.
Необходимо отметить, что эта проблема отличается от проблемы криптографической защищенности текстового пароля. В самом деле, если голосовой пароль содержит ограниченное число уникальных текстовых знаков (в крайних случаях кодовая фраза содержит только набор идентичных знаков, например, «qqqqq»), его криптографическая защищенность существенно низка. Однако это означает только, что пароль может быть легко угадан и является недостаточно сложным, чтобы отразить криптографические атаки.
В противоположность этому система распознавания диктора не может создать эффективные голосовые отпечатки в связи с недостатком звуков в кодовой фразе. Результатом слабого голосового отпечатка в процессе верификации или идентификации является низкое качество распознавания диктора. К примеру, одним из обычно используемых коэффициентов вероятности для оценки работы системы распознавания является Уровень равновероятной ошибки (Equal Error Rate - EER). Чем ниже EER, тем лучше система распознавания. Было установлено, что EER увеличивается с 6% для фонетически богатых парольных фраз до 18% для фонетически скудных парольных фраз.
Задача изобретения заключается в создании способа для оценки вариативности парольной фразы, которая могла бы быть затем использована для генерирования фонетически богатых паролей в текстозависимых системах распознавания, для оценки вариативности входных данных парольной фразы в текстозависимой системе при регистрации и для генерирования предупреждения диктора в случае низкой вариативности парольной фразы. Определение вариативности парольной фразы затем может быть использовано для генерации фонетически представительных паролей в текстозависимых системах идентификации диктора по голосу, для оценки вариативности входной фразы в текстонезависимых системах в процессе регистрации и для генерации предупредительного сообщения клиенту в случае низкой вариативности парольной фразы.
Сущность первого независимого объекта заявляемого изобретения как технического решения выражается в следующей совокупности существенных признаков, достаточной для достижения указанного выше обеспечиваемого изобретением технического результата.
Согласно первому независимому объекту изобретения способ оценки вариативности парольной фразы, включающий получение парольной фразы от пользователя и оценку ее вариативности, характеризующийся тем, что получают от пользователя парольную фразу в виде акустической фразы, преобразуют акустическую парольную фразу в последовательность акустических признаков, рассчитывают последовательность предопределенных речевых признаков по этой акустической фразе и определяют вариативность парольной фразы по этим признакам, после чего сравнивают определенную вариативность парольной фразы с предустановленным лимитом.
В этом заключается совокупность существенных признаков первого независимого варианта изобретения, обеспечивающая получение технического результата во всех случаях, на которые распространяется испрашиваемый объем правовой охраны.
Кроме того, первой независимый варианта изобретения характеризуется наличием ряда факультативных признаков, описывающих частные случаи его реализации, а именно:
- преобразование акустической парольной фразы в последовательность акустических признаков осуществляют путем преобразования парольной фразы в последовательность спектров, после чего преобразуют спектры в первую последовательность формантов;
- вариативность парольной фразы определяют по оценке гистограмм N-Dim для каждой траектории формант, затем оценивают минимальные и максимальные значения для каждой форманты, выводят по меньшей мере одну совокупности бинов гиперкуба, определяют место каждой форманты как единицы в соответствующей совокупности бинов гиперкуба и используют гистограммы N-Dim для оценки энтропии и максимального значения данной энтропии;
- оценивают абсолютную псевдоэнтропию;
- оценивают относительную псевдоэнтропию.
Согласно второму независимому объекту изобретения способ оценки вариативности парольной фразы, включающий получение парольной фразы от пользователя и оценку ее вариативности, характеризующийся тем, что получают от пользователя текстовую парольную фразу, преобразуют текстовую парольную фразу в последовательность фонетических символов и определяют вариативность текста парольной фразы по последовательности фонетических символов, после чего сравнивают определенную вариативность парольной фразы с предустановленным лимитом.
За счет реализации отличительных признаков изобретения достигается технический результат, заключающийся в том, что, заявленный способ в обоих вариантах его реализации обеспечивает надежную оценку вариативности парольных фраз, полученных как в акустическим, так и в текстовом виде.
Сущность изобретения поясняется чертежами, где на фиг. 1 представлена блок-схема реализации заявленного способа в обоих вариантах, на фиг. 2 - схема реализации первого варианта заявленного способа, при получении парольной фразы в фонетическом виде, на фиг. 3 - схема реализации второго варианта заявленного способа, при получении парольной фразы в текстовом виде, на фиг. 4 - график зависимости Equal Error Rate (EER) от информационной вариативности, на фиг. 5 - график зависимости Equal Error Rate (EER) от относительной вариативности на фиг. 6 - график зависимости Equal Error Rate (EER) от абсолютной вариативности, 1-й взвешенной (оцененной) суммы и 2-й взвешенной (оцененной) вариативности, на фиг.7 - таблицы, иллюстрирующие числовые данные Equal Error Rate (EER) как функцию различных вариативностей.
Заявленный способ реализуют следующим образом.
В первом варианте получают от пользователя парольную фразу в виде акустической фразы, преобразуют акустическую парольную фразу в последовательность акустических признаков, рассчитывают последовательность предопределенных речевых признаков по этой акустической фразе и определяют вариативность парольной фразы по этим признакам, после чего сравнивают определенную вариативность парольной фразы с предустановленным лимитом.
Преобразуют акустическую парольную фразу в последовательность акустических признаков, осуществляют путем преобразования парольной фразы в последовательность спектров, после чего преобразуют спектры в первую последовательность формантов. Вариативность парольной фразы определяют по оценке гистограмм N-Dim для каждой траектории формант, затем оценивают минимальные и максимальные значения для каждой форманты, выводят по меньшей мере одну совокупности бинов гиперкуба, определяют место каждой форманты как единицы в соответствующей совокупности бинов гиперкуба и используют гистограммы N-Dim для оценки энтропии и максимального значения данной энтропии. Оценивают абсолютную и относительную псевдоэнтропию.
Во втором варианте получают от пользователя текстовую парольную фразу, преобразуют текстовую парольную фразу в последовательность фонетических символов и определяют вариативность текста парольной фразы по последовательности фонетических символов, после чего сравнивают определенную вариативность парольной фразы с предустановленным лимитом.
Устройство, реализующее оба варианта заявленного способа, представляет собой взаимосвязанные носитель информации, центральный процессор и графический интерфейс, где на носителе информации имеются машинные команды, включающие команды на получение парольной фразы от пользователя, расчета последовательности предопределенных акустических признаков или фонетических символов, оценки вариативности парольной фразы на основе этих признаков, сравнение рассчитанной вариативности парольной фразы с предопределенным порогом и сообщение пользователю результата сравнения значения вариативности парольной фразы с предопределенным порогом.
Данное устройство может быть реализовано с использованием известных компьютерных или мультипроцессорных систем.

Claims (6)

1. Способ оценки вариативности парольной фразы, включающий получение парольной фразы от пользователя и оценку ее вариативности, отличающийся тем, что получают от пользователя парольную фразу в виде акустической фразы, преобразуют акустическую парольную фразу в последовательность акустических признаков, рассчитывают последовательность предопределенных речевых признаков по этой акустической фразе и определяют вариативность парольной фразы по этим признакам, после чего сравнивают определенную вариативность парольной фразы с предустановленным лимитом.
2. Способ по п. 1, отличающийся тем, что преобразование акустической парольной фразы в последовательность акустических признаков осуществляют путем преобразования парольной фразы в последовательность спектров, после чего преобразуют спектры в первую последовательность формантов.
3. Способ по п. 1, отличающийся тем, что вариативность парольной фразы определяют по оценке гистограмм N-Dim для каждой траектории формант, затем оценивают минимальные и максимальные значения для каждой форманты, выводят по меньшей мере одну совокупности бинов гиперкуба, определяют место каждой форманты как единицы в соответствующей совокупности бинов гиперкуба и используют гистограммы N-Dim для оценки энтропии и максимального значения данной энтропии.
4. Способ по п. 1, отличающийся тем, что оценивают абсолютную псевдоэнтропию.
5. Способ по п. 1, отличающийся тем, что оценивают относительную псевдоэнтропию.
6. Способ оценки вариативности парольной фразы, включающий получение парольной фразы от пользователя и оценку ее вариативности, отличающийся тем, что получают от пользователя текстовую парольную фразу, преобразуют текстовую парольную фразу в последовательность фонетических символов и определяют вариативность текста парольной фразы по последовательности фонетических символов, после чего сравнивают определенную вариативность парольной фразы с предустановленным лимитом.
RU2013136376/08A 2013-08-05 2013-08-05 Способ оценки вариативности парольной фразы (варианты) RU2598314C2 (ru)

Priority Applications (1)

Application Number Priority Date Filing Date Title
RU2013136376/08A RU2598314C2 (ru) 2013-08-05 2013-08-05 Способ оценки вариативности парольной фразы (варианты)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
RU2013136376/08A RU2598314C2 (ru) 2013-08-05 2013-08-05 Способ оценки вариативности парольной фразы (варианты)

Publications (2)

Publication Number Publication Date
RU2013136376A RU2013136376A (ru) 2015-02-10
RU2598314C2 true RU2598314C2 (ru) 2016-09-20

Family

ID=53281733

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2013136376/08A RU2598314C2 (ru) 2013-08-05 2013-08-05 Способ оценки вариативности парольной фразы (варианты)

Country Status (1)

Country Link
RU (1) RU2598314C2 (ru)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040234137A1 (en) * 2001-03-19 2004-11-25 Martin Weston Image segmentation
US6957185B1 (en) * 1999-02-25 2005-10-18 Enco-Tone, Ltd. Method and apparatus for the secure identification of the owner of a portable device
RU2419890C1 (ru) * 2009-09-24 2011-05-27 Общество с ограниченной ответственностью "Центр речевых технологий" Способ идентификации говорящего по фонограммам произвольной устной речи на основе формантного выравнивания
US20110276323A1 (en) * 2010-05-06 2011-11-10 Senam Consulting, Inc. Speech-based speaker recognition systems and methods

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6957185B1 (en) * 1999-02-25 2005-10-18 Enco-Tone, Ltd. Method and apparatus for the secure identification of the owner of a portable device
US20040234137A1 (en) * 2001-03-19 2004-11-25 Martin Weston Image segmentation
RU2419890C1 (ru) * 2009-09-24 2011-05-27 Общество с ограниченной ответственностью "Центр речевых технологий" Способ идентификации говорящего по фонограммам произвольной устной речи на основе формантного выравнивания
US20110276323A1 (en) * 2010-05-06 2011-11-10 Senam Consulting, Inc. Speech-based speaker recognition systems and methods

Also Published As

Publication number Publication date
RU2013136376A (ru) 2015-02-10

Similar Documents

Publication Publication Date Title
US11869513B2 (en) Authenticating a user
AU2013203139B2 (en) Voice authentication and speech recognition system and method
US8160877B1 (en) Hierarchical real-time speaker recognition for biometric VoIP verification and targeting
US7054811B2 (en) Method and system for verifying and enabling user access based on voice parameters
US9099085B2 (en) Voice authentication systems and methods
US20120143608A1 (en) Audio signal source verification system
US8447614B2 (en) Method and system to authenticate a user and/or generate cryptographic data
JP2002514318A (ja) 録音された音声を検出するシステムおよび方法
Shah et al. Biometric voice recognition in security system
EP2817601A1 (en) System and method for speaker recognition on mobile devices
WO2010066310A1 (en) Method for verifying the identity of a speaker, system therefore and computer readable medium
Saquib et al. A survey on automatic speaker recognition systems
WO2010120626A1 (en) Speaker verification system
Baloul et al. Challenge-based speaker recognition for mobile authentication
WO2005013263A1 (ja) 音声認証システム
KR101888058B1 (ko) 발화된 단어에 기초하여 화자를 식별하기 위한 방법 및 그 장치
US20140188468A1 (en) Apparatus, system and method for calculating passphrase variability
Chen et al. Towards understanding and mitigating audio adversarial examples for speaker recognition
US20210166715A1 (en) Encoded features and rate-based augmentation based speech authentication
CN116490920A (zh) 用于针对由自动语音识别系统处理的语音输入检测音频对抗性攻击的方法、对应的设备、计算机程序产品和计算机可读载体介质
Duraibi Voice biometric identity authentication model for iot devices
Firc et al. The dawn of a text-dependent society: Deepfakes as a threat to speech verification systems
Reynolds et al. Automatic speaker recognition
Saleema et al. Voice biometrics: the promising future of authentication in the internet of things
KR20110079161A (ko) 이동 단말기에서 화자 인증 방법 및 장치