EA201290082A1

EA201290082A1 - Способ идентификации говорящего по фонограммам произвольной устной речи на основе формантного выравнивания

Info

Publication number: EA201290082A1
Application number: EA201290082A
Authority: EA
Inventors: Сергей Львович КОВАЛЬ
Original assignee: Общество с ограниченной ответственностью "Центр речевых технологий"
Priority date: 2009-09-24
Filing date: 2010-11-03
Publication date: 2012-07-30
Also published as: EP2482277A2; US9047866B2; EP2482277B1; WO2011046474A2; US20130325470A1; RU2419890C1; EP2482277A4; EA019949B1; ES2547731T3; WO2011046474A3; US20120232899A1

Abstract

Предлагаемый способ идентификации говорящего по фонограммам произвольной устной речи на основе формантного выравнивания позволяет осуществлять надежную идентификацию говорящего как для длинных, так и для коротких фонограмм, фонограмм, записанных в различных каналах с высоким уровнем помех и искажений, а также фонограмм с произвольной устной речью дикторов, находящихся в различных психофизиологических состояниях, говорящих на различающихся языках, что обеспечивает широкую область применения предлагаемого способа, в том числе в криминалистических исследованиях. Идентификация говорящего по фонограммам устной речи осуществляют путем оценки сходства между первой фонограммой говорящего и второй, эталонной фонограммой. Для указанной оценки на первой и второй фонограммах выбирают опорные фрагменты речевых сигналов, на которых присутствуют формантные траектории по крайней мере трех формант, сравнивают между собой опорные фрагменты, в которых совпадают значения по крайней мере двух формантных частот, оценивают сходство сравниваемых опорных фрагментов по совпадению значений остальных формантных частот, а сходство фонограмм в целом определяют по суммарной оценке сходства всех сравниваемых опорных фрагментов.