RU2016135372A

RU2016135372A - Способ и устройство определения коэффициента правильного распознавания

Info

Publication number: RU2016135372A
Application number: RU2016135372A
Authority: RU
Inventors: Юцзюнь ВАН
Original assignee: Ли Холдингз (Бейджинг) Ко., Лтд.; Ли Ши Чжи Синь Электроник Текнолоджи (Тянь Цзинь) Лимитед
Priority date: 2015-11-05
Filing date: 2016-05-13
Publication date: 2018-03-07
Also published as: RU2016135372A3; CN105653517A; US20170133008A1; WO2017075957A1

Claims

1. Способ определения коэффициента правильного распознавания, содержащий этапы, на которых:

получают строку символов, получаемую при распознавании голоса, и стандартный результат распознавания, соответствующий строке символов, при этом стандартный результат распознавания содержит символы фонетического типа и символы типа китайских иероглифов;

делят строку символов согласно типу символов в строке символов для генерирования последовательности символов, при этом, если строка символов содержит фонетические символы, ряд фонетических символов, представляющих собой одно завершенное значение, отделяют в элемент распознавания;

вычисляют кратчайший вариант расстояния между последовательностью символов и последовательностью стандартного результата распознавания, сгенерированной посредством разделения стандартного результата распознавания;

получают оптимальный результат совмещения между последовательностью символов и последовательностью стандартного результата распознавания согласно вычисленному кратчайшему варианту расстояния; и

определяют коэффициент правильного распознавания последовательности символов относительно последовательности стандартного результата распознавания согласно оптимальному результату совмещения между последовательностью символов и последовательностью стандартного результата распознавания, при этом коэффициент правильного распознавания включает в себя коэффициент распознавания ошибок фонетических символов и коэффициент распознавания ошибок китайских иероглифов.

2. Способ по п. 1, в котором на этапе деления строки символов согласно типу символов в строке символов для генерирования последовательности символов:

для любого символа в строке символов, если тип упомянутого любого символа является китайским иероглифом, определяют упомянутый любой символ в качестве элемента распознавания; а когда упомянутый любой символ является фонетическим символом, если упомянутый любой символ не является первым символом в строке символов и упомянутый любой символ расположен между двух символов пробела, или упомянутый любой символ является первым символом в строке символов, а следующая позиция относительно упомянутого любого символа является символом пробела, определяют упомянутый любой символ в качестве элемента распознавания, в противном случае определяют местоположение двух ближайших символов пробела относительно упомянутого любого символа соответственно и определяют все символы между обнаруженными двумя символами пробела в качестве элемента распознавания;

сортируют соответственно определенные элементы распознавания согласно положениям определенных элементов распознавания в строке символов; и

определяют отсортированные элементы распознавания в качестве последовательности символов.

3. Способ по п. 2, в котором на этапе вычисления кратчайшего варианта расстояния между последовательностью символов и последовательностью стандартного результата распознавания:

создают двумерную сетку, в которой первое измерение двумерной сетки представляет собой элементы распознавания в последовательности символов, а второе измерение двумерной сетки представляет собой элементы распознавания в последовательности стандартного результата распознавания;

подсчитывают количество случаев ошибки каждого типа, соответствующее каждому элементу двумерной сетки соответственно в направлении слева направо и сверху вниз в двумерной сетке, при этом количество случаев ошибки данного типа представляет собой сумму количества случаев ошибки данного типа в предыдущем элементе сетки, соответствующем данному типу ошибки, и количества случаев ошибки данного типа элемента распознавания, соответствующего элементу сетки, относительно стандартного элемента, причем предыдущий элемент сетки представляет собой элемент сетки, граничащий с текущим элементом сетки, на который указывает указатель поиска с возвратом, соответствующий данному типу ошибки;

добавляют подсчитанное количество случаев ошибки каждого типа, соответствующее каждому элементу двумерной сетки в двумерной сетке, к соответствующему элементу сетки;

выбирают элемент сетки в последней строке и последнем столбце двумерной сетки и определяют такой из соответствующих типов ошибок, соответствующих выбранному элементу сетки, который имеет наименьшее количество случаев; и

определяют количество случаев определенного типа ошибки в качестве кратчайшего варианта расстояния между последовательностью символов и последовательностью стандартного результата распознавания.

4. Способ по п. 3, в котором на этапе получения оптимального результата совмещения между последовательностью символов и последовательностью стандартного результата распознавания:

выполняют для каждого элемента сетки в двумерной сетке операции, на которых:

определяют такой из соответствующих типов ошибок, соответствующих выбранному элементу сетки, который имеет наименьшее количество случаев; определяют количество случаев определенного типа ошибки в качестве наименьшего количества случаев ошибок, соответствующего элементу сетки; и получают указатель поиска с возвратом, соответствующий определенному типу ошибки;

определяют набор отношений совмещения между соответствующими элементами распознавания, соответствующими последовательности символов, и соответствующими стандартными элементами, соответствующими стандартному результату распознавания, согласно направлению, указанному указателем поиска с возвратом, полученному в каждом элементе сетки, начиная с элемента сетки, соответствующего кратчайшему варианту расстояния в двумерной сетке; и

определяют определенный набор отношений совмещения между соответствующими элементами распознавания, соответствующими последовательности символов, и соответствующими стандартными элементами, соответствующими стандартному результату распознавания, в качестве оптимального результата совмещения между последовательностью символов и последовательностью стандартного результата распознавания.

5. Способ по п. 4, в котором на этапе определения коэффициента правильного распознавания последовательности символов относительно последовательности стандартного результата распознавания согласно оптимальному результату совмещения между последовательностью символов и последовательностью стандартного результата распознавания:

получают тип ошибки, соответствующий каждому отношению совмещения в наборе отношений совмещения, и количество случаев упомянутого типа ошибки; и

определяют коэффициент правильного распознавания последовательности символов относительно последовательности стандартного результата распознавания согласно количеству случаев упомянутого типа ошибки, соответствующему каждому отношению совмещения в наборе отношений совмещения.

6. Способ по п. 5, в котором на этапе определения коэффициента правильного распознавания последовательности символов относительно последовательности стандартного результата распознавания согласно количеству случаев типа ошибки, соответствующему каждому отношению совмещения в наборе отношений совмещения:

выбирают отношение соответствия китайских иероглифов в наборе отношений совмещения, причем отношение соответствия китайских иероглифов включает в себя стандартные элементы китайских иероглифов; и вычисляют долю количества отношений соответствия всех ошибок распознавания в выбранном отношении соответствия к общему количеству стандартных элементов китайских иероглифов в качестве коэффициента ошибок распознавания китайских иероглифов последовательности символов относительно последовательности стандартного результата распознавания; и

выбирают отношения соответствия фонетических символов в наборе отношений совмещения, причем отношение соответствия фонетических символов включает в себя стандартные элементы фонетических символов; и вычисляют долю количества типов ошибок отношений соответствия всех ошибок распознавания в выбранном отношении соответствия к общему количеству стандартных элементов фонетических символов в качестве коэффициента ошибок фонетических символов последовательности символов относительно последовательности стандартного результата распознавания.

7. Устройство определения коэффициента правильного распознавания, содержащее:

блок получения, выполненный с возможностью получения строки символов, получаемой при распознавании голоса, и стандартного результата распознавания, соответствующего строке символов, при этом стандартный результат распознавания содержит символы фонетического типа и символы типа китайских иероглифов;

блок генерации последовательности, выполненный с возможностью деления строки символов согласно типу символов в строке символов для генерирования последовательности символов, при этом, если строка символов содержит фонетические символы, ряд фонетических символов, представляющих собой одно завершенное значение, отделяются в элемент распознавания;

блок вычисления, выполненный с возможностью вычисления кратчайшего варианта расстояния между последовательностью символов и последовательностью стандартного результата распознавания, сгенерированной посредством разделения стандартного результата распознавания;

блок определения оптимального результата совмещения, выполненный с возможностью получения оптимального результата совмещения между последовательностью символов и последовательностью стандартного результата распознавания согласно вычисленному кратчайшему варианту расстояния; и

блок определения коэффициента правильного распознавания, выполненный с возможностью определения коэффициента правильного распознавания последовательности символов относительно последовательности стандартного результата распознавания согласно оптимальному результату совмещения между последовательностью символов и последовательностью стандартного результата распознавания, при этом коэффициент правильного распознавания включает в себя коэффициент распознавания ошибок фонетических символов и коэффициент распознавания ошибок китайских иероглифов.

8. Устройство по п. 7, в котором блок генерации последовательности выполнен с возможностью:

для любого символа в строке символов, когда тип символа упомянутого любого символа является китайским иероглифом, определения упомянутого любого символа в качестве элемента распознавания; а когда упомянутый любой символ является фонетическим символом, если упомянутый любой символ не является первым символом в строке символов и упомянутый любой символ расположен между двух символов пробела, или упомянутый любой символ является первым символом в строке символов, а следующая позиция относительно упомянутого любого символа является символом пробела, определения упомянутого любого символа в качестве элемента распознавания, в противном случае определения местоположения двух ближайших символов пробела относительно упомянутого любого символа соответственно, и определения всех символов между обнаруженными двумя символами пробела в качестве элемента распознавания;

сортировки соответственно определенных элементов распознавания согласно положениям определенных элементов распознавания в строке символов; и

определения отсортированных элементов распознавания в качестве последовательности символов.

9. Устройство по п. 8, в котором блок вычисления выполнен с возможностью:

создания двумерной сетки, в которой первое измерение двумерной сетки представляет собой элементы распознавания в последовательности символов, а второе измерение двумерной сетки представляет собой элементы распознавания в последовательности стандартного результата распознавания;

подсчета количества случаев ошибки каждого типа, соответствующего каждому элементу двумерной сетки соответственно в направлении слева направо и сверху вниз в двумерной сетке, при этом количество случаев ошибки данного типа представляет собой сумму количества случаев ошибки данного типа в предыдущем элементе сетки, соответствующего данному типу ошибки, и количества случаев ошибки данного типа элемента распознавания, соответствующего элементу сетки, относительно стандартного элемента, причем предыдущий элемент сетки представляет собой элемент, граничащий с текущим элементом сетки, на который указывает указатель поиска с возвратом, соответствующий данному типу ошибки;

добавления подсчитанного количества случаев ошибки каждого типа, соответствующего каждому элементу двумерной сетки в двумерной сетке, к соответствующему элементу сетки;

выбора элемента сетки в последней строке и последнем столбце двумерной сетки и определения такого из соответствующих типов ошибок, соответствующих выбранному элементу сетки, который имеет наименьшее количество случаев; и

определения количества случаев определенного типа ошибки в качестве кратчайшего варианта расстояния между последовательностью символов и последовательностью стандартного результата распознавания.

10. Устройство по п. 9, в котором блок определения оптимального результата совмещения выполнен с возможностью:

выполнения для каждого элемента двумерной сетки операций:

определения такого из соответствующих типов ошибок, соответствующих выбранному элементу сетки, который имеет наименьшее количество случаев; определения количества случаев определенного типа ошибки в качестве наименьшего количества случаев ошибок, соответствующего элементу сетки; и получение указателя поиска с возвратом, соответствующего типу ошибки;

определения набора отношений совмещения между соответствующими элементами распознавания, соответствующими последовательности символов, и соответствующими стандартными элементами, соответствующими стандартному результату распознавания, согласно направлению, указанному указателем поиска с возвратом, полученному в каждом элементе сетки, начиная с элемента сетки, соответствующего кратчайшему варианту расстояния в двумерной сетке; и

определения определенного набора отношений совмещения между соответствующими элементами распознавания, соответствующими последовательности символов, и соответствующими стандартными элементами, соответствующими стандартному результату распознавания, в качестве оптимального результата совмещения между последовательностью символов и последовательностью стандартного результата распознавания.

11. Устройство по п. 10, в котором блок определения коэффициента правильного распознавания выполнен с возможностью:

получения типа ошибки, соответствующего каждому отношению совмещения в наборе отношений совмещения, и количества случаев упомянутого типа ошибки; и

определения коэффициента правильного распознавания последовательности символов относительно последовательности стандартного результата распознавания согласно количеству случаев упомянутого типа ошибки, соответствующему каждому отношению совмещения в наборе отношений совмещения.

12. Устройство по п. 11, в котором блок определения коэффициента правильного распознавания, выполненный с возможностью определения коэффициента правильного распознавания последовательности символов относительно последовательности стандартного результата распознавания согласно количеству случаев типа ошибки, соответствующему каждому отношению совмещения в наборе отношений совмещения, выполнен с возможностью:

выбора отношения соответствия китайских иероглифов в наборе отношений совмещения, при этом отношение соответствия китайских иероглифов включает в себя стандартные элементы китайских иероглифов; и вычисления доли количества отношений соответствия всех ошибок распознавания в выбранном отношении соответствия к общему количеству стандартных элементов китайских иероглифов в качестве коэффициента ошибок распознавания китайских иероглифов последовательности символов относительно последовательности стандартного результата распознавания; и

выбора отношения соответствия фонетических символов в наборе отношений совмещения, при этом отношение соответствия фонетических символов включает в себя стандартные элементы фонетических символов; и вычисления доли количества типов ошибок отношений соответствия всех ошибок распознавания в выбранном отношении соответствия к общему количеству стандартных элементов фонетических символов в качестве коэффициента ошибок фонетических символов последовательности символов относительно последовательности стандартного результата распознавания.