RU2016135372A - Способ и устройство определения коэффициента правильного распознавания - Google Patents

Способ и устройство определения коэффициента правильного распознавания Download PDF

Info

Publication number
RU2016135372A
RU2016135372A RU2016135372A RU2016135372A RU2016135372A RU 2016135372 A RU2016135372 A RU 2016135372A RU 2016135372 A RU2016135372 A RU 2016135372A RU 2016135372 A RU2016135372 A RU 2016135372A RU 2016135372 A RU2016135372 A RU 2016135372A
Authority
RU
Russia
Prior art keywords
sequence
recognition
characters
standard
character
Prior art date
Application number
RU2016135372A
Other languages
English (en)
Other versions
RU2016135372A3 (ru
Inventor
Юцзюнь ВАН
Original Assignee
Ли Холдингз (Бейджинг) Ко., Лтд.
Ли Ши Чжи Синь Электроник Текнолоджи (Тянь Цзинь) Лимитед
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ли Холдингз (Бейджинг) Ко., Лтд., Ли Ши Чжи Синь Электроник Текнолоджи (Тянь Цзинь) Лимитед filed Critical Ли Холдингз (Бейджинг) Ко., Лтд.
Publication of RU2016135372A publication Critical patent/RU2016135372A/ru
Publication of RU2016135372A3 publication Critical patent/RU2016135372A3/ru

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/01Assessment or evaluation of speech recognition systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/10Speech classification or search using distance or distortion measures between unknown speech and reference templates
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/005Language recognition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems

Claims (54)

1. Способ определения коэффициента правильного распознавания, содержащий этапы, на которых:
получают строку символов, получаемую при распознавании голоса, и стандартный результат распознавания, соответствующий строке символов, при этом стандартный результат распознавания содержит символы фонетического типа и символы типа китайских иероглифов;
делят строку символов согласно типу символов в строке символов для генерирования последовательности символов, при этом, если строка символов содержит фонетические символы, ряд фонетических символов, представляющих собой одно завершенное значение, отделяют в элемент распознавания;
вычисляют кратчайший вариант расстояния между последовательностью символов и последовательностью стандартного результата распознавания, сгенерированной посредством разделения стандартного результата распознавания;
получают оптимальный результат совмещения между последовательностью символов и последовательностью стандартного результата распознавания согласно вычисленному кратчайшему варианту расстояния; и
определяют коэффициент правильного распознавания последовательности символов относительно последовательности стандартного результата распознавания согласно оптимальному результату совмещения между последовательностью символов и последовательностью стандартного результата распознавания, при этом коэффициент правильного распознавания включает в себя коэффициент распознавания ошибок фонетических символов и коэффициент распознавания ошибок китайских иероглифов.
2. Способ по п. 1, в котором на этапе деления строки символов согласно типу символов в строке символов для генерирования последовательности символов:
для любого символа в строке символов, если тип упомянутого любого символа является китайским иероглифом, определяют упомянутый любой символ в качестве элемента распознавания; а когда упомянутый любой символ является фонетическим символом, если упомянутый любой символ не является первым символом в строке символов и упомянутый любой символ расположен между двух символов пробела, или упомянутый любой символ является первым символом в строке символов, а следующая позиция относительно упомянутого любого символа является символом пробела, определяют упомянутый любой символ в качестве элемента распознавания, в противном случае определяют местоположение двух ближайших символов пробела относительно упомянутого любого символа соответственно и определяют все символы между обнаруженными двумя символами пробела в качестве элемента распознавания;
сортируют соответственно определенные элементы распознавания согласно положениям определенных элементов распознавания в строке символов; и
определяют отсортированные элементы распознавания в качестве последовательности символов.
3. Способ по п. 2, в котором на этапе вычисления кратчайшего варианта расстояния между последовательностью символов и последовательностью стандартного результата распознавания:
создают двумерную сетку, в которой первое измерение двумерной сетки представляет собой элементы распознавания в последовательности символов, а второе измерение двумерной сетки представляет собой элементы распознавания в последовательности стандартного результата распознавания;
подсчитывают количество случаев ошибки каждого типа, соответствующее каждому элементу двумерной сетки соответственно в направлении слева направо и сверху вниз в двумерной сетке, при этом количество случаев ошибки данного типа представляет собой сумму количества случаев ошибки данного типа в предыдущем элементе сетки, соответствующем данному типу ошибки, и количества случаев ошибки данного типа элемента распознавания, соответствующего элементу сетки, относительно стандартного элемента, причем предыдущий элемент сетки представляет собой элемент сетки, граничащий с текущим элементом сетки, на который указывает указатель поиска с возвратом, соответствующий данному типу ошибки;
добавляют подсчитанное количество случаев ошибки каждого типа, соответствующее каждому элементу двумерной сетки в двумерной сетке, к соответствующему элементу сетки;
выбирают элемент сетки в последней строке и последнем столбце двумерной сетки и определяют такой из соответствующих типов ошибок, соответствующих выбранному элементу сетки, который имеет наименьшее количество случаев; и
определяют количество случаев определенного типа ошибки в качестве кратчайшего варианта расстояния между последовательностью символов и последовательностью стандартного результата распознавания.
4. Способ по п. 3, в котором на этапе получения оптимального результата совмещения между последовательностью символов и последовательностью стандартного результата распознавания:
выполняют для каждого элемента сетки в двумерной сетке операции, на которых:
определяют такой из соответствующих типов ошибок, соответствующих выбранному элементу сетки, который имеет наименьшее количество случаев; определяют количество случаев определенного типа ошибки в качестве наименьшего количества случаев ошибок, соответствующего элементу сетки; и получают указатель поиска с возвратом, соответствующий определенному типу ошибки;
определяют набор отношений совмещения между соответствующими элементами распознавания, соответствующими последовательности символов, и соответствующими стандартными элементами, соответствующими стандартному результату распознавания, согласно направлению, указанному указателем поиска с возвратом, полученному в каждом элементе сетки, начиная с элемента сетки, соответствующего кратчайшему варианту расстояния в двумерной сетке; и
определяют определенный набор отношений совмещения между соответствующими элементами распознавания, соответствующими последовательности символов, и соответствующими стандартными элементами, соответствующими стандартному результату распознавания, в качестве оптимального результата совмещения между последовательностью символов и последовательностью стандартного результата распознавания.
5. Способ по п. 4, в котором на этапе определения коэффициента правильного распознавания последовательности символов относительно последовательности стандартного результата распознавания согласно оптимальному результату совмещения между последовательностью символов и последовательностью стандартного результата распознавания:
получают тип ошибки, соответствующий каждому отношению совмещения в наборе отношений совмещения, и количество случаев упомянутого типа ошибки; и
определяют коэффициент правильного распознавания последовательности символов относительно последовательности стандартного результата распознавания согласно количеству случаев упомянутого типа ошибки, соответствующему каждому отношению совмещения в наборе отношений совмещения.
6. Способ по п. 5, в котором на этапе определения коэффициента правильного распознавания последовательности символов относительно последовательности стандартного результата распознавания согласно количеству случаев типа ошибки, соответствующему каждому отношению совмещения в наборе отношений совмещения:
выбирают отношение соответствия китайских иероглифов в наборе отношений совмещения, причем отношение соответствия китайских иероглифов включает в себя стандартные элементы китайских иероглифов; и вычисляют долю количества отношений соответствия всех ошибок распознавания в выбранном отношении соответствия к общему количеству стандартных элементов китайских иероглифов в качестве коэффициента ошибок распознавания китайских иероглифов последовательности символов относительно последовательности стандартного результата распознавания; и
выбирают отношения соответствия фонетических символов в наборе отношений совмещения, причем отношение соответствия фонетических символов включает в себя стандартные элементы фонетических символов; и вычисляют долю количества типов ошибок отношений соответствия всех ошибок распознавания в выбранном отношении соответствия к общему количеству стандартных элементов фонетических символов в качестве коэффициента ошибок фонетических символов последовательности символов относительно последовательности стандартного результата распознавания.
7. Устройство определения коэффициента правильного распознавания, содержащее:
блок получения, выполненный с возможностью получения строки символов, получаемой при распознавании голоса, и стандартного результата распознавания, соответствующего строке символов, при этом стандартный результат распознавания содержит символы фонетического типа и символы типа китайских иероглифов;
блок генерации последовательности, выполненный с возможностью деления строки символов согласно типу символов в строке символов для генерирования последовательности символов, при этом, если строка символов содержит фонетические символы, ряд фонетических символов, представляющих собой одно завершенное значение, отделяются в элемент распознавания;
блок вычисления, выполненный с возможностью вычисления кратчайшего варианта расстояния между последовательностью символов и последовательностью стандартного результата распознавания, сгенерированной посредством разделения стандартного результата распознавания;
блок определения оптимального результата совмещения, выполненный с возможностью получения оптимального результата совмещения между последовательностью символов и последовательностью стандартного результата распознавания согласно вычисленному кратчайшему варианту расстояния; и
блок определения коэффициента правильного распознавания, выполненный с возможностью определения коэффициента правильного распознавания последовательности символов относительно последовательности стандартного результата распознавания согласно оптимальному результату совмещения между последовательностью символов и последовательностью стандартного результата распознавания, при этом коэффициент правильного распознавания включает в себя коэффициент распознавания ошибок фонетических символов и коэффициент распознавания ошибок китайских иероглифов.
8. Устройство по п. 7, в котором блок генерации последовательности выполнен с возможностью:
для любого символа в строке символов, когда тип символа упомянутого любого символа является китайским иероглифом, определения упомянутого любого символа в качестве элемента распознавания; а когда упомянутый любой символ является фонетическим символом, если упомянутый любой символ не является первым символом в строке символов и упомянутый любой символ расположен между двух символов пробела, или упомянутый любой символ является первым символом в строке символов, а следующая позиция относительно упомянутого любого символа является символом пробела, определения упомянутого любого символа в качестве элемента распознавания, в противном случае определения местоположения двух ближайших символов пробела относительно упомянутого любого символа соответственно, и определения всех символов между обнаруженными двумя символами пробела в качестве элемента распознавания;
сортировки соответственно определенных элементов распознавания согласно положениям определенных элементов распознавания в строке символов; и
определения отсортированных элементов распознавания в качестве последовательности символов.
9. Устройство по п. 8, в котором блок вычисления выполнен с возможностью:
создания двумерной сетки, в которой первое измерение двумерной сетки представляет собой элементы распознавания в последовательности символов, а второе измерение двумерной сетки представляет собой элементы распознавания в последовательности стандартного результата распознавания;
подсчета количества случаев ошибки каждого типа, соответствующего каждому элементу двумерной сетки соответственно в направлении слева направо и сверху вниз в двумерной сетке, при этом количество случаев ошибки данного типа представляет собой сумму количества случаев ошибки данного типа в предыдущем элементе сетки, соответствующего данному типу ошибки, и количества случаев ошибки данного типа элемента распознавания, соответствующего элементу сетки, относительно стандартного элемента, причем предыдущий элемент сетки представляет собой элемент, граничащий с текущим элементом сетки, на который указывает указатель поиска с возвратом, соответствующий данному типу ошибки;
добавления подсчитанного количества случаев ошибки каждого типа, соответствующего каждому элементу двумерной сетки в двумерной сетке, к соответствующему элементу сетки;
выбора элемента сетки в последней строке и последнем столбце двумерной сетки и определения такого из соответствующих типов ошибок, соответствующих выбранному элементу сетки, который имеет наименьшее количество случаев; и
определения количества случаев определенного типа ошибки в качестве кратчайшего варианта расстояния между последовательностью символов и последовательностью стандартного результата распознавания.
10. Устройство по п. 9, в котором блок определения оптимального результата совмещения выполнен с возможностью:
выполнения для каждого элемента двумерной сетки операций:
определения такого из соответствующих типов ошибок, соответствующих выбранному элементу сетки, который имеет наименьшее количество случаев; определения количества случаев определенного типа ошибки в качестве наименьшего количества случаев ошибок, соответствующего элементу сетки; и получение указателя поиска с возвратом, соответствующего типу ошибки;
определения набора отношений совмещения между соответствующими элементами распознавания, соответствующими последовательности символов, и соответствующими стандартными элементами, соответствующими стандартному результату распознавания, согласно направлению, указанному указателем поиска с возвратом, полученному в каждом элементе сетки, начиная с элемента сетки, соответствующего кратчайшему варианту расстояния в двумерной сетке; и
определения определенного набора отношений совмещения между соответствующими элементами распознавания, соответствующими последовательности символов, и соответствующими стандартными элементами, соответствующими стандартному результату распознавания, в качестве оптимального результата совмещения между последовательностью символов и последовательностью стандартного результата распознавания.
11. Устройство по п. 10, в котором блок определения коэффициента правильного распознавания выполнен с возможностью:
получения типа ошибки, соответствующего каждому отношению совмещения в наборе отношений совмещения, и количества случаев упомянутого типа ошибки; и
определения коэффициента правильного распознавания последовательности символов относительно последовательности стандартного результата распознавания согласно количеству случаев упомянутого типа ошибки, соответствующему каждому отношению совмещения в наборе отношений совмещения.
12. Устройство по п. 11, в котором блок определения коэффициента правильного распознавания, выполненный с возможностью определения коэффициента правильного распознавания последовательности символов относительно последовательности стандартного результата распознавания согласно количеству случаев типа ошибки, соответствующему каждому отношению совмещения в наборе отношений совмещения, выполнен с возможностью:
выбора отношения соответствия китайских иероглифов в наборе отношений совмещения, при этом отношение соответствия китайских иероглифов включает в себя стандартные элементы китайских иероглифов; и вычисления доли количества отношений соответствия всех ошибок распознавания в выбранном отношении соответствия к общему количеству стандартных элементов китайских иероглифов в качестве коэффициента ошибок распознавания китайских иероглифов последовательности символов относительно последовательности стандартного результата распознавания; и
выбора отношения соответствия фонетических символов в наборе отношений совмещения, при этом отношение соответствия фонетических символов включает в себя стандартные элементы фонетических символов; и вычисления доли количества типов ошибок отношений соответствия всех ошибок распознавания в выбранном отношении соответствия к общему количеству стандартных элементов фонетических символов в качестве коэффициента ошибок фонетических символов последовательности символов относительно последовательности стандартного результата распознавания.
RU2016135372A 2015-11-05 2016-05-13 Способ и устройство определения коэффициента правильного распознавания RU2016135372A (ru)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN201510744496.8 2015-11-05
CN201510744496.8A CN105653517A (zh) 2015-11-05 2015-11-05 一种识别率确定方法及装置
PCT/CN2016/082140 WO2017075957A1 (zh) 2015-11-05 2016-05-13 一种识别率确定方法及装置

Publications (2)

Publication Number Publication Date
RU2016135372A true RU2016135372A (ru) 2018-03-07
RU2016135372A3 RU2016135372A3 (ru) 2018-03-07

Family

ID=56482184

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2016135372A RU2016135372A (ru) 2015-11-05 2016-05-13 Способ и устройство определения коэффициента правильного распознавания

Country Status (4)

Country Link
US (1) US20170133008A1 (ru)
CN (1) CN105653517A (ru)
RU (1) RU2016135372A (ru)
WO (1) WO2017075957A1 (ru)

Families Citing this family (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106297799A (zh) * 2016-08-09 2017-01-04 乐视控股(北京)有限公司 语音识别处理方法及装置
CN107331391A (zh) * 2017-06-06 2017-11-07 北京云知声信息技术有限公司 一种数字种类的确定方法及装置
CN108320740B (zh) * 2017-12-29 2021-01-19 深圳和而泰数据资源与云技术有限公司 一种语音识别方法、装置、电子设备及存储介质
CN109102797B (zh) * 2018-07-06 2024-01-26 平安科技(深圳)有限公司 语音识别测试方法、装置、计算机设备及存储介质
CN109710904B (zh) * 2018-11-13 2023-11-14 平安科技(深圳)有限公司 基于语义解析的文本准确率计算方法、装置、计算机设备
TWI698857B (zh) * 2018-11-21 2020-07-11 財團法人工業技術研究院 語音辨識系統及其方法、與電腦程式產品
CN110263322B (zh) * 2019-05-06 2023-09-05 平安科技(深圳)有限公司 用于语音识别的音频语料筛选方法、装置及计算机设备
CN110442853A (zh) * 2019-08-09 2019-11-12 深圳前海微众银行股份有限公司 文本定位方法、装置、终端及存储介质
CN110400580B (zh) * 2019-08-30 2022-06-17 北京百度网讯科技有限公司 音频处理方法、装置、设备和介质
CN111862955B (zh) * 2020-06-23 2024-04-23 北京嘀嘀无限科技发展有限公司 一种语音识别方法与终端、计算机可读存储介质
CN111737541B (zh) * 2020-06-30 2021-10-15 湖北亿咖通科技有限公司 一种支持多语言的语义识别评估方法
CN112151014B (zh) * 2020-11-04 2023-07-21 平安科技(深圳)有限公司 语音识别结果的测评方法、装置、设备及存储介质
CN112733524A (zh) * 2020-12-31 2021-04-30 浙江省方大标准信息有限公司 标准编号自动校正及标准状态批量核查方法、系统、装置
CN113257227B (zh) * 2021-04-25 2024-03-01 平安科技(深圳)有限公司 语音识别模型性能检测方法、装置、设备及存储介质
CN115171657A (zh) * 2022-05-26 2022-10-11 青岛海尔科技有限公司 语音设备的测试方法和装置、存储介质
CN114676685B (zh) * 2022-05-26 2022-08-26 深圳市声扬科技有限公司 语音文本错误处理方法、装置、电子设备及存储介质
CN117238276B (zh) * 2023-11-10 2024-01-30 深圳市托普思维商业服务有限公司 一种基于智能化语音数据识别的分析纠正系统

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4393648B2 (ja) * 2000-01-11 2010-01-06 富士通株式会社 音声認識装置
TW521266B (en) * 2000-07-13 2003-02-21 Verbaltek Inc Perceptual phonetic feature speech recognition system and method
US20080177542A1 (en) * 2005-03-11 2008-07-24 Gifu Service Corporation Voice Recognition Program
US7840399B2 (en) * 2005-04-07 2010-11-23 Nokia Corporation Method, device, and computer program product for multi-lingual speech recognition
KR100717385B1 (ko) * 2006-02-09 2007-05-11 삼성전자주식회사 인식 후보의 사전적 거리를 이용한 인식 신뢰도 측정 방법및 인식 신뢰도 측정 시스템
JP4393494B2 (ja) * 2006-09-22 2010-01-06 株式会社東芝 機械翻訳装置、機械翻訳方法および機械翻訳プログラム
KR100925479B1 (ko) * 2007-09-19 2009-11-06 한국전자통신연구원 음성 인식 방법 및 장치
CN101996631B (zh) * 2009-08-28 2014-12-03 国际商业机器公司 用于对齐文本的方法和装置
JP5697860B2 (ja) * 2009-09-09 2015-04-08 クラリオン株式会社 情報検索装置,情報検索方法及びナビゲーションシステム
US8515751B2 (en) * 2011-09-28 2013-08-20 Google Inc. Selective feedback for text recognition systems
CN102723080B (zh) * 2012-06-25 2014-06-11 惠州市德赛西威汽车电子有限公司 一种语音识别测试系统及方法
US20160005150A1 (en) * 2012-09-25 2016-01-07 Benjamin Firooz Ghassabian Systems to enhance data entry in mobile and fixed environment
JP6400936B2 (ja) * 2014-04-21 2018-10-03 シノイースト・コンセプト・リミテッド 音声検索方法、音声検索装置、並びに、音声検索装置用のプログラム
CN103996021A (zh) * 2014-05-08 2014-08-20 华东师范大学 一种多字符识别结果的融合方法
CN103942347B (zh) * 2014-05-19 2017-04-05 焦点科技股份有限公司 一种基于多维度综合词库的分词方法
CN104462058B (zh) * 2014-10-24 2018-10-02 腾讯科技(深圳)有限公司 字符串识别方法及装置
CN104318921B (zh) * 2014-11-06 2017-08-25 科大讯飞股份有限公司 音段切分检测方法及系统、口语评测方法及系统

Also Published As

Publication number Publication date
RU2016135372A3 (ru) 2018-03-07
CN105653517A (zh) 2016-06-08
US20170133008A1 (en) 2017-05-11
WO2017075957A1 (zh) 2017-05-11

Similar Documents

Publication Publication Date Title
RU2016135372A (ru) Способ и устройство определения коэффициента правильного распознавания
CN107633250B (zh) 一种文字识别纠错方法、纠错系统及计算机装置
EP2991004B1 (en) Method and apparatus for labeling training samples
Liu et al. NET–a system for extracting web data from flat and nested data records
CN102393850B (zh) 一种汉字字形认知相似度确定方法
US10192028B2 (en) Data analysis device and method therefor
KR20150070171A (ko) 스트링 변환의 귀납적 합성을 위한 랭킹 기법
RU2016152191A (ru) Понимание таблиц для поиска
US20080263021A1 (en) Methods of object search and recognition
RU2011103185A (ru) Способ определения местоположения из кодированных данных, представляющих его
JP5708495B2 (ja) 辞書作成装置、単語収集方法、及び、プログラム
CN106484132B (zh) 一种输入纠错方法和输入法装置
GB2580559A (en) Inclusion dependency determination in a large database for establishing primary key-foreign key relationships
JP2020035473A5 (ru)
JP2019503541A (ja) 電子データ構造から属性を抽出するための注釈システム
CN103996021A (zh) 一种多字符识别结果的融合方法
Reuveni Catalan's trapezoids
US20150356173A1 (en) Search device
KR20200102919A (ko) 오류를 정정하는 방법, 장치 및 컴퓨터 판독가능 매체
RU2014143789A (ru) Способ (варианты) и электронное устройство (варианты) определения расположения точки относительно первого многоугольника в многомерном пространстве
KR101113787B1 (ko) 텍스트 색인 장치 및 방법
US9792688B2 (en) Position detection device
RU2004115749A (ru) Неограниченная языком компьютеризованная кодирующая-декодирующая система и способ
CN115546810B (zh) 图像元素类别的识别方法及装置
KR101525303B1 (ko) 염기 서열 정렬 시스템 및 방법

Legal Events

Date Code Title Description
FA94 Acknowledgement of application withdrawn (non-payment of fees)

Effective date: 20190128