WO2020156342A1 - Procédé et dispositif de reconnaissance vocale, dispositif électronique et support de stockage - Google Patents

Procédé et dispositif de reconnaissance vocale, dispositif électronique et support de stockage Download PDF

Info

Publication number
WO2020156342A1
WO2020156342A1 PCT/CN2020/073328 CN2020073328W WO2020156342A1 WO 2020156342 A1 WO2020156342 A1 WO 2020156342A1 CN 2020073328 W CN2020073328 W CN 2020073328W WO 2020156342 A1 WO2020156342 A1 WO 2020156342A1
Authority
WO
WIPO (PCT)
Prior art keywords
user
decoding network
path
corpus
node
Prior art date
Application number
PCT/CN2020/073328
Other languages
English (en)
Chinese (zh)
Inventor
王杰
钟贵平
李宝祥
吴本谷
陈江
Original Assignee
北京猎户星空科技有限公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 北京猎户星空科技有限公司 filed Critical 北京猎户星空科技有限公司
Publication of WO2020156342A1 publication Critical patent/WO2020156342A1/fr

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/06Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
    • G10L15/065Adaptation
    • G10L15/07Adaptation to the speaker
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems
    • G10L15/30Distributed recognition, e.g. in client-server systems, for mobile phones or network applications

Abstract

La présente invention porte sur un procédé et sur un appareil de reconnaissance vocale, sur un dispositif électronique ainsi que sur un support de stockage. Le procédé consiste : à acquérir une voix d'entrée et un identifiant (ID) d'utilisateur correspondant à la voix d'entrée (S201) ; à rechercher, selon l'identifiant d'utilisateur, le chemin optimal correspondant à la voix d'entrée dans un réseau de décodage, chaque chemin entre des nœuds de mots dans le réseau de décodage étant marqué avec l'identifiant d'utilisateur (S202) ; et à déterminer des informations de texte correspondant à la voix d'entrée selon le trajet optimal (S203). Le procédé de reconnaissance vocale est basé sur un ensemble de réseaux de décodage, peut fournir des services de reconnaissance vocale personnalisés pour des utilisateurs et peut économiser considérablement des ressources matérielles.
PCT/CN2020/073328 2019-01-30 2020-01-20 Procédé et dispositif de reconnaissance vocale, dispositif électronique et support de stockage WO2020156342A1 (fr)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN201910094102.7A CN111508497B (zh) 2019-01-30 2019-01-30 语音识别方法、装置、电子设备及存储介质
CN201910094102.7 2019-01-30

Publications (1)

Publication Number Publication Date
WO2020156342A1 true WO2020156342A1 (fr) 2020-08-06

Family

ID=71840088

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/CN2020/073328 WO2020156342A1 (fr) 2019-01-30 2020-01-20 Procédé et dispositif de reconnaissance vocale, dispositif électronique et support de stockage

Country Status (3)

Country Link
CN (1) CN111508497B (fr)
TW (1) TWI752406B (fr)
WO (1) WO2020156342A1 (fr)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112102815B (zh) * 2020-11-13 2021-07-13 深圳追一科技有限公司 语音识别方法、装置、计算机设备和存储介质
CN113113024A (zh) * 2021-04-29 2021-07-13 科大讯飞股份有限公司 语音识别方法、装置、电子设备和存储介质
CN113327597B (zh) * 2021-06-23 2023-08-22 网易(杭州)网络有限公司 语音识别方法、介质、装置和计算设备

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102541505A (zh) * 2011-01-04 2012-07-04 中国移动通信集团公司 语音输入方法及其系统
CN103092928A (zh) * 2012-12-31 2013-05-08 安徽科大讯飞信息科技股份有限公司 语音查询方法及系统
CN103903619A (zh) * 2012-12-28 2014-07-02 安徽科大讯飞信息科技股份有限公司 一种提高语音识别准确率的方法及系统
CN105895104A (zh) * 2014-05-04 2016-08-24 讯飞智元信息科技有限公司 说话人自适应识别方法及系统
CN106469554A (zh) * 2015-08-21 2017-03-01 科大讯飞股份有限公司 一种自适应的识别方法及系统
CN106683677A (zh) * 2015-11-06 2017-05-17 阿里巴巴集团控股有限公司 语音识别方法及装置
US20180336887A1 (en) * 2017-05-22 2018-11-22 Samsung Electronics Co., Ltd. User adaptive speech recognition method and apparatus

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20010037287A1 (en) * 2000-03-14 2001-11-01 Broadbent David F. Method and apparatus for an advanced speech recognition portal for a mortgage loan management system
US10121471B2 (en) * 2015-06-29 2018-11-06 Amazon Technologies, Inc. Language model speech endpointing

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102541505A (zh) * 2011-01-04 2012-07-04 中国移动通信集团公司 语音输入方法及其系统
CN103903619A (zh) * 2012-12-28 2014-07-02 安徽科大讯飞信息科技股份有限公司 一种提高语音识别准确率的方法及系统
CN103092928A (zh) * 2012-12-31 2013-05-08 安徽科大讯飞信息科技股份有限公司 语音查询方法及系统
CN105895104A (zh) * 2014-05-04 2016-08-24 讯飞智元信息科技有限公司 说话人自适应识别方法及系统
CN106469554A (zh) * 2015-08-21 2017-03-01 科大讯飞股份有限公司 一种自适应的识别方法及系统
CN106683677A (zh) * 2015-11-06 2017-05-17 阿里巴巴集团控股有限公司 语音识别方法及装置
US20180336887A1 (en) * 2017-05-22 2018-11-22 Samsung Electronics Co., Ltd. User adaptive speech recognition method and apparatus

Also Published As

Publication number Publication date
TWI752406B (zh) 2022-01-11
CN111508497A (zh) 2020-08-07
CN111508497B (zh) 2023-09-26
TW202032534A (zh) 2020-09-01

Similar Documents

Publication Publication Date Title
US11398236B2 (en) Intent-specific automatic speech recognition result generation
CN108091328B (zh) 基于人工智能的语音识别纠错方法、装置及可读介质
US10176804B2 (en) Analyzing textual data
KR102390940B1 (ko) 음성 인식을 위한 컨텍스트 바이어싱
CN108899013B (zh) 语音搜索方法、装置和语音识别系统
CN109754809B (zh) 语音识别方法、装置、电子设备及存储介质
JP2022531479A (ja) 音声認識のためのコンテキストバイアス
WO2020156342A1 (fr) Procédé et dispositif de reconnaissance vocale, dispositif électronique et support de stockage
US11016968B1 (en) Mutation architecture for contextual data aggregator
US9922650B1 (en) Intent-specific automatic speech recognition result generation
US11562743B2 (en) Analysis of an automatically generated transcription
CN110070859B (zh) 一种语音识别方法及装置
US10152298B1 (en) Confidence estimation based on frequency
CN111462748B (zh) 语音识别处理方法、装置、电子设备及存储介质
CN111061840A (zh) 数据识别方法、装置及计算机可读存储介质
CN107112009B (zh) 用于生成混淆网络的方法、系统和计算机可读存储设备
KR20180062003A (ko) 음성 인식 오류 교정 방법
KR20190000776A (ko) 정보 입력 방법
CN112489626A (zh) 一种信息识别方法、装置及存储介质
CN112632987B (zh) 词槽的识别方法、装置及电子设备
CN114154487A (zh) 文本自动纠错方法、装置、电子设备及存储介质
WO2020233381A1 (fr) Procédé et appareil de requête de service sur la base d'une reconnaissance vocale, et dispositif informatique
WO2012004955A1 (fr) Procédé de correction de texte et procédé de reconnaissance
CN114495905A (zh) 语音识别方法、装置及存储介质
US11756538B1 (en) Lower latency speech processing

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 20748038

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 20748038

Country of ref document: EP

Kind code of ref document: A1