CN113674743A - 用于自然语言处理中asr结果替换处理设备及处理方法 - Google Patents

用于自然语言处理中asr结果替换处理设备及处理方法 Download PDF

Info

Publication number
CN113674743A
CN113674743A CN202110960275.XA CN202110960275A CN113674743A CN 113674743 A CN113674743 A CN 113674743A CN 202110960275 A CN202110960275 A CN 202110960275A CN 113674743 A CN113674743 A CN 113674743A
Authority
CN
China
Prior art keywords
module
text
standard
syllables
instruction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110960275.XA
Other languages
English (en)
Inventor
张泽宇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Unisound Shanghai Intelligent Technology Co Ltd
Original Assignee
Unisound Shanghai Intelligent Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Unisound Shanghai Intelligent Technology Co Ltd filed Critical Unisound Shanghai Intelligent Technology Co Ltd
Priority to CN202110960275.XA priority Critical patent/CN113674743A/zh
Publication of CN113674743A publication Critical patent/CN113674743A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3343Query execution using phonetics
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L12/00Data switching networks
    • H04L12/28Data switching networks characterised by path configuration, e.g. LAN [Local Area Networks] or WAN [Wide Area Networks]
    • H04L12/2803Home automation networks
    • H04L12/2816Controlling appliance services of a home automation network by calling their functionalities
    • H04L12/282Controlling appliance services of a home automation network by calling their functionalities based on user interaction within the home
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Acoustics & Sound (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Multimedia (AREA)
  • Mathematical Physics (AREA)
  • General Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Automation & Control Theory (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Machine Translation (AREA)

Abstract

本发明公开了一种用于自然语言处理中ASR结果替换处理设备及处理方法,通过构建多个邻域词库,在面对用户语音阐述不清或带有口音时的指令输入时,通过用户所处的生活场景匹配领域词库在将指令中涉及的待控制设备的文本替换成待控制设备的规范名称文本以对用户的真实意图进行智能化的分析。本发明解决了智能家居系统在接收用户语音指令时,不能根据上下文或者用户所处的生活场景对用户的真实意图进行智能化分析的问题。

Description

用于自然语言处理中ASR结果替换处理设备及处理方法
技术领域
本发明涉及智能家居设备技术领域,具体涉及一种用于自然语言处理中ASR结果替换处理设备及处理方法。
背景技术
在用户向智能家居系统通过语音下达指令时,面对用户语音阐述不清晰,甚至带有口音时的语音指令输入,智能家居系统的自然语言处理尚不能根据上下文或者用户所处的生活场景对用户的真实意图进行智能化的分析。比如,智能家居场景中,用户的原始意图是“打开微波炉”,但由于某些原因(智能家居系统的硬件拾音条件不佳或自然语音理解技术不成熟),导致用户的语音指令被识别为“打开微博”,进而影响客户满意度。
发明内容
为克服现有技术所存在的缺陷,现提供一种用于自然语言处理中ASR结果替换处理设备及处理方法,以解决智能家居系统在接收用户语音指令时,不能根据上下文或者用户所处的生活场景对用户的真实意图进行智能化分析的问题。
为实现上述目的,提供一种用于自然语言处理中ASR结果替换处理方法,包括以下步骤:
构建不同类型的多个领域词库,所述领域词库包括多个设备的规范名称以及与所述规范名称一一对应的标准音节;
采集用户语音指令;
对所述语音指令进行语音识别获得意图指令文本,所述意图指令文本包括待控制的设备的领域类型文本和待控制的所述设备的名称文本;
将待控制的所述设备的名称文本转换为随意音节;
基于所述领域类型文本,将所述意图指令文本匹配到与所述领域类型文本相对应的所述领域词库、并将所述随意音节与匹配到的所述领域词库中的所述标准音节相匹配;
在所述随意音节匹配到一所述标准音节后,将匹配到的所述标准音节对应的规范名称替换所述意图指令文本中的所述名称文本以获得纠偏指令文本并输出所述纠偏指令文本、在所述随意音节未能匹配到一所述标准音节后,直接输出所述意图指令文本。
进一步的,所述邻域词库为家用电器领域词库。
本发明提供一种用于自然语言处理中ASR结果替换处理方法的处理设备,包括:
客户端装置,包括用于采集用户语音指令的拾音模块、输出模块和第一控制模块,所述拾音模块和所述输出模块分别连接于所述第一控制模块;以及
服务器,包括第二控制模块、用于存储有构建的不同类型的多个领域词库的存储模块,所述领域词库包括多个待控制设备的规范名称和所述规范名称一一对应的标准音节、用于对所述语音指令进行语音识别以获得意图指令文本的语音识别模块,所述意图指令文本包括领域类型文本和所述待控制设备的名称文本、用于将所述待控制设备的名称文本转换为随意音节的转换模块、用于基于所述领域类型文本将所述意图指令文本匹配到与所述领域类型文本相对应的所述领域词库、并将所述随意音节与匹配到的所述领域词库中的所述标准音节相匹配的匹配模块和用于在所述随意音节匹配到的所述标准音节后,将匹配到的标准音节对应的规范名称替换所述意图指令文本中的所述名称文本以获得所述纠偏指令文本的替换模块,所述第二控制模块连接于所述第一控制模块,所述存储模块、所述语音识别模块、所述替换模块分别连接于所述第二控制模块,所述转换模块和所述替换模块分别连接于所述语音识别模块,所述匹配模块连接于所述存储模块。
进一步的,所述第一控制模块无线信号连接于所述第二控制模块。
进一步的,所述服务器为云端服务器。
进一步的,所述拾音模块为麦克风。
进一步的,所述输出模块为触摸屏。
本发明的有益效果在于,本发明的用于自然语言处理中ASR结果替换处理设备,通过构建多个邻域词库,在面对用户语音阐述不清或带有口音时的指令输入时,通过用户所处的生活场景匹配领域词库在将指令中涉及的待控制设备的文本替换成待控制设备的规范名称文本以对用户的真实意图进行智能化的分析。
附图说明
通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它特征、目的和优点将会变得更明显:
图1为本发明实施例的用于自然语言处理中ASR结果替换处理设备的模块示意图。
具体实施方式
下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释相关发明,而非对该发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与发明相关的部分。
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。
参照图1所示,本发明提供了一种用于自然语言处理中ASR(Automatic SpeechRecognition)结果替换处理设备,包括:客户端装置1和服务器2。ASR是一种将人的语音转换为文本的技术。
其中,客户端装置1包括拾音模块11、输出模块13和第一控制模块12。具体的,拾音模块11用于采集用户语音指令的、输出模块13用于输出指令文本。
拾音模块11和输出模块13分别连接于第一控制模块12。
在用户有需求时,通过拾音模块采集用户发出的语音指令。第一控制模块获取语音指令并对外发送。
服务器2包括存储模块21、语音识别模块22、转换模块23、匹配模块24、替换模块25和第二控制模块26。
其中,存储模块21用于存储预先构建的不同类型的多个领域词库。领域词库包括多个待控制设备的规范名称和规范名称一一对应的标准音节。
第二控制模块接收语音指令并发送至语音识别模块。
语音识别模块22用于对语音指令进行语音识别以获得意图指令文本。意图指令文本包括领域类型文本和待控制设备的名称文本。
转换模块23用于将待控制设备的名称文本转换为随意音节。
匹配模块24用于基于领域类型文本将意图指令文本匹配到与领域类型文本相对应的一个领域词库、并将随意音节与匹配到的领域词库中的标准音节相匹配。匹配模块24在将随意音节与匹配到的领域词库中的标准音节相匹配时,产生两种结果,一为匹配到邻域词库中的标准音节,另外一种为未匹配到邻域词库中的标准音节。
替换模块25用于在随意音节匹配到的所述标准音节后,将匹配到的标准音节对应的规范名称替换意图指令文本中的名称文本以获得纠偏指令文本。
第二控制模块26连接于第一控制模块12。存储模块21、语音识别模块22、替换模块25分别连接于第二控制模块26。转换模块23和替换模块25分别连接于语音识别模块22。匹配模块24连接于存储模块21。
在随意音节匹配到的所述标准音节后,第二控制获取纠偏指令文本并对外发送,第一控制模块接收纠偏指令文本并通过输出模块输出显示纠偏指令文本给用户查看。
在随意音节未匹配到的所述标准音节后,第二控制获取意图指令文本并对外发送,第一控制模块接收意图指令文本并通过输出模块输出显示意图指令文本给用户查看。
本发明的用于自然语言处理中ASR结果替换处理设备,通过构建多个邻域词库,在面对用户语音阐述不清或带有口音时的指令输入时,通过用户所处的生活场景匹配领域词库在将指令中涉及的待控制设备的文本替换成待控制设备的规范名称文本以对用户的真实意图进行智能化的分析。比如,智能家居场景中,用户原始意图是“打开微波炉”,但由于某些原因(硬件拾音条件不佳或NLU技术不成熟),语音指令很可能被识别为“家居控制邻域、打开微博”,通过替换“家居控制”领域词库的规范名称“微波炉”,将“打开微波炉”纠偏指令文本通过输出模块呈现给用户以准确达到用户真是操作意图。在用户确认后再进行后置动作。
作为一种较佳的实施方式,第一控制模块12无线信号连接于第二控制模块26。具体的,第一控制模块连接有无线通信模块。第二控制模块连接有无线通信模块。第一控制模块的无线通信模块无线信号连接于第二控制模块的无线通信模块。
第一控制模块、拾音模块、输出模块和无线通信模块集成安装于客户端装置中。
在本实施例中,拾音模块11为麦克风。输出模块13为触摸屏。
作为一种较佳的实施方式,服务器为云端服务器。
本发明提供一种用于自然语言处理中ASR结果替换处理方法,包括以下步骤:
S1:构建不同类型的多个领域词库,领域词库包括多个设备的规范名称以及与规范名称一一对应的标准音节。邻域词库为家用电器领域词库。
S2:采集用户语音指令。
S3:对语音指令进行语音识别获得意图指令文本,意图指令文本包括待控制设备的领域类型文本和待控制的设备的名称文本。
S4:将待控制的设备的名称文本转换为随意音节。
S5:基于领域类型文本,将意图指令文本匹配到与领域类型文本相对应的领域词库、并将随意音节与匹配到的领域词库中的标准音节相匹配。
S6:在随意音节匹配到一所述标准音节后,将匹配到的标准音节对应的规范名称替换意图指令文本中的名称文本以获得纠偏指令文本并输出纠偏指令文本、在随意音节未能匹配到一标准音节后,直接输出意图指令文本。
在本实施例中,本发明提供的用于自然语言处理中ASR结果替换处理方法与用于自然语言处理中ASR结果替换处理设备结合,并以一用户语音指令为例,说明本发明的用于自然语言处理中ASR结果替换处理设备的工作原理:
a、在智能家电控制环境下,用户发出“打开微博”的语音指令,而用户的本意为“打开微波炉”。
b、构建智能家电控制领域词库,并存储于服务器的存储模块。智能家电控制领域词库中包括待控制设备微波炉,并对应配置标准音节“weibolu”。
c、拾音模块采集用户的语音指令“打开微博”。
d、第一控制模块将语音指令发送至第二控制模块。
e、第二控制模块接收语音指令并发送至语音识别模块。
f、语音识别模块获取并识别语音指令获得“打开微博”的意图指令文本。
g、转换模块获取意图指令并将意图指令文本中的“微博”转换为随意音节“weibo”。
h、匹配模块获取随意音节并匹配至家电控制领域词库,在家电控制领域词库中继续匹配标准音节。匹配的结果有两个:
结果一,匹配到在家电控制领域词库中标准音节“weibolu”;
结果二,未匹配到在家电控制领域词库中标准音节。
i、在步骤h中产生结果一时,替换模块将匹配到的标准音节“weibolu”所对应的规范名称“微波炉”替换意图指令文本中的名称文本“微博”以获得纠偏指令文本“打开微波炉”并发送至第二控制模块,第二控制模块将纠偏指令文本通过无线通信模块无线传输至第一控制模块;
在步骤h中产生结果二时,第二控制模块获取步骤f中获得的意图指令文本并通过无线通信模块无线传输至第一控制模块。
在匹配标准音节时,用户可以自行设定模糊匹配或精确匹配。模糊匹配可以进一步细分多种匹配度(匹配度=匹配音节数/标准音节数×100%),如90%的匹配度。
j、在第一控制模块获得纠偏指令文本“打开微波炉”或获得意图指令文本“打开微博”后,将纠偏指令文本或意图指令文本通过输出模块显示给用户看,以供用户进行后置动作,如重新输入语音指令,或进入下一步以基于纠偏指令文本开启相应的待控制设备。
以上描述仅为本申请的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本申请中所涉及的发明范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离所述发明构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本申请中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。

Claims (7)

1.一种用于自然语言处理中ASR结果替换处理方法,其特征在于,包括:
构建不同类型的多个领域词库,所述领域词库包括多个设备的规范名称以及与所述规范名称一一对应的标准音节;
采集用户语音指令;
对所述语音指令进行语音识别获得意图指令文本,所述意图指令文本包括待控制的设备的领域类型文本和待控制的所述设备的名称文本;
将待控制的所述设备的名称文本转换为随意音节;
基于所述领域类型文本,将所述意图指令文本匹配到与所述领域类型文本相对应的所述领域词库、并将所述随意音节与匹配到的所述领域词库中的所述标准音节相匹配;
在所述随意音节匹配到一所述标准音节后,将匹配到的所述标准音节对应的规范名称替换所述意图指令文本中的所述名称文本以获得纠偏指令文本并输出所述纠偏指令文本、在所述随意音节未能匹配到一所述标准音节后,直接输出所述意图指令文本。
2.根据权利要求1所述的用于自然语言处理中ASR结果替换处理方法,其特征在于,所述邻域词库为家用电器领域词库。
3.一种如权利要求1~2中任意一项所述的用于自然语言处理中ASR结果替换处理方法的处理设备,其特征在于,包括:
客户端装置,包括用于采集用户语音指令的拾音模块、输出模块和第一控制模块,所述拾音模块和所述输出模块分别连接于所述第一控制模块;以及
服务器,包括第二控制模块、用于存储有构建的不同类型的多个领域词库的存储模块,所述领域词库包括多个待控制设备的规范名称和所述规范名称一一对应的标准音节、用于对所述语音指令进行语音识别以获得意图指令文本的语音识别模块,所述意图指令文本包括领域类型文本和所述待控制设备的名称文本、用于将所述待控制设备的名称文本转换为随意音节的转换模块、用于基于所述领域类型文本将所述意图指令文本匹配到与所述领域类型文本相对应的所述领域词库、并将所述随意音节与匹配到的所述领域词库中的所述标准音节相匹配的匹配模块和用于在所述随意音节匹配到的所述标准音节后,将匹配到的标准音节对应的规范名称替换所述意图指令文本中的所述名称文本以获得所述纠偏指令文本的替换模块,所述第二控制模块连接于所述第一控制模块,所述存储模块、所述语音识别模块、所述替换模块分别连接于所述第二控制模块,所述转换模块和所述替换模块分别连接于所述语音识别模块,所述匹配模块连接于所述存储模块。
4.根据权利要求3所述的用于自然语言处理中ASR结果替换处理设备,其特征在于,所述第一控制模块无线信号连接于所述第二控制模块。
5.根据权利要求3所述的用于自然语言处理中ASR结果替换处理设备,其特征在于,所述服务器为云端服务器。
6.根据权利要求3所述的用于自然语言处理中ASR结果替换处理设备,其特征在于,所述拾音模块为麦克风。
7.根据权利要求3所述的用于自然语言处理中ASR结果替换处理设备,其特征在于,所述输出模块为触摸屏。
CN202110960275.XA 2021-08-20 2021-08-20 用于自然语言处理中asr结果替换处理设备及处理方法 Pending CN113674743A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110960275.XA CN113674743A (zh) 2021-08-20 2021-08-20 用于自然语言处理中asr结果替换处理设备及处理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110960275.XA CN113674743A (zh) 2021-08-20 2021-08-20 用于自然语言处理中asr结果替换处理设备及处理方法

Publications (1)

Publication Number Publication Date
CN113674743A true CN113674743A (zh) 2021-11-19

Family

ID=78544455

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110960275.XA Pending CN113674743A (zh) 2021-08-20 2021-08-20 用于自然语言处理中asr结果替换处理设备及处理方法

Country Status (1)

Country Link
CN (1) CN113674743A (zh)

Citations (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150058018A1 (en) * 2013-08-23 2015-02-26 Nuance Communications, Inc. Multiple pass automatic speech recognition methods and apparatus
CN107562878A (zh) * 2017-08-31 2018-01-09 广东美的制冷设备有限公司 家电控制方法、电子设备和计算机可读存储介质
CN107861953A (zh) * 2017-10-19 2018-03-30 聊城大学 一种名称自动翻译系统及方法
CN108306797A (zh) * 2018-01-30 2018-07-20 百度在线网络技术(北京)有限公司 声控智能家居设备方法、系统、终端以及存储介质
CN108694948A (zh) * 2017-03-30 2018-10-23 Lg电子株式会社 语音服务器、语音识别服务器系统及其动作方法
CN109036406A (zh) * 2018-08-01 2018-12-18 深圳创维-Rgb电子有限公司 一种语音信息的处理方法、装置、设备和存储介质
CN109065054A (zh) * 2018-08-31 2018-12-21 出门问问信息科技有限公司 语音识别纠错方法、装置、电子设备及可读存储介质
CN109215638A (zh) * 2018-10-19 2019-01-15 珠海格力电器股份有限公司 一种语音学习方法、装置、语音设备及存储介质
CN109377988A (zh) * 2018-09-26 2019-02-22 网易(杭州)网络有限公司 用于智能音箱的交互方法、介质、装置和计算设备
WO2019153996A1 (zh) * 2018-02-09 2019-08-15 叶伟 一种语音识别文本纠错方法及装置
CN110210029A (zh) * 2019-05-30 2019-09-06 浙江远传信息技术股份有限公司 基于垂直领域的语音文本纠错方法、系统、设备及介质
US20200027445A1 (en) * 2018-07-20 2020-01-23 Cisco Technology, Inc. Automatic speech recognition correction
CN111161731A (zh) * 2019-12-30 2020-05-15 四川虹美智能科技有限公司 智能家电离线语音控制装置
CN111178081A (zh) * 2018-11-09 2020-05-19 中移(杭州)信息技术有限公司 语义识别的方法、服务器、电子设备及计算机存储介质
CN111308902A (zh) * 2020-03-24 2020-06-19 夏艳霞 一种基于语音识别的智能家居控制方法
CN111444705A (zh) * 2020-03-10 2020-07-24 中国平安人寿保险股份有限公司 纠错方法、装置、设备及可读存储介质
CN111753046A (zh) * 2020-03-16 2020-10-09 北京京东尚科信息技术有限公司 控制智能设备的方法及装置、电子设备、以及介质
CN112037792A (zh) * 2020-08-20 2020-12-04 北京字节跳动网络技术有限公司 一种语音识别方法、装置、电子设备及存储介质
JP2021099887A (ja) * 2020-09-25 2021-07-01 北京百度網訊科技有限公司 音声認識によるページ操作方法、装置、機器、媒体及びプログラム

Patent Citations (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150058018A1 (en) * 2013-08-23 2015-02-26 Nuance Communications, Inc. Multiple pass automatic speech recognition methods and apparatus
CN108694948A (zh) * 2017-03-30 2018-10-23 Lg电子株式会社 语音服务器、语音识别服务器系统及其动作方法
CN107562878A (zh) * 2017-08-31 2018-01-09 广东美的制冷设备有限公司 家电控制方法、电子设备和计算机可读存储介质
CN107861953A (zh) * 2017-10-19 2018-03-30 聊城大学 一种名称自动翻译系统及方法
CN108306797A (zh) * 2018-01-30 2018-07-20 百度在线网络技术(北京)有限公司 声控智能家居设备方法、系统、终端以及存储介质
WO2019153996A1 (zh) * 2018-02-09 2019-08-15 叶伟 一种语音识别文本纠错方法及装置
US20200027445A1 (en) * 2018-07-20 2020-01-23 Cisco Technology, Inc. Automatic speech recognition correction
CN109036406A (zh) * 2018-08-01 2018-12-18 深圳创维-Rgb电子有限公司 一种语音信息的处理方法、装置、设备和存储介质
CN109065054A (zh) * 2018-08-31 2018-12-21 出门问问信息科技有限公司 语音识别纠错方法、装置、电子设备及可读存储介质
CN109377988A (zh) * 2018-09-26 2019-02-22 网易(杭州)网络有限公司 用于智能音箱的交互方法、介质、装置和计算设备
CN109215638A (zh) * 2018-10-19 2019-01-15 珠海格力电器股份有限公司 一种语音学习方法、装置、语音设备及存储介质
CN111178081A (zh) * 2018-11-09 2020-05-19 中移(杭州)信息技术有限公司 语义识别的方法、服务器、电子设备及计算机存储介质
CN110210029A (zh) * 2019-05-30 2019-09-06 浙江远传信息技术股份有限公司 基于垂直领域的语音文本纠错方法、系统、设备及介质
CN111161731A (zh) * 2019-12-30 2020-05-15 四川虹美智能科技有限公司 智能家电离线语音控制装置
CN111444705A (zh) * 2020-03-10 2020-07-24 中国平安人寿保险股份有限公司 纠错方法、装置、设备及可读存储介质
CN111753046A (zh) * 2020-03-16 2020-10-09 北京京东尚科信息技术有限公司 控制智能设备的方法及装置、电子设备、以及介质
CN111308902A (zh) * 2020-03-24 2020-06-19 夏艳霞 一种基于语音识别的智能家居控制方法
CN112037792A (zh) * 2020-08-20 2020-12-04 北京字节跳动网络技术有限公司 一种语音识别方法、装置、电子设备及存储介质
JP2021099887A (ja) * 2020-09-25 2021-07-01 北京百度網訊科技有限公司 音声認識によるページ操作方法、装置、機器、媒体及びプログラム

Similar Documents

Publication Publication Date Title
CN109817213B (zh) 用于自适应语种进行语音识别的方法、装置及设备
JP6538779B2 (ja) 音声対話システム、音声対話方法、および音声対話システムを適合させる方法
US9430467B2 (en) Mobile speech-to-speech interpretation system
CN108399923B (zh) 多人发言中发言人识别方法以及装置
RU2653283C2 (ru) Способ диалога между машиной, такой как гуманоидный робот, и собеседником-человеком, компьютерный программный продукт и гуманоидный робот для осуществления такого способа
CN109313892A (zh) 稳健的语言识别方法和系统
JP2017058674A (ja) 音声認識のための装置及び方法、変換パラメータ学習のための装置及び方法、コンピュータプログラム並びに電子機器
US20220076674A1 (en) Cross-device voiceprint recognition
KR20140120560A (ko) 통역 장치 제어 방법, 통역 서버의 제어 방법, 통역 시스템의 제어 방법 및 사용자 단말
KR20110066357A (ko) 대화 시스템 및 그의 대화 방법
CN107104994B (zh) 语音识别方法、电子装置及语音识别系统
CN113314119B (zh) 语音识别智能家居控制方法及装置
CN114121006A (zh) 虚拟角色的形象输出方法、装置、设备以及存储介质
CN111554284A (zh) 一种倒闸操作监控方法、装置、设备及存储介质
CN109670073B (zh) 一种信息转换方法及装置、交互辅助系统
US20210034662A1 (en) Systems and methods for managing voice queries using pronunciation information
CN111798846A (zh) 语音命令词识别方法、装置、会议终端及会议终端系统
JP2023153283A (ja) 作業支援システムおよび作業支援方法ならびに作業支援装置
US20180033432A1 (en) Voice interactive device and voice interaction method
CN115148185A (zh) 语音合成方法及装置、电子设备及存储介质
CN113160821A (zh) 一种基于语音识别的控制方法及装置
CN115104151A (zh) 一种离线语音识别方法和装置、电子设备和可读存储介质
CN113674743A (zh) 用于自然语言处理中asr结果替换处理设备及处理方法
CN114360558B (zh) 语音转换方法、语音转换模型的生成方法及其装置
Xiao Training room management based on speech recognition and artificial intelligence

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination