CN110232129B - 场景纠错方法、装置、设备和存储介质 - Google Patents
场景纠错方法、装置、设备和存储介质 Download PDFInfo
- Publication number
- CN110232129B CN110232129B CN201910502574.1A CN201910502574A CN110232129B CN 110232129 B CN110232129 B CN 110232129B CN 201910502574 A CN201910502574 A CN 201910502574A CN 110232129 B CN110232129 B CN 110232129B
- Authority
- CN
- China
- Prior art keywords
- scene
- error correction
- keyword
- knowledge
- correction model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000012937 correction Methods 0.000 title claims abstract description 243
- 238000000034 method Methods 0.000 title claims abstract description 57
- 238000012549 training Methods 0.000 claims abstract description 36
- 238000005065 mining Methods 0.000 claims abstract description 28
- 238000012795 verification Methods 0.000 claims description 7
- 238000004590 computer program Methods 0.000 claims description 5
- 230000004927 fusion Effects 0.000 claims description 4
- 230000000694 effects Effects 0.000 abstract description 8
- 238000004891 communication Methods 0.000 description 9
- 230000006870 function Effects 0.000 description 8
- 238000010586 diagram Methods 0.000 description 7
- 238000013508 migration Methods 0.000 description 6
- 230000005012 migration Effects 0.000 description 6
- 238000005516 engineering process Methods 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 230000009286 beneficial effect Effects 0.000 description 2
- 238000013145 classification model Methods 0.000 description 2
- 230000002844 continuous effect Effects 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 230000000670 limiting effect Effects 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 238000012163 sequencing technique Methods 0.000 description 2
- 238000013526 transfer learning Methods 0.000 description 2
- 238000009825 accumulation Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004140 cleaning Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 230000036961 partial effect Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 238000012805 post-processing Methods 0.000 description 1
- 230000002829 reductive effect Effects 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/374—Thesaurus
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/226—Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Machine Translation (AREA)
Abstract
本发明实施例提出一种场景纠错方法、装置、设备和存储介质。该方法包括:利用目标场景的场景知识对训练样本进行语义理解,得到语义特征;挖掘所述场景知识的关联知识;利用所述语义特征、所述场景知识和所述关联知识训练得到场景纠错模型,所述场景纠错模型用于对输入文本进行场景纠错。本发明实施例充分利用场景知识对训练样本进行语义理解,能够得到更精细的语义特征,提升纠错模型效果;并且,充分利用场景知识,挖掘关联知识,辅助纠错模型进行决策。
Description
技术领域
本发明涉及纠错技术领域,尤其涉及一种场景纠错方法、装置、设备和存储介质。
背景技术
随着智能语音产品大量涌现,语音交互也逐步取代键盘输入成为智能语音产品的主要交互方式。例如智能音箱,智能车载系统,智能客服等。语音识别技术在深度学习技术的加持下取得了突破性的进展。但是在实际的场景语音识别中,由于缺少语义理解以及场景知识,导致识别的错误率仍然相对比较高,严重影响了产品的使用体验。例如在地图语音场景中,用户本来想查找『毓璜顶医院』,但是由于语音识别的问题,语音识别的结果为『玉皇顶医院』,导致用户没法得到自己想要的结果。再如,用户想知道『瑜伽室几点关门』,而语音识别结果却为『瑜伽是几点关门』,严重影响了整个产品的用户体验。
导致这些错误主要原因包括:第一,目前的语音识别中主要对语音信号到文本结果进行建模,其中主要考虑语言本身的结构,而缺少对语义的理解。第二,目前的语音识别主要针对开放域,而缺少对场景知识的利用。
目前一些智能场景纠错也都是在开放域纠错的基础之上,利用场景知识进行后处理。纠错模型缺少迁移能力,难以在不同的纠错场景中快速地进行定制。
发明内容
本发明实施例提供一种场景纠错方法、装置、设备和存储介质,以解决现有技术中的一个或多个技术问题。
第一方面,本发明实施例提供了一种场景纠错方法方法,包括:
利用目标场景的场景知识对训练样本进行语义理解,得到语义特征;
挖掘所述场景知识的关联知识;
利用所述语义特征、所述场景知识和所述关联知识训练得到场景纠错模型,所述场景纠错模型用于对输入文本进行场景纠错。
在一种实施方式中,该方法还包括:
利用与所述目标场景相关的关键词和预先设置的通用关键词,得到关键词词典;
利用所述关键词词典的各关键词挖掘得到场景语料;
利用所述场景语料训练得到关键词纠错模型。
在一种实施方式中,该方法还包括:
利用关键词词典和关键词纠错模型对所述输入文本进行纠错。
在一种实施方式中,利用关键词词典和关键词纠错模型对所述输入文本进行纠错,包括:
利用所述关键词词典,对目标场景的输入文本中的关键词进行纠错;
利用所述关键词纠错模型对纠错后的文本进行结果验证。
在一种实施方式中,该方法还包括:
利用所述场景纠错模型对所述输入文本或所述关键词纠错模型的输出结果进行纠错。
在一种实施方式中,该方法还包括:
利用开放域纠错模型,对所述输入文本进行纠错;
将所述开放域纠错模型和所述场景纠错模型的纠错结果进行融合。
在一种实施方式中,该方法还包括:
从用户日志中挖掘得到新增的场景知识,所述场景知识包括场景语料和对齐语料;
利用新增的所述场景知识对所述场景纠错模型进行训练,以更新所述场景纠错模型。
第二方面,本发明实施例提供了一种场景纠错装置,包括:
语义理解模块,用于利用目标场景的场景知识对训练样本进行语义理解,得到语义特征;
第一挖掘模块,用于挖掘所述场景知识的关联知识;
第一训练模块,用于利用所述语义特征、所述场景知识和所述关联知识训练得到场景纠错模型,所述场景纠错模型用于对输入文本进行场景纠错。
在一种实施方式中,该装置还包括:
词典模块,用于利用与所述目标场景相关的关键词和预先设置的通用关键词,得到关键词词典;
第二挖掘模块,用于利用所述关键词词典的各关键词挖掘得到场景语料;
第二训练模块,用于利用所述场景语料训练得到关键词纠错模型。
在一种实施方式中,该装置还包括:
关键词纠错模块,用于利用关键词词典和关键词纠错模型对所述输入文本进行纠错。
在一种实施方式中,所述关键词纠错模块还用于利用所述关键词词典,对目标场景的输入文本中的关键词进行纠错;利用所述关键词纠错模型对纠错后的文本进行结果验证。
在一种实施方式中,该装置还包括:
场景纠错模块,用于利用所述场景纠错模型对所述输入文本或所述关键词纠错模型的输出结果进行纠错。
在一种实施方式中,该装置还包括:
开放域纠错模块,用于利用开放域纠错模型,对所述输入文本进行纠错;
融合模块,用于将所述开放域纠错模型和所述场景纠错模型的纠错结果进行融合。
在一种实施方式中,该装置还包括:
第三挖掘模块,用于从用户日志中挖掘得到新增的场景知识,所述场景知识包括场景语料和对齐语料;
第三训练模块,用于利用新增的所述场景知识对所述场景纠错模型进行训练,以更新所述场景纠错模型。
第三方面,本发明实施例提供了一种场景纠错设备,所述设备的功能可以通过硬件实现,也可以通过硬件执行相应的软件实现。所述硬件或软件包括一个或多个与上述功能相对应的模块。
在一个可能的设计中,所述设备的结构中包括处理器和存储器,所述存储器用于存储支持所述设备执行上述场景纠错方法的程序,所述处理器被配置为用于执行所述存储器中存储的程序。所述设备还可以包括通信接口,用于与其他设备或通信网络通信。
第四方面,本发明实施例提供了一种计算机可读存储介质,用于存储场景纠错设备所用的计算机软件指令,其包括用于执行上述场景纠错方法所涉及的程序。
上述技术方案中的一个技术方案具有如下优点或有益效果:充分利用场景知识对训练样本进行语义理解,能够得到更精细的语义特征,提升纠错模型效果;并且,充分利用场景知识,挖掘关联知识,辅助纠错模型进行决策。
上述技术方案中的另一个技术方案具有如下优点或有益效果:可以利用开放域或其他场景学习到的通用知识,可以灵活迁移到其他场景,具有强大的迁移能力。在冷启动时采用关键词纠错,在运行之后采用场景纠错模型纠错。可以充分利用用户日志持续更新场景纠错模型,形成完整的学习闭环,实现自主学习。
上述概述仅仅是为了说明书的目的,并不意图以任何方式进行限制。除上述描述的示意性的方面、实施方式和特征之外,通过参考附图和以下的详细描述,本发明进一步的方面、实施方式和特征将会是容易明白的。
附图说明
在附图中,除非另外规定,否则贯穿多个附图相同的附图标记表示相同或相似的部件或元素。这些附图不一定是按照比例绘制的。应该理解,这些附图仅描绘了根据本发明公开的一些实施方式,而不应将其视为是对本发明范围的限制。
图1示出根据本发明实施例的场景纠错方法的流程图。
图2示出根据本发明实施例的场景纠错方法的流程图。
图3示出根据本发明实施例的场景纠错方法的流程图。
图4示出根据本发明实施例的场景纠错方法的流程图。
图5示出根据本发明实施例的场景纠错系统的示例图。
图6示出根据本发明实施例的场景纠错模型的示例图。
图7示出根据本发明实施例的场景纠错装置的结构框图。
图8示出根据本发明实施例的场景纠错装置的结构框图。
图9示出根据本发明实施例的场景纠错设备的结构框图。
具体实施方式
在下文中,仅简单地描述了某些示例性实施例。正如本领域技术人员可认识到的那样,在不脱离本发明的精神或范围的情况下,可通过各种不同方式修改所描述的实施例。因此,附图和描述被认为本质上是示例性的而非限制性的。
图1示出根据本发明实施例的场景纠错方法的流程图。如图1所示,该方法可以包括:
步骤S11、利用目标场景的场景知识对训练样本进行语义理解,得到语义特征。
步骤S12、挖掘所述场景知识的关联知识。
步骤S13、利用所述语义特征、所述场景知识和所述关联知识训练得到场景纠错模型,所述场景纠错模型用于对输入文本进行场景纠错。
训练样本可以包括符合某个场景的文本内容,简称场景文本。输入文本可以包括符合某个场景的文本内容,也可以通用的文本内容。
场景知识可以包括关键词词典、场景语料和对齐语料等。
用户在建立场景时可以提供一些与该场景有关的关键词,利用用户提供的关键词以及预设通用的关键词可以生成关键词词典。例如,与地图场景有关的关键词可以包括:地图、导航、定位、某广场、某小区、某道路等。再如,与旅游场景有关的关键词可以包括:景点、饭店、旅游攻略、旅游路线、特产等。
场景语料可以包括符合某个场景的常用的正确话术,也可以称为场景标准语料。例如,地图场景的语料可能包括:某某公司在某某位置,导航到某某位置,查找某某位置附近的景区等。再如,家用电器场景的语料可能包括:打开电视机的某某节目,音箱播放某明星的音乐,定时在某时刻开启电饭锅等。再如,购物场景的语料可能包括:搜索某商品,购买某品牌某商品,将某商品退货,某商品的生产销售过程等。
对齐语料可以包括从一个错误的句子纠正到一个正确的句子相关的语料。例如:将“百度国籍大厦”纠正为“百度国际大厦”,“百度国籍大厦”与“百度国际大厦”为对齐语料。
与场景知识关联的知识,可以称为关联知识。在一种实施方式中,某个语料A1中具有与场景语料A的关键词相同的内容,则可以将该语料A1作为场景语料A的关联知识。
例如,场景语料A“购买S公司的商品S1”的关键词包括“S公司”和“商品S1”。“S公司近期发布了新产品”,“商品S1的售价出现大幅降低”等可能属于场景语料A的关联知识。“购买T公司的商品T1”则可能不属于场景语料A的关联知识。
在本申请实施例中,在不同的阶段,场景语料的数据量可能不同。在冷启动阶段,用户建立场景后,利用关键词生成关键词词典。利用关键词词典从大量数据例如无监督数据中挖掘出少量的场景语料。在冷启动之后,经过一定时间的积累,获得的场景语料会越来越多。
在一种实施方式中,如图2所示,该方法还包括关键词纠错模型的构建过程:
步骤S21、利用与所述目标场景相关的关键词和预先设置的通用关键词,得到关键词词典。
步骤S22、利用所述关键词词典的各关键词挖掘得到场景语料。
步骤S23、利用所述场景语料训练得到关键词纠错模型。
在一种实施方式中,根据场景语料的数据量不同,可以将启动阶段分为冷启动阶段和正常启动阶段。不同的启动阶段可以选择不同的纠错方式:
方式一:如果场景语料的数据量小于设定值,则处于冷启动阶段,采用关键词词典和关键词纠错模型对输入文本进行纠错。其中,输入文本可以包括多种类型,例如在某个场景下的语音识别的结果等。
方式二:如果场景语料的数据量大于或等于设定值,则处于正常启动阶段,采用场景纠错模型对输入文本进行纠错。
其中,设定值可以为数据的条数,例如1000条数据。设定值也可以为数据大小,例如10M。
在冷启动阶段,场景语料的数据量少,可以采用关键词词典和关键词纠错模型对输入文本进行纠错。具体纠错过程可以包括:利用关键词词典,对目标场景的输入文本中的关键词进行纠错;利用关键词纠错模型对纠错后的文本进行结果验证。其中,关键词纠错模型可以是利用场景语料训练的语言理解模型。关键词纠错模型可以对利用关键词词典得到的多个召回词进行打分,从而确定合适的召回词。
例如,利用关键词词典和先验语言知识,可以进行关键词纠错。先验语言知识可以包括语法、句法等自然语言的先验知识。如果输入文本中具有与关键词词典中相似的词汇,可以用该关键词词典中的词汇替换该输入文本中的词汇。利用关键词词典纠错后,还可以利用场景语料训练得到的关键词纠错模型进行结果验证,判断纠错后的文本是否准确。例如:利用关键词纠错将“百度国籍大厦”中的关键词“国籍”改成“国际”,得到“百度国际大厦”。然后,利用关键词纠错模型,验证“百度国际大厦”的准确性。
在正常启动该阶段,数据量多,可以采用上述已经训练的场景纠错模型对输入文本例如用户语料进行纠错。此外,在正常启动阶段还可以融合两种纠错方式:利用关键词词典和关键词纠错模型对所述输入文本进行纠错;将所述关键词纠错模型的输出结果输入所述场景纠错模型中进行纠错。这样得到的纠错结果,可以融合关键词纠错和场景纠错的结果。
在一种实施方式中,建立场景纠错模型之后,该方法还包括:步骤S31、利用场景纠错模型对输入文本或关键词纠错模型的输出结果进行纠错。
在一种实施方式中,场景纠错与开放域纠错的结果也可以融合。如图3所述,该方法还可以包括:
步骤S32、利用开放域纠错模型,对输入文本进行纠错;
步骤S33、将所述开放域纠错模型和所述场景纠错模型的纠错结果进行融合。
场景纠错可以看做对某个特定领域的文本进行纠错。特定领域包括多种,例如:地图、餐饮、购物等。与场景纠错方式对应的纠错方式为开放域纠错方式。开放域纠错方式无需区分场景,采用统一的模型对各种场景的文本进行纠错。
开放域纠错方式和场景纠错方式的纠错结果可以融合。例如,利用开放域纠错模型对输入文本进行纠错得到的第一纠错结果。利用场景纠错方式对输入文本(或关键词纠错结果)进行纠错得到的第二纠错结果。利用排序模型对第一纠错结果和第二纠错结果分别进行排序。并且还可以利用该分类模型对输入文本进行场景分类。在融合时,参考场景分类结果和排序结果,对第一纠错结果和第二纠错结果进行融合。
一个具体的示例为:输入文本为“你时要去鲁丘石湖村吗”。利用开放域纠错方式纠错后的第一纠错结果为“你是要去鲁丘石湖村吗”。利用场景纠错方式纠错后的第二纠错结果为“你时要去鲁丘石户村吗”。参考场景分类“地图”,得到融合后的结果为“你是要去鲁丘石户村吗”。
在一种实施方式中,可以利用用户反馈的数据更新场景纠错模型。如图4所示,该方法还可以包括:
步骤S41、从用户日志中挖掘得到新增的场景知识,所述场景知识包括场景语料和对齐语料。
步骤S42、利用新增的所述场景知识对所述场景纠错模型进行训练,以更新所述场景纠错模型。
例如,从用户反馈的日志(Log)文件中挖掘出新增的场景语料以及对齐语料。利用新增的场景语料以及对齐语料,持续更新模型,保证模型的持续效果提升。
在一种应用示例中,本发明实施例的场景纠错系统是一个可迁移和自主学习的场景纠错系统。该场景纠错方法可以适用于中文的场景纠错。利用迁移学习、主动学习等技术保证系统的快速迁移和自主学习能力。针对纠错问题本身,从文本语义理解和场景知识两个方面,充分利用场景纠错任务本身的特点,从多个维度充分利用场景知识,提升场景纠错的效果。
如图5所示,该场景纠错系统主要包括两部分:在线系统和离线系统。
1.在线系统:该部分主要包括系统冷启动时的关键词纠错和运行之后的模型纠错。
1)关键词纠错:系统冷启动时,由于缺少该场景的领域语料和标注数据,无法训练出有效的纠错模型。在冷启动阶段,充分利用场景的关键词词典作为关键词纠错的规则。关键词词典中可以包括用户在建立场景时给定的部分关键词以及系统中预先设置通用关键词。一方面根据该关键词词典在大量无监督数据中查找包括这些关键词的语料,生成与这些关键词相关的语料,包括场景语料。另一方面,利用该关键词词典和先验语言知识(如词法、句法等)得到关键词纠错模型。通过这两个工作,对于智能场景中的关键数据能够取到很好的纠错效果,保证用户的核心体验。
2)模型纠错:在已经积累了大量场景语料和标注语料的情况下,从文本语义理解和场景知识两个方面,充分利用场景纠错任务本身的特点,从多个维度充分利用场景知识,提升场景纠错的效果。如图6所示,具体场景纠错模型主要包括以下部分:
A.文本理解:充分利用场景知识,对场景文本进行深层语义理解,得到更精细的语义特征,作为场景纠错模型的输入特征,提升纠错模型效果。如:『小度小度,请帮我导航到深圳市学府路百度国籍大厦』其得到候选『小度小度,请帮我导航到深圳市学府路百度国际大厦』。文本理解的结果为『小度小度[唤醒词],请帮我导航[指令]到深圳市[城市]学府路[道路]百度国际大厦[POI]』。这样的文本理解结果能够有效解决低频道路、兴趣点(POI,Point of Interest)等泛化问题,能有效地提升纠错模型效果。
B.关联知识:充分利用场景标准语料,通过挖掘关联的精准局部知识(localknowledge)、即关联知识,辅助纠错模型进行决策。关联知识也可以作为场景纠错模型的输入特征。
一个挖掘关联知识的示例包括:『邓论因档期问题退出节目XX』的关联知识包括:
『节目XX中第几期邓伦…』;
『邓伦为什么参加节目XX…』。
C.场景纠错模型:该模型在开放域纠错的基础之上,充分利用场景知识,如场景语料、对齐语料、场景关键词词典等,并利用文本理解得到的特征、关联知识等,训练场景纠错模型。场景纠错模型包括错误检测、纠错排序等功能。
D.结果融合:通过开放域纠错模型和场景纠错模型分别对原始文本(例如语音识别的原始结果)进行错误检测和纠错排序后,融合开放域纠错的结果G1和场景纠错的结果G2,保证对场景中的普通文本的纠错能力。在融合时,可以参考分类模型例如门网络(Gating Network)对原始文本的分类结果,确定是只采用开放域纠错的结果G1或者场景纠错的结果G2,或者两者的合并结果。
2.离线系统:利用迁移学习和主动学习的方式。迁移学习的方式包括,充分利用在开放域或者其他场景学习到的通用知识进行纠错。主动学习的方式包括,从用户反馈日志(Log)文件中挖掘场景语料以及对齐语料。例如,方案A:对用户日志进行语料清洗,并利用后验特征,得到新增的场景语料和对齐语料。再如,方案B:对外部数据进行语义相似处理,对噪音数据进行自动合成,得到新增的场景语料和对齐语料。
利用新增的场景语料以及对齐语料,持续更新场景纠错模型,并同步到在线系统,形成完整的自主学习闭环,保证模型的持续效果提升。
本发明实施例的场景纠错至少具有以下优点:
1.能够充分利用场景知识,对场景文本进行深层语义理解,得到更精细的语义特征,提升纠错模型效果。
2.能够充分利用场景标准语料,挖掘关联的精准局部知识,辅助纠错模型进行决策。
3.具有强大的迁移能力,一方面利用迁移学习的方法,利用开放域或其他场景学习到的通用知识;另一方面,整个系统设计与具体场景零耦合,可以灵活迁移到其他场景。
4.具有自主学习能力,场景纠错系统可以由冷启动时的关键词纠错和运行之后的模型纠错构成。在模型纠错中,充分利用用户反馈的日志,利用自主学习的思想,持续更新模型,形成完整的学习闭环。
图7示出根据本发明实施例的场景纠错装置的结构框图。如图7所示,该装置包括:
语义理解模块71,用于利用目标场景的场景知识对训练样本进行语义理解,得到语义特征;
第一挖掘模块72,用于挖掘所述场景知识的关联知识;
第一训练模块73,用于利用所述语义特征、所述场景知识和所述关联知识训练得到场景纠错模型,所述场景纠错模型用于对输入文本进行场景纠错。
在一种实施方式中,如图8所示,该装置还包括:
词典模块81,用于利用与所述目标场景相关的关键词和预先设置的通用关键词,得到关键词词典;
第二挖掘模块82,用于利用所述关键词词典的各关键词挖掘得到场景语料;
第二训练模块83,用于利用所述场景语料训练得到关键词纠错模型。
在一种实施方式中,该装置还包括:
关键词纠错模块84,用于利用关键词词典和关键词纠错模型对所述输入文本进行纠错。
在一种实施方式中,所述关键词纠错模块84还用于利用所述关键词词典,对目标场景的输入文本中的关键词进行纠错;利用所述关键词纠错模型对纠错后的文本进行结果验证。
在一种实施方式中,该装置还包括:
场景纠错模块85,用于利用所述场景纠错模型对所述输入文本或所述关键词纠错模型的输出结果进行纠错。
在一种实施方式中,该装置还包括:
开放域纠错模块86,用于利用开放域纠错模型,对所述输入文本进行纠错;
融合模块87,用于将所述开放域纠错模型和所述场景纠错模型的纠错结果进行融合。
在一种实施方式中,该装置还包括:
第三挖掘模块88,用于从用户日志中挖掘得到新增的场景知识,所述场景知识包括场景语料和对齐语料;
第三训练模块89,用于利用新增的所述场景知识对所述场景纠错模型进行训练,以更新所述场景纠错模型。
本发明实施例各装置中的各模块的功能可以参见上述方法中的对应描述,在此不再赘述。
图9示出根据本发明实施例的场景纠错设备的结构框图。如图9所示,该设备包括:存储器910和处理器920,存储器910内存储有可在处理器920上运行的计算机程序。所述处理器920执行所述计算机程序时实现上述实施例中的场景纠错方法。所述存储器910和处理器920的数量可以为一个或多个。
该设备还包括:
通信接口930,用于与外界设备进行通信,进行数据交互传输。
存储器910可能包含高速RAM存储器,也可能还包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。
如果存储器910、处理器920和通信接口930独立实现,则存储器910、处理器920和通信接口930可以通过总线相互连接并完成相互间的通信。所述总线可以是工业标准体系结构(ISA,Industry Standard Architecture)总线、外部设备互连(PCI,PeripheralComponentInterconnect)总线或扩展工业标准体系结构(EISA,Extended IndustryStandardArchitecture)总线等。所述总线可以分为地址总线、数据总线、控制总线等。为便于表示,图9中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
可选的,在具体实现上,如果存储器910、处理器920及通信接口930集成在一块芯片上,则存储器910、处理器920及通信接口930可以通过内部接口完成相互间的通信。
本发明实施例提供了一种计算机可读存储介质,其存储有计算机程序,该程序被处理器执行时实现上述实施例中任一所述的方法。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或隐含地包括至少一个该特征。在本发明的描述中,“多个”的含义是两个或两个以上,除非另有明确具体的限定。
流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本发明的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本发明的实施例所属技术领域的技术人员所理解。
在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用,或结合这些指令执行系统、装置或设备而使用。就本说明书而言,“计算机可读介质”可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或多个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(RAM),只读存储器(ROM),可擦除可编辑只读存储器(EPROM或闪速存储器),光纤装置,以及便携式只读存储器(CDROM)。另外,计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序,然后将其存储在计算机存储器中。
应当理解,本发明的各部分可用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。
此外,在本发明各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读存储介质中。所述存储介质可以是只读存储器,磁盘或光盘等。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到其各种变化或替换,这些都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。
Claims (16)
1.一种场景纠错方法,其特征在于,包括:
利用目标场景的场景知识对训练样本进行语义理解,得到语义特征;所述场景知识包括关键词词典、场景语料和对齐语料;
挖掘所述场景知识的关联知识;
利用所述语义特征、所述场景知识和所述关联知识训练得到场景纠错模型,所述场景纠错模型用于对输入文本进行场景纠错。
2.根据权利要求1所述的方法,其特征在于,还包括:
利用与所述目标场景相关的关键词和预先设置的通用关键词,得到关键词词典;
利用所述关键词词典的各关键词挖掘得到场景语料;
利用所述场景语料训练得到关键词纠错模型。
3.根据权利要求2所述的方法,其特征在于,还包括:
利用关键词词典和关键词纠错模型对所述输入文本进行纠错。
4.根据权利要求3所述的方法,其特征在于,利用关键词词典和关键词纠错模型对所述输入文本进行纠错,包括:
利用所述关键词词典,对目标场景的输入文本中的关键词进行纠错;
利用所述关键词纠错模型对纠错后的文本进行结果验证。
5.根据权利要求3所述的方法,其特征在于,还包括:
利用所述场景纠错模型对所述输入文本或所述关键词纠错模型的输出结果进行纠错。
6.根据权利要求1所述的方法,其特征在于,还包括:
利用开放域纠错模型,对所述输入文本进行纠错;
将所述开放域纠错模型和所述场景纠错模型的纠错结果进行融合。
7.根据权利要求1至6中任一项所述的方法,其特征在于,还包括:
从用户日志中挖掘得到新增的场景知识,所述场景知识包括场景语料和对齐语料;
利用新增的所述场景知识对所述场景纠错模型进行训练,以更新所述场景纠错模型。
8.一种场景纠错装置,其特征在于,包括:
语义理解模块,用于利用目标场景的场景知识对训练样本进行语义理解,得到语义特征;所述场景知识包括关键词词典、场景语料和对齐语料;
第一挖掘模块,用于挖掘所述场景知识的关联知识;
第一训练模块,用于利用所述语义特征、所述场景知识和所述关联知识训练得到场景纠错模型,所述场景纠错模型用于对输入文本进行场景纠错。
9.根据权利要求8所述的装置,其特征在于,还包括:
词典模块,用于利用与所述目标场景相关的关键词和预先设置的通用关键词,得到关键词词典;
第二挖掘模块,用于利用所述关键词词典的各关键词挖掘得到场景语料;
第二训练模块,用于利用所述场景语料训练得到关键词纠错模型。
10.根据权利要求9所述的装置,其特征在于,还包括:
关键词纠错模块,用于利用关键词词典和关键词纠错模型对所述输入文本进行纠错。
11.根据权利要求10所述的装置,其特征在于,所述关键词纠错模块还用于利用所述关键词词典,对目标场景的输入文本中的关键词进行纠错;利用所述关键词纠错模型对纠错后的文本进行结果验证。
12.根据权利要求10所述的装置,其特征在于,还包括:
场景纠错模块,用于利用所述场景纠错模型对所述输入文本或所述关键词纠错模型的输出结果进行纠错。
13.根据权利要求8所述的装置,其特征在于,还包括:
开放域纠错模块,用于利用开放域纠错模型,对所述输入文本进行纠错;
融合模块,用于将所述开放域纠错模型和所述场景纠错模型的纠错结果进行融合。
14.根据权利要求8至12中任一项所述的装置,其特征在于,还包括:
第三挖掘模块,用于从用户日志中挖掘得到新增的场景知识,所述场景知识包括场景语料和对齐语料;
第三训练模块,用于利用新增的所述场景知识对所述场景纠错模型进行训练,以更新所述场景纠错模型。
15.一种场景纠错设备,其特征在于,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现如权利要求1至7中任一项所述的方法。
16.一种计算机可读存储介质,其存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1至7中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910502574.1A CN110232129B (zh) | 2019-06-11 | 2019-06-11 | 场景纠错方法、装置、设备和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910502574.1A CN110232129B (zh) | 2019-06-11 | 2019-06-11 | 场景纠错方法、装置、设备和存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110232129A CN110232129A (zh) | 2019-09-13 |
CN110232129B true CN110232129B (zh) | 2020-09-29 |
Family
ID=67859041
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910502574.1A Active CN110232129B (zh) | 2019-06-11 | 2019-06-11 | 场景纠错方法、装置、设备和存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110232129B (zh) |
Families Citing this family (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110969012B (zh) * | 2019-11-29 | 2023-04-07 | 北京字节跳动网络技术有限公司 | 文本纠错方法、装置、存储介质及电子设备 |
CN111104546B (zh) * | 2019-12-03 | 2021-08-27 | 珠海格力电器股份有限公司 | 一种构建语料库的方法、装置、计算设备及存储介质 |
CN111090991B (zh) * | 2019-12-25 | 2023-07-04 | 北京百度网讯科技有限公司 | 场景纠错方法、装置、电子设备和存储介质 |
CN111724244A (zh) * | 2020-06-11 | 2020-09-29 | 中国建设银行股份有限公司 | 一种异议纠错方法和装置 |
CN112036162B (zh) * | 2020-11-06 | 2021-02-12 | 北京世纪好未来教育科技有限公司 | 文本纠错的适配方法、装置、电子设备及存储介质 |
CN112580324B (zh) * | 2020-12-24 | 2023-07-25 | 北京百度网讯科技有限公司 | 文本纠错方法、装置、电子设备以及存储介质 |
CN114692639A (zh) * | 2020-12-25 | 2022-07-01 | 华为技术有限公司 | 一种文本纠错方法和电子设备 |
CN114120972B (zh) * | 2022-01-28 | 2022-04-12 | 科大讯飞华南有限公司 | 一种基于场景化的语音智能识别方法及系统 |
CN115455948A (zh) * | 2022-11-11 | 2022-12-09 | 北京澜舟科技有限公司 | 一种拼写纠错模型训练方法、拼写纠错方法及存储介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108091328A (zh) * | 2017-11-20 | 2018-05-29 | 北京百度网讯科技有限公司 | 基于人工智能的语音识别纠错方法、装置及可读介质 |
WO2018121275A1 (zh) * | 2016-12-29 | 2018-07-05 | 北京奇虎科技有限公司 | 一种智能硬件设备中的语音识别纠错方法和装置 |
CN108874174A (zh) * | 2018-05-29 | 2018-11-23 | 腾讯科技(深圳)有限公司 | 一种文本纠错方法、装置以及相关设备 |
CN109408813A (zh) * | 2018-09-30 | 2019-03-01 | 北京金山安全软件有限公司 | 一种文本纠正方法及装置 |
CN109753636A (zh) * | 2017-11-01 | 2019-05-14 | 阿里巴巴集团控股有限公司 | 机器处理及文本纠错方法和装置、计算设备以及存储介质 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107357775A (zh) * | 2017-06-05 | 2017-11-17 | 百度在线网络技术(北京)有限公司 | 基于人工智能的循环神经网络的文本纠错方法及装置 |
-
2019
- 2019-06-11 CN CN201910502574.1A patent/CN110232129B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2018121275A1 (zh) * | 2016-12-29 | 2018-07-05 | 北京奇虎科技有限公司 | 一种智能硬件设备中的语音识别纠错方法和装置 |
CN109753636A (zh) * | 2017-11-01 | 2019-05-14 | 阿里巴巴集团控股有限公司 | 机器处理及文本纠错方法和装置、计算设备以及存储介质 |
CN108091328A (zh) * | 2017-11-20 | 2018-05-29 | 北京百度网讯科技有限公司 | 基于人工智能的语音识别纠错方法、装置及可读介质 |
CN108874174A (zh) * | 2018-05-29 | 2018-11-23 | 腾讯科技(深圳)有限公司 | 一种文本纠错方法、装置以及相关设备 |
CN109408813A (zh) * | 2018-09-30 | 2019-03-01 | 北京金山安全软件有限公司 | 一种文本纠正方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
CN110232129A (zh) | 2019-09-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110232129B (zh) | 场景纠错方法、装置、设备和存储介质 | |
US9569427B2 (en) | Intention estimation equipment and intention estimation system | |
CN109543022B (zh) | 文本纠错方法和装置 | |
US10043520B2 (en) | Multilevel speech recognition for candidate application group using first and second speech commands | |
CN110415679B (zh) | 语音纠错方法、装置、设备和存储介质 | |
CN109074517B (zh) | 全局归一化神经网络 | |
KR102390940B1 (ko) | 음성 인식을 위한 컨텍스트 바이어싱 | |
US10783877B2 (en) | Word clustering and categorization | |
CN110188204B (zh) | 一种扩展语料挖掘方法、装置、服务器及存储介质 | |
US11003993B1 (en) | Training recurrent neural networks to generate sequences | |
EP3625797A1 (en) | Cluster based search and recommendation method to rapidly on-board commands in personal assistants | |
CN111144952A (zh) | 基于用户兴趣的广告推荐方法、装置、服务器及存储介质 | |
Dethlefs et al. | Conditional random fields for responsive surface realisation using global features | |
CN114154487A (zh) | 文本自动纠错方法、装置、电子设备及存储介质 | |
EP2707807A2 (en) | Training statistical dialog managers in spoken dialog systems with web data | |
CN110678882A (zh) | 使用机器学习从电子文档选择回答跨距 | |
CN111400584A (zh) | 联想词的推荐方法、装置、计算机设备和存储介质 | |
CN112131885A (zh) | 语义识别方法、装置、电子设备及存储介质 | |
WO2019035373A1 (ja) | 情報処理装置、情報処理方法、およびプログラム | |
CN112861521A (zh) | 语音识别结果纠错方法、电子设备及存储介质 | |
WO2020156342A1 (zh) | 语音识别方法、装置、电子设备及存储介质 | |
CN111428011B (zh) | 词语的推荐方法、装置、设备及存储介质 | |
CN110020429B (zh) | 语义识别方法及设备 | |
JP7044856B2 (ja) | 増強された一貫性正規化を利用した音声認識モデル学習方法およびシステム | |
Maqbool et al. | Zero-label anaphora resolution for off-script user queries in goal-oriented dialog systems |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |