CN106528616B - 一种人机交互过程中的语言纠错方法及系统 - Google Patents
一种人机交互过程中的语言纠错方法及系统 Download PDFInfo
- Publication number
- CN106528616B CN106528616B CN201610871257.3A CN201610871257A CN106528616B CN 106528616 B CN106528616 B CN 106528616B CN 201610871257 A CN201610871257 A CN 201610871257A CN 106528616 B CN106528616 B CN 106528616B
- Authority
- CN
- China
- Prior art keywords
- word
- candidate
- word segmentation
- degree
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/903—Querying
- G06F16/9032—Query formulation
- G06F16/90332—Natural language query formulation or dialogue systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- Computational Linguistics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Artificial Intelligence (AREA)
- General Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Health & Medical Sciences (AREA)
- Data Mining & Analysis (AREA)
- Machine Translation (AREA)
- Document Processing Apparatus (AREA)
Abstract
本发明公开了一种人机交互过程中的语言纠错方法及系统,其利用互联网信息进行获取语料,利用该语料进行构建语料库,对所述语料库中的语料进行分词处理得到分词数据,根据所述分词数据进行计算各个词之间的关联度,并根据所述分词数据中每个词出现的频率进行计算每个词的热度,然后根据所述分词数据进行训练语言模型,并将所述关联度和所述热度作为所述语言模型的模型参数;获取用户的输入数据时,对所述输入数据进行分词处理得到该输入数据对应的分词数据,利用所述语言模型对所述输入数据对应的分词数据按照所述关联度和所述热度进行排序,最后对排序后的分词数据进行合并及输出结果数据;能够较好的解决因输入法等原因造成的同音字错误的问题。
Description
技术领域
本发明涉及通信技术领域,特别是一种人机交互过程中的语言纠错方法及其应用该方法的系统。
背景技术
随着互联网及电子商务、人工智能的普及应用,自动客服、聊天机器人等智能产品也越来越多。智能客服是在大规模知识处理基础上发展起来的一项面向行业应用的,例如大规模知识处理技术、自然语言理解技术、知识管理技术、自动问答系统、推理技术等等,具有行业通用性,不仅为企业提供了细粒度知识管理技术,还为企业与海量用户之间的沟通建立了一种基于自然语言的快捷有效的技术手段;同时还能够为企业提供精细化管理所需的统计分析信息。
智能客服的工作方法为首先提取、识别用户提出的问题,然后将用户提出的问题转化为机器可识别的语言,再从预先部署的知识库中提取与用户问题相对应的数据,反馈给用户。
现有技术的智能客服主要存在以下问题:
由于输入法问题或者个人输入习惯、操作失误、网络新鲜词汇等因素,会导致智能客服所遇到的问题中经常出现无法理解的词语,从而导致智能客服无法作出及时、正确的反应。尤其是采用拼音输入法问题造成的同音字错误较为普遍,目前市面上使用拼音输入法的人占到了90%以上,所以同音字错误占到了总体错误率的半数以上。
发明内容
本发明为解决上述问题,提供了一种人机交互过程中的语言纠错方法及系统,能够较好的解决因输入法等原因造成的同音字错误的问题。
为实现上述目的,本发明采用的技术方案为:
一种人机交互过程中的语言纠错方法,其包括以下步骤:
10)利用互联网信息进行获取语料,并利用该语料进行构建语料库;
20)对所述语料库中的语料进行分词处理得到分词数据;
30)根据所述分词数据进行计算各个词之间的关联度;
40)根据所述分词数据中每个词出现的频率进行计算每个词的热度;
50)根据所述分词数据进行训练语言模型,并将所述关联度和所述热度作为所述语言模型的模型参数;
60)获取用户的输入数据,并对所述输入数据进行分词处理得到该输入数据对应的分词数据;
70)利用所述语言模型对所述输入数据对应的分词数据按照所述关联度和所述热度进行排序,并对排序后的分词数据进行合并及输出结果数据。
优选的,所述分词处理,是利用jieba分词工具对所述语料库中的语料以及对所述用户的输入数据进行分词处理。
优选的,所述语言模型,是采用Bigram语言模型。
优选的,所述的步骤70)中,所述分词数据的排序,进一步包括以下步骤:
71)确定首词:将备选首词之后的备选相邻后词中热度最高的备选相邻后词作为第一参考后词,计算所述备选首词与所述第一参考后词之间的关联度,取关联度最高的备选首词作为结果首词;
72)确定中间词:将备选中间词之后的备选相邻后词中热度最高的备选相邻后词作为第二参考后词,计算所述备选中间词与所述结果首词之间的关联度,并计算所述备选中间词与所述第二参考后词之间的关联度,取两个关联度均最高的备选中间词作为结果中间词;
73)确定末词:计算备选末词与所述结果中间词之间的关联度,并对比各个备选末词的热度,取关联度和热度均最高的备选末词作为结果末词。
另外,本发明还提供一种人机交互过程中的语言纠错系统,其包括:
语料获取模块,其利用互联网信息进行获取语料,并利用该语料进行构建语料库;
分词模块,用于对所述语料库中的语料进行分词处理得到分词数据;
句子粒度纠错模块,其根据所述分词数据进行计算各个词之间的关联度;
词粒度纠错模块,其根据所述分词数据中每个词出现的频率进行计算每个词的热度;
模型训练模块,其根据所述分词数据进行训练语言模型,并将所述关联度和所述热度作为所述语言模型的模型参数;
结果合成模块,其利用所述语言模型对分词数据进行重新排序与合并,得到结果数据;
获取用户的输入数据时,所述分词模块对所述输入数据进行分词处理得到该输入数据对应的分词数据,所述结果合成模块利用所述语言模型将所述输入数据对应的分词数据按照所述关联度和所述热度进行排序,并对排序后的分词数据进行合并及输出结果数据。
优选的,所述分词模块是利用jieba分词工具对所述语料库中的语料以及对所述用户的输入数据进行分词处理。
优选的,所述模型训练模块是根据所述分词数据进行训练Bigram语言模型。
优选的,所述结果合成模块进一步包括:
首词确定单元:将备选首词之后的备选相邻后词中热度最高的备选相邻后词作为第一参考后词,计算所述备选首词与所述第一参考后词之间的关联度,取关联度最高的备选首词作为结果首词;
中间词确定单元:将备选中间词之后的备选相邻后词中热度最高的备选相邻后词作为第二参考后词,计算所述备选中间词与所述结果首词之间的关联度,并计算所述备选中间词与所述第二参考后词之间的关联度,取两个关联度均最高的备选中间词作为结果中间词;
末词确定单元:计算备选末词与所述结果中间词之间的关联度,并对比各个备选末词的热度,取关联度和热度均最高的备选末词作为结果末词。
本发明的有益效果是:
(1)本发明的语言纠错方法,通过对语料库中的语料进行分词处理构建语言模型,并将每个词的热度以及各个词之间的关联度作为该语言模型的模型参数,使用时,将用户的输入数据按照同样的方法进行分词处理得到对应的分词数据,并利用训练好的语言模型对该分词数据进行排序和合并,得到结果数据;能够根据用户的输入数据快速做出响应和纠错,并提供可靠的结果数据;应用在本发明的智能客服时,访客问题即为用户的输入数据,若访客问题是错误的,则很难得到智能客服的正确回复,因此,采用本发明的纠错方法能够提高访客问题的识别效率、回复效率,用户体验更好;
(2)本发明对所述分词数据进行排序时,不仅考虑每个词的热度以及各个词之间的关联度,还进一步考虑每个词的前词及后词之间的关系,能够提高纠错的效率以及准确性。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本发明的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1为本发明一种人机交互过程中的语言纠错方法的流程简图;
图2为本发明一种人机交互过程中的语言纠错系统的结构示意图。
具体实施方式
为了使本发明所要解决的技术问题、技术方案及有益效果更加清楚、明白,以下结合附图及实施例对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。
如图1所示,本发明的一种人机交互过程中的语言纠错方法,其包括以下步骤:
10)利用互联网信息进行获取语料,并利用该语料进行构建语料库;
20)对所述语料库中的语料进行分词处理得到分词数据;
30)根据所述分词数据进行计算各个词之间的关联度;
40)根据所述分词数据中每个词出现的频率进行计算每个词的热度;
50)根据所述分词数据进行训练语言模型,并将所述关联度和所述热度作为所述语言模型的模型参数;
60)获取用户的输入数据,并对所述输入数据进行分词处理得到该输入数据对应的分词数据;
70)利用所述语言模型对所述输入数据对应的分词数据按照所述关联度和所述热度进行排序,并对排序后的分词数据进行合并及输出结果数据。
所述分词处理,是利用jieba分词工具对所述语料库中的语料以及对所述用户的输入数据进行分词处理。
分词方法示例如下:
输入数据为:科学技术是第一生产力;
分词后得到的分词数据为:科学,技术,是,第一,生产力;
输入数据为:科学发展是第一生产力;
分词后得到的分词数据为:科学,发展,是,第一,生产力;
输入数据为:科学技术与工程;
分词后得到的分词数据为:科学,技术,与,工程;
输入数据为:科学计算器;
分词后得到的分词数据为:科学,计算器。
分词的关联度的示例如下:
“科学”与“技术”的关联度为2000;
“科学”与“发展”的关联度为1500;
“科学”与“计算器”的关联度为100;
“第一”与“生产力”的关联度为300。
分词的热度的示例如下:
“科学”热度12000,“技术”热度16000,“第一”热度8000,“生产力”热度3000。
所述语言模型,是采用Bigram语言模型。
所述的步骤70)中,所述分词数据的排序,进一步包括以下步骤:
71)确定首词:将备选首词之后的备选相邻后词中热度最高的备选相邻后词作为第一参考后词,计算所述备选首词与所述第一参考后词之间的关联度,取关联度最高的备选首词作为结果首词;
72)确定中间词:将备选中间词之后的备选相邻后词中热度最高的备选相邻后词作为第二参考后词,计算所述备选中间词与所述结果首词之间的关联度,并计算所述备选中间词与所述第二参考后词之间的关联度,取两个关联度均最高的备选中间词作为结果中间词;
73)确定末词:计算备选末词与所述结果中间词之间的关联度,并对比各个备选末词的热度,取关联度和热度均最高的备选末词作为结果末词。
如图2所示,本发明还提供一种人机交互过程中的语言纠错系统,其包括:
语料获取模块,其利用互联网信息进行获取语料,并利用该语料进行构建语料库;
分词模块,用于对所述语料库中的语料进行分词处理得到分词数据;
句子粒度纠错模块,其根据所述分词数据进行计算各个词之间的关联度;
词粒度纠错模块,其根据所述分词数据中每个词出现的频率进行计算每个词的热度;
模型训练模块,其根据所述分词数据进行训练语言模型,并将所述关联度和所述热度作为所述语言模型的模型参数;
结果合成模块,其利用所述语言模型对分词数据进行重新排序与合并,得到结果数据;
获取用户的输入数据时,所述分词模块对所述输入数据进行分词处理得到该输入数据对应的分词数据,所述结果合成模块利用所述语言模型将所述输入数据对应的分词数据按照所述关联度和所述热度进行排序,并对排序后的分词数据进行合并及输出结果数据。
所述分词模块是利用jieba分词工具对所述语料库中的语料以及对所述用户的输入数据进行分词处理。
所述模型训练模块是根据所述分词数据进行训练Bigram语言模型。
所述结果合成模块进一步包括:
首词确定单元:将备选首词之后的备选相邻后词中热度最高的备选相邻后词作为第一参考后词,计算所述备选首词与所述第一参考后词之间的关联度,取关联度最高的备选首词作为结果首词;
中间词确定单元:将备选中间词之后的备选相邻后词中热度最高的备选相邻后词作为第二参考后词,计算所述备选中间词与所述结果首词之间的关联度,并计算所述备选中间词与所述第二参考后词之间的关联度,取两个关联度均最高的备选中间词作为结果中间词;
末词确定单元:计算备选末词与所述结果中间词之间的关联度,并对比各个备选末词的热度,取关联度和热度均最高的备选末词作为结果末词。
以下列举一具体实施例进行说明整体纠错流程:
1.访客输入:可学计数是第一声禅理
2.分词后得到的分词数据为:可学,计数,是,第一声,禅理
3.词粒度纠错模块计算后,按热度排序得到:
(科学,咳血,可学)(技术,计数,基数,奇数,记述)(是,事,时,市)(第一,敌意)(生产力,盛产梨)
4.根据语言模型中的模型参数,得到如下结果:
“科学”热度12000,“咳血”热度1500,“可学”热度1800,“技术”热度16000,“计数”热度10000,“基数”热度8000,“奇数”热度9000,“记述”热度6000;
“科学”与“技术”关联度2000,“科学”与“计数”关联度1000,“科学”与“基数”关联度50,“科学”与“奇数”关联度20,“科学”与“记述”关联度200。
5.按首词、中间词、末词三种位置来计算确定结果:
5.1确定首词的方法:
将首词中出现的每个词,与其后的词中词频最高的词(热度值最高的),其关联值进行对比,然后取关联度值最高的词,确定为首词。
如:“科学”与“技术”关联度2000,“咳血”与“技术”关联度20,“可学”与“技术”关联度300,则首词确定为“科学”。
5.2确定中间词的方法:
将出现的每个中间词与已确定首词的关联度值,与中间词本身的热度值,以及与其后的词(取词频,即词热度值最高的词)之间的关联度值,三者之间进行计算,取结果最高者确定为中间词。
如:
“科学”与“技术”关联度2000x“技术”热度16000x“技术”与“是”关联度1500=结果1
“科学”与“计数”关联度1000x“计数”热度10000x“计数”与“是”关联度800=结果2
“科学”与“基数”关联度500x“基数”热度8000x“基数”与“是”关联度300=结果3
“科学”与“奇数”关联度20x“奇数”热度9000x“奇数”与“是”关联度100=结果4
“科学”与“记述”关联度200x“记述”热度6000x“记述”与“是”关联度100=结果5
则确定结果1,为中间词。
5.3确定未词的方法:
将末词中出现的每个词与已确定前词(位于其位置前的一个词,即中间词)的关联度值,与末词本身的热度值,二者之间进行计算,取结果最高者确定为中间词。
如:
“第一”与“生产力”关联度800x“生产力”热度1200=结果1
“第一”与“盛产梨”关联度50x“盛产梨”热度400=结果2
则确定结果1,为末词。
6.输出结果
最后通过结果合成模块根据计算的结果,将各词合并,最终得到结果:
(科学)(技术)(是)(第一)(生产力)。
需要说明的是,本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。对于系统实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。并且,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。另外,本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。
上述说明示出并描述了本发明的优选实施例,应当理解本发明并非局限于本文所披露的形式,不应看作是对其他实施例的排除,而可用于各种其他组合、修改和环境,并能够在本文发明构想范围内,通过上述教导或相关领域的技术或知识进行改动。而本领域人员所进行的改动和变化不脱离本发明的精神和范围,则都应在本发明所附权利要求的保护范围内。
Claims (6)
1.一种人机交互过程中的语言纠错方法,其特征在于,包括以下步骤:
10)利用互联网信息进行获取语料,并利用该语料进行构建语料库;
20)对所述语料库中的语料进行分词处理得到分词数据;
30)根据所述分词数据进行计算各个词之间的关联度;
40)根据所述分词数据中每个词出现的频率进行计算每个词的热度;
50)根据所述分词数据进行训练语言模型,并将所述关联度和所述热度作为所述语言模型的模型参数;
60)获取用户的输入数据,并对所述输入数据进行分词处理得到该输入数据对应的分词数据;
70)利用所述语言模型对所述输入数据对应的分词数据按照所述关联度和所述热度进行排序,并对排序后的分词数据进行合并及输出结果数据;
所述的步骤70)中,所述分词数据的排序,进一步包括以下步骤:
71)确定首词:将备选首词之后的备选相邻后词中热度最高的备选相邻后词作为第一参考后词,计算所述备选首词与所述第一参考后词之间的关联度,取关联度最高的备选首词作为结果首词;
72)确定中间词:将备选中间词之后的备选相邻后词中热度最高的备选相邻后词作为第二参考后词,计算所述备选中间词与所述结果首词之间的关联度,并计算所述备选中间词与所述第二参考后词之间的关联度,取两个关联度均最高的备选中间词作为结果中间词;
73)确定末词:计算备选末词与所述结果中间词之间的关联度,并对比各个备选末词的热度,取关联度和热度均最高的备选末词作为结果末词。
2.根据权利要求1所述的一种人机交互过程中的语言纠错方法,其特征在于:所述分词处理,是利用jieba分词工具对所述语料库中的语料以及对所述用户的输入数据进行分词处理。
3.根据权利要求1所述的一种人机交互过程中的语言纠错方法,其特征在于:所述语言模型,是采用Bigram语言模型。
4.一种人机交互过程中的语言纠错系统,其特征在于,包括:
语料获取模块,其利用互联网信息进行获取语料,并利用该语料进行构建语料库;
分词模块,用于对所述语料库中的语料进行分词处理得到分词数据;
句子粒度纠错模块,其根据所述分词数据进行计算各个词之间的关联度;
词粒度纠错模块,其根据所述分词数据中每个词出现的频率进行计算每个词的热度;
模型训练模块,其根据所述分词数据进行训练语言模型,并将所述关联度和所述热度作为所述语言模型的模型参数;
结果合成模块,其利用所述语言模型对分词数据进行重新排序与合并,得到结果数据;
获取用户的输入数据时,所述分词模块对所述输入数据进行分词处理得到该输入数据对应的分词数据,所述结果合成模块利用所述语言模型将所述输入数据对应的分词数据按照所述关联度和所述热度进行排序,并对排序后的分词数据进行合并及输出结果数据;
其中,所述结果合成模块进一步包括:
首词确定单元:将备选首词之后的备选相邻后词中热度最高的备选相邻后词作为第一参考后词,计算所述备选首词与所述第一参考后词之间的关联度,取关联度最高的备选首词作为结果首词;
中间词确定单元:将备选中间词之后的备选相邻后词中热度最高的备选相邻后词作为第二参考后词,计算所述备选中间词与所述结果首词之间的关联度,并计算所述备选中间词与所述第二参考后词之间的关联度,取两个关联度均最高的备选中间词作为结果中间词;
末词确定单元:计算备选末词与所述结果中间词之间的关联度,并对比各个备选末词的热度,取关联度和热度均最高的备选末词作为结果末词。
5.根据权利要求4所述的一种人机交互过程中的语言纠错系统,其特征在于:所述分词模块是利用jieba分词工具对所述语料库中的语料以及对所述用户的输入数据进行分词处理。
6.根据权利要求4所述的一种人机交互过程中的语言纠错系统,其特征在于:所述模型训练模块是根据所述分词数据进行训练Bigram语言模型。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610871257.3A CN106528616B (zh) | 2016-09-30 | 2016-09-30 | 一种人机交互过程中的语言纠错方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610871257.3A CN106528616B (zh) | 2016-09-30 | 2016-09-30 | 一种人机交互过程中的语言纠错方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN106528616A CN106528616A (zh) | 2017-03-22 |
CN106528616B true CN106528616B (zh) | 2019-12-17 |
Family
ID=58331196
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610871257.3A Active CN106528616B (zh) | 2016-09-30 | 2016-09-30 | 一种人机交互过程中的语言纠错方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106528616B (zh) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108803890B (zh) * | 2017-04-28 | 2024-02-06 | 北京搜狗科技发展有限公司 | 一种输入方法、输入装置和用于输入的装置 |
CN109101505B (zh) * | 2017-06-20 | 2021-09-03 | 北京搜狗科技发展有限公司 | 一种推荐方法、推荐装置和用于推荐的装置 |
CN107608963B (zh) * | 2017-09-12 | 2021-04-16 | 马上消费金融股份有限公司 | 一种基于互信息的中文纠错方法、装置、设备及存储介质 |
CN108132966A (zh) * | 2017-11-28 | 2018-06-08 | 北京洪泰同创信息技术有限公司 | 知识图谱生成方法及装置 |
CN108304377B (zh) * | 2017-12-28 | 2021-08-06 | 东软集团股份有限公司 | 一种长尾词的提取方法及相关装置 |
CN108735220A (zh) * | 2018-04-11 | 2018-11-02 | 四川斐讯信息技术有限公司 | 一种语言学习用智能耳机、智能交互系统及人机交互方法 |
CN108664656B (zh) * | 2018-05-18 | 2020-06-26 | 上海智臻智能网络科技股份有限公司 | 知识数据自动同步、录入方法、装置、系统、设备及介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103885938A (zh) * | 2014-04-14 | 2014-06-25 | 东南大学 | 基于用户反馈的行业拼写错误检查方法 |
CN104424342A (zh) * | 2013-09-11 | 2015-03-18 | 携程计算机技术(上海)有限公司 | 关键字匹配方法及其装置、服务器和系统 |
CN104462085A (zh) * | 2013-09-12 | 2015-03-25 | 腾讯科技(深圳)有限公司 | 检索关键词纠错方法及装置 |
CN105045778A (zh) * | 2015-06-24 | 2015-11-11 | 江苏科技大学 | 一种汉语同音词错误自动校对方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8341520B2 (en) * | 2007-09-24 | 2012-12-25 | Ghotit Ltd. | Method and system for spell checking |
-
2016
- 2016-09-30 CN CN201610871257.3A patent/CN106528616B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104424342A (zh) * | 2013-09-11 | 2015-03-18 | 携程计算机技术(上海)有限公司 | 关键字匹配方法及其装置、服务器和系统 |
CN104462085A (zh) * | 2013-09-12 | 2015-03-25 | 腾讯科技(深圳)有限公司 | 检索关键词纠错方法及装置 |
CN103885938A (zh) * | 2014-04-14 | 2014-06-25 | 东南大学 | 基于用户反馈的行业拼写错误检查方法 |
CN105045778A (zh) * | 2015-06-24 | 2015-11-11 | 江苏科技大学 | 一种汉语同音词错误自动校对方法 |
Also Published As
Publication number | Publication date |
---|---|
CN106528616A (zh) | 2017-03-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106528616B (zh) | 一种人机交互过程中的语言纠错方法及系统 | |
CN109241255B (zh) | 一种基于深度学习的意图识别方法 | |
US11693894B2 (en) | Conversation oriented machine-user interaction | |
CN115238101B (zh) | 一种面向多类型知识库的多引擎智能问答系统 | |
CN107291783B (zh) | 一种语义匹配方法及智能设备 | |
CN107480143B (zh) | 基于上下文相关性的对话话题分割方法和系统 | |
CN108984530A (zh) | 一种网络敏感内容的检测方法及检测系统 | |
CN110276456B (zh) | 一种机器学习模型辅助构建方法、系统、设备及介质 | |
CN111368049A (zh) | 信息获取方法、装置、电子设备及计算机可读存储介质 | |
CN110032630A (zh) | 话术推荐设备、方法及模型训练设备 | |
CN109063147A (zh) | 基于文本相似度的在线课程论坛内容推荐方法及系统 | |
CN107301199A (zh) | 一种数据标签生成方法和装置 | |
CN109299865A (zh) | 基于语义分析的心理测评系统及方法、信息数据处理终端 | |
CN109978020B (zh) | 一种基于多维特征的社交网络账号马甲身份辨识方法 | |
CN101454826A (zh) | 语音识别词典/语言模型制作系统、方法、程序,以及语音识别系统 | |
CN108108347B (zh) | 对话模式分析系统及方法 | |
CN111061837A (zh) | 话题识别方法、装置、设备及介质 | |
CN112100353A (zh) | 人机对话方法及系统、计算机设备及介质 | |
CN113988071A (zh) | 一种基于金融知识图谱的智能对话方法及装置、电子设备 | |
CN111400340A (zh) | 一种自然语言处理方法、装置、计算机设备和存储介质 | |
CN115345177A (zh) | 意图识别模型训练方法和对话方法及装置 | |
CN110826330B (zh) | 人名识别方法及装置、计算机设备及可读存储介质 | |
CN115017271B (zh) | 用于智能生成rpa流程组件块的方法及系统 | |
CN116703515A (zh) | 基于人工智能的推荐方法、装置、计算机设备及存储介质 | |
CN116186219A (zh) | 一种人机对话交互方法方法、系统及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |