CN109933779A - 用户意图识别方法及系统 - Google Patents
用户意图识别方法及系统 Download PDFInfo
- Publication number
- CN109933779A CN109933779A CN201711364768.7A CN201711364768A CN109933779A CN 109933779 A CN109933779 A CN 109933779A CN 201711364768 A CN201711364768 A CN 201711364768A CN 109933779 A CN109933779 A CN 109933779A
- Authority
- CN
- China
- Prior art keywords
- question sentence
- vector
- word
- model
- keyword
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 52
- 238000012549 training Methods 0.000 claims abstract description 29
- 238000012545 processing Methods 0.000 claims description 17
- 238000010276 construction Methods 0.000 claims description 9
- 238000012937 correction Methods 0.000 claims description 3
- 239000000284 extract Substances 0.000 claims description 3
- 238000001914 filtration Methods 0.000 claims description 3
- 238000002203 pretreatment Methods 0.000 claims description 3
- 238000007405 data analysis Methods 0.000 abstract description 2
- 230000009286 beneficial effect Effects 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 206010028916 Neologism Diseases 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 238000004891 communication Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开一种用户意图识别方法及系统,涉及数据分析技术领域,能够将用户提问的0项词转换为词向量数据中现有的相似词进行表达,进而提高用户意图识别的准确性。该方法包括整理客服问答语料得到知识库,知识库包括多个问句和与问句对应的意图类别;分别对每个问句进行向量化计算,得到每个问句的向量;对每个问句的向量及对应的意图类别进行分类模型训练,获取意图分类模型;从知识库中获取关键词,对关键词进行训练构建词向量模型;对当前问句进行向量化计算得到当前问句向量,利用词向量模型将当前问句向量中的0项词替换成与词向量模型中最相似的词;计算替换后的问句向量,将替换后的问句向量输入意图分类模型,得到当前问句的用户意图。
Description
技术领域
本发明涉及数据分析技术领域,尤其涉及一种用户意图识别方法及系统。
背景技术
随着通讯技术的发展和电子商务的普及,越来越多的人们开始习惯在网上购物。在电子商务环境上,商家在线上提供的商品种类和数量越来越多,在给予用户丰富的选择同时,也增加了用户在众多商品中准确搜寻到感兴趣的产品的困难度。因此,迫切需要一种智能导购来主动地帮助用户选购商品,并能根据用户的兴趣和爱好,个性化地给每个用户推荐他可能感兴趣且满意的产品,使用户能够方便、快捷的购买到自己心仪的商品,提高用户线上购物的体验。
智能导购的技术基础就是人机交互技术,而人机交互的关键在于用户的意图识别。现有的用户意图识别多采用多分类模型来实现,通过大量的标注了意图的用户问句来训练模型,然后利用训练模型识别用户问句以理解用户意图,由于用户的问句多种多样,因此只有训练模型中的词向量数据足够大,才能保证对用户问句意图理解的准确性,即训练模型中的词向量数据与理解用户问句意图的准确性存在正比例关系。
但是,由于人工标注的用户问句数据量有限,因此通过这些问句训练得到的训练模型,其中的词向量数据不能够完全涵盖所有用户问句,这样就会导致即使用户问句中出现了与词向量数据中意思相似的词,但因两词语不同而造成的将用户的意图识别错的情况发生,从而降低了用户意图识别的准确性。
发明内容
本发明的目的在于提供一种用户意图识别方法及系统,能够将用户提问的新词转换为词向量数据中现有的相似词进行表达,进而提高用户意图识别的准确性。
为了实现上述目的,本发明的第一方面提供一种用户意图识别方法,包括:
整理客服问答语料得到知识库,所述知识库包括多个问句和与问句对应的意图类别;
分别对每个问句进行向量化计算,得到每个问句的向量;
对每个问句的向量及对应的意图类别进行分类模型训练,获取意图分类模型;
从所述知识库中获取关键词,对所述关键词进行训练构建词向量模型;
对当前问句进行向量化计算得到当前问句向量,利用所述词向量模型将当前问句向量中的0项词替换成与所述词向量模型中最相似的词;
计算替换后的问句向量,将所述替换后的问句向量输入所述意图分类模型,得到当前问句的用户意图。
优选地,所述整理客服问答语料得到知识库的方法包括:
从所述客服问答语料中提取用户对商品信息的各种问法,整理后得到多个问句;
对各问句一一进行标注,得到与所述问句对应的意图类别。
优选地,所述分别对每个问句进行向量化计算,得到每个问句的向量的方法包括:
对问句进行预处理和文本处理以提取问句中的多个关键词;
计算各关键词的TF-IDF值,生成问句向量;
依次重复上述步骤对其他问句进行计算,得到每个问句的向量。
较佳地,所述对问句进行预处理和文本处理以提取问句中的多个关键词的方法包括:
所述预处理是指剔除问句中与用户意图无关的内容,包括剔除问句中的特殊字符、表情符号、订单号中的一种或多种;
所述文本处理是指在预处理后,对问句进行敏感词过滤,去停用词、文本纠错、分词处理中的一种或多种,得到问句中的多个关键词。
进一步地,所述计算所述关键词的TF-IDF值的方法包括:
计算所述关键词在知识库中出现的频率,得到词频TF;
将知识库中包含所述关键词问句的数量除以知识库中问句的总数量,得到的商取对数得到逆向文件频率IDF;
所述词频TF乘以所述逆向文件频率IDF得到所述关键词的TF-IDF值。
优选地,所述从知识库中获取关键词,对关键词进行训练得到词向量模型的方法包括:
提取所述知识库各问句中的关键词,得到关键词集合;
使用Word2Vec对所述关键词集合进行训练得到词向量模型。
较佳地,所述对当前问句进行向量化计算得到当前问句向量,利用词向量模型将当前问句向量中的0项词替换成与词向量模型中最相似的词的方法包括:
获取用户当前问句,对问当前问句进行预处理和文本处理提取多个关键词;
计算各所述关键词的TF-IDF值,得到当前问句向量;
使用所述词向量模型搜寻当前问句向量中的0项词,以及匹配所述词向量模型中与所述0项词词义最接近的相似词;
将所述相似词乘以Cosine相似度替换所述0项词;
所述0项词为在当前问句中出现而未在所述词向量模型中出现的关键词。
与现有技术相比,本发明提供的用户意图识别方法具有以下有益效果:
本发明提供的用户意图识别方法中,通过人工整理客服问答语料,整理出用户对商品信息的各种问法,得到针对商品信息提问的各种问句,然后对应的在每个问句上标注意图类别,建立包括用户问句和用户意图的知识库;接着将知识库中的各问句向量化计算并对其进行分类模型训练,得到意图分类模型,通过意图分类模型匹配用户当前问句向量与知识库中的问句向量,进而得到用户当前意图,但是,在实际操作中由于人工整理的问句以及标注的意图类别数据量有限,而用户的问句形式又多种多样,这样就会导致用户换句不换意时,意图分类模型就会因匹配不成功而输出两种截然不同的用户意图,从而降低了对用户意图识别的准确性,因此,为了避免上述情况的发生,本发明通过构建词向量模型,将匹配不成功的当前问句向量中的0项词替换成与词向量模型中最相似的词,进而利用上述意图分类模型根据替换后的问句向量得到当前问句的用户意图。
可见,使用本发明提供的用户意图识别方法,能够将当前问句向量中的0项词(新词)转换为词向量模型中最相似的词进行表达,这样一方面可以提高对用户意图识别的准确性,提高用户的商品搜索体验,另外一方面,还能够减少人工标注问句意图的数据量,使得在有限的意图类别数据量中能够对应更多的客户问句,进而减少了相应的模型训练成本。
本发明的另一方面提供一种用户意图识别系统,应用于权利要求1所述的方法中,其特征在于,包括依次连接的知识库单元、意图训练单元、词向量模型单元、相似词替换单元和意图识别单元;
所述知识库单元用于整理客服问答语料得到知识库,所述知识库包括多个问句和与问句对应的意图类别;
所述意图训练单元用于对各问句向量进行分类模型训练,获取意图分类模型;
所述词向量模型单元用于从所述知识库中获取关键词,并对所述关键词进行训练构建词向量模型;
所述相似词替换单元用于对当前问句进行向量化计算得到当前问句向量,利用所述词向量模型将当前问句向量中的0项词替换成与所述词向量模型中最相似的词;
所述意图识别单元用于计算替换后的问句向量,将替换后的问句向量输入所述意图分类模型,得到当前问句的用户意图。
优选地,所述意图训练单元包括语义向量化计算模块和意图分类模型构建模块,所述语义向量化计算模块的输入端与所述知识库单元的输出端连接,所述语义向量化计算模块和所述意图分类模型构建模块连接,所述意图分类模型构建模块与所述词向量模型单元的输出端连接;
所述语义向量化计算模块用于分别对每个问句进行向量化计算,得到每个问句的向量;
所述意图分类模型构建模块用于利用SVM对每个问句的向量及对应的意图类别进行分类模型训练,获取意图分类模型。
较佳地,所述相似词替换单元包括依次连接的当前问句获取模块、TF-IDF向量化模块、0项词定位匹配模块和相似词替换模块,所述相似词替换模块的输出端与所述意图识别单元的输入端连接;
所述当前问句获取模块用于获取用户当前问句,对问当前问句进行预处理和文本处理提取多个关键词;
所述TF-IDF向量化模块用于计算各所述关键词的TF-IDF值,得到当前问句向量;
所述0项词定位匹配模块用于使用所述词向量模型搜寻当前问句向量中的0项词,以及匹配所述词向量模型中与所述0项词词义最接近的相似词;
所述相似词替换模块用于将所述相似词乘以Cosine相似度替换所述0项词。
与现有技术相比,本发明提供的用户意图识别系统的有益效果与上述技术方案提供的用户意图识别方法的有益效果相同,在此不做赘述。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本发明的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1为本发明实施例一中用户意图识别方法的流程示意图;
图2为图1中替换当前问句向量中的0项词的流程示意图;
图3为本发明实施例二中的用户意图识别系统的结构示意图。
附图标记:
1-知识库单元,2-意图训练单元;
3-词向量模型单元,4-相似词替换单元;
5-意图识别单元。
具体实施方式
为使本发明的上述目的、特征和优点能够更加明显易懂,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述。显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动的前提下所获得的所有其它实施例,均属于本发明保护的范围。
实施例一
图1为本实施例一中用户意图识别方法的流程示意图。请参阅图1,本实施例提供一种用户意图识别系统的方法,包括:
整理客服问答语料得到知识库,知识库包括多个问句和与问句对应的意图类别;
分别对每个问句进行向量化计算,得到每个问句的向量;
对每个问句的向量及对应的意图类别进行分类模型训练,获取意图分类模型;
从知识库中获取关键词,对关键词进行训练构建词向量模型;
对当前问句进行向量化计算得到当前问句向量,利用词向量模型将当前问句向量中的0项词替换成与词向量模型中最相似的词;
计算替换后的问句向量,将替换后的问句向量输入意图分类模型,得到当前问句的用户意图。
本实施例提供的用户意图识别方法中,通过人工整理客服问答语料,整理出用户对商品信息的各种问法,得到针对商品信息提问的各种问句,然后对应的在每个问句上标注意图类别,建立包括用户问句和用户意图的知识库;接着将知识库中的各问句向量化计算并利用SVM训练模型对其进行分类模型训练,得到意图分类模型,通过意图分类模型匹配用户当前问句向量与知识库中的问句向量,进而得到用户当前意图,但是,在实际操作中由于人工整理的问句以及标注的意图类别数据量有限,而用户的问句形式又多种多样,这样就会导致用户换句不换意时,意图分类模型就会因匹配不成功而输出两种截然不同的用户意图,从而降低了对用户意图识别的准确性,因此,为了避免上述情况的发生,本实施例通过构建词向量模型,将匹配不成功的当前问句向量中的0项词替换成与词向量模型中最相似的词,进而利用上述意图分类模型根据替换后的问句向量得到当前问句的用户意图。
可见,使用本实施例提供的用户意图识别方法,能够将当前问句向量中的0项词(新词)转换为词向量模型中最相似的词进行表达,这样一方面可以提高对用户意图识别的准确性,提高用户的商品搜索体验,另外一方面,还能够减少人工标注问句意图的数据量,使得在有限的意图类别数据量中能够对应更多的客户问句,进而减少了相应的模型训练成本。
具体的,本实施例中整理客服问答语料得到知识库的方法包括:从客服问答语料中提取用户对商品信息的各种问法,整理后得到多个问句;对各问句一一进行标注,得到与问句对应的意图类别。
可以理解的是,上述商品信息包括商品参数、颜色、尺寸、功能、价格等,在实际操作的过程中,需从客服问答语料中提取与该商品有关的各种问题得到相关问句并标注该问句的意图类别,示例性地,问句“这件衣服卖多少钱”,则该问句对应意图类别对应标注为“询问衣服价格”,重复上述步骤,在客服问答语料中依次对各商品信息进行提取,得到各种相关问句并对应标注意图类别。
进一步的,本实施例中分别对每个问句进行向量化计算,得到每个问句的向量的方法包括:对问句进行预处理和文本处理以提取问句中的多个关键词;计算各关键词的TF-IDF值,生成问句向量;依次重复上述步骤对其他问句进行计算,得到每个问句的向量。
其中,计算关键词的TF-IDF值的方法包括:计算关键词在知识库中出现的频率,得到词频TF;将知识库中包含关键词问句的数量除以知识库中问句的总数量,得到的商取对数得到逆向文件频率IDF;词频TF乘以逆向文件频率IDF得到关键词的TF-IDF值。
上述对问句进行预处理和文本处理以提取问句中的多个关键词的方法包括:
预处理是指剔除问句中与用户意图无关的内容,包括剔除问句中的特殊字符、表情符号、订单号中的一种或多种;
文本处理是指在预处理后,对问句进行敏感词过滤,去停用词、文本纠错、分词处理中的一种或多种,得到问句中的多个关键词,对于文本处理可采用viterbi方法、HMM方法和CRF方法中的一种或多种。
可以理解的是,本实施中从知识库中获取关键词,并对关键词进行训练得到词向量模型的方法包括:提取知识库各问句中的关键词,得到关键词集合;使用Word2Vec对关键词集合进行训练得到词向量模型。
具体地,请参阅图2,本实施例中对当前问句进行向量化计算得到当前问句向量,利用词向量模型将当前问句向量中的0项词替换成与词向量模型中最相似的词的方法包括:
1、获取用户当前问句,对问当前问句进行预处理和文本处理提取多个关键词;
2、计算各关键词的TF-IDF值,得到当前问句向量;
3、使用词向量模型搜寻当前问句向量中的0项词,以及匹配词向量模型中与0项词词义最接近的相似词;
4、将相似词乘以Cosine相似度替换0项词,所述0项词为在当前问句中出现而未在词向量模型中出现的关键词。
实施例二
请参阅1和图3,本实施例提供了一种用户意图识别系统,包括依次连接的知识库单元1、意图训练单元2、词向量模型单元3、相似词替换单元4和意图识别单元5;
知识库单元1用于整理客服问答语料得到知识库,知识库包括多个问句和与问句对应的意图类别;
意图训练单元2用于对各问句向量进行分类模型训练,获取意图分类模型;
词向量模型单元3用于从知识库中获取关键词,并对关键词进行训练构建词向量模型,示例性的词向量模型单元为Word2Vec程序;
相似词替换单元4用于对当前问句进行向量化计算得到当前问句向量,利用词向量模型将当前问句向量中的0项词替换成与词向量模型中最相似的词;
意图识别单元5用于计算替换后的问句向量,将替换后的问句向量输入意图分类模型,得到当前问句的用户意图。
具体的,本实施中的意图训练单元2包括语义向量化计算模块和意图分类模型构建模块,语义向量化计算模块的输入端与知识库单元1的输出端连接,语义向量化计算模块和意图分类模型构建模块连接,意图分类模型构建模块与词向量模型单元3的输出端连接;
语义向量化计算模块用于分别对每个问句进行向量化计算,得到每个问句的向量;
意图分类模型构建模块用于利用SVM对每个问句的向量及对应的意图类别进行分类模型训练,获取意图分类模型。
优选地,本实施例中的相似词替换单元4包括依次连接的当前问句获取模块、TF-IDF向量化模块、0项词定位匹配模块和相似词替换模块,相似词替换模块的输出端与意图识别单元5的输入端连接;
当前问句获取模块用于获取用户当前问句,对问当前问句进行预处理和文本处理提取多个关键词;
TF-IDF向量化模块用于计算各关键词的TF-IDF值,得到当前问句向量;
0项词定位匹配模块用于使用词向量模型搜寻当前问句向量中的0项词,以及匹配词向量模型中与0项词词义最接近的相似词;
相似词替换模块用于将相似词乘以Cosine相似度替换0项词。
与现有技术相比,本实施例提供的用户意图识别系统的有益效果与上述实施例一提供的用户意图识别方法的有益效果相同,在此不做赘述。
本领域普通技术人员可以理解,实现上述实施例方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,的程序可以存储于计算机可读取存储介质中,该程序在执行时,包括上述实施例方法的各步骤,而所述的存储介质可以是:ROM/RAM、磁碟、光盘、存储卡等。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。
Claims (10)
1.一种用户意图识别方法,其特征在于,包括:
整理客服问答语料得到知识库,所述知识库包括多个问句和与问句对应的意图类别;
分别对每个问句进行向量化计算,得到每个问句的向量;
对每个问句的向量及对应的意图类别进行分类模型训练,获取意图分类模型;
从所述知识库中获取关键词,对所述关键词进行训练构建词向量模型;
对当前问句进行向量化计算得到当前问句向量,利用所述词向量模型将当前问句向量中的0项词替换成与所述词向量模型中最相似的词;
计算替换后的问句向量,将所述替换后的问句向量输入所述意图分类模型,得到当前问句的用户意图。
2.根据权利要求1所述的方法,其特征在于,所述整理客服问答语料得到知识库的方法包括:
从所述客服问答语料中提取用户对商品信息的各种问法,整理后得到多个问句;
对各问句一一进行标注,得到与所述问句对应的意图类别。
3.根据权利要求1所述的方法,其特征在于,所述分别对每个问句进行向量化计算,得到每个问句的向量的方法包括:
对问句进行预处理和文本处理以提取问句中的多个关键词;
计算各关键词的TF-IDF值,生成问句向量;
依次重复上述步骤对其他问句进行计算,得到每个问句的向量。
4.根据权利要求3所述的方法,其特征在于,所述对问句进行预处理和文本处理以提取问句中的多个关键词的方法包括:
所述预处理是指剔除问句中与用户意图无关的内容,包括剔除问句中的特殊字符、表情符号、订单号中的一种或多种;
所述文本处理是指在预处理后,对问句进行敏感词过滤,去停用词、文本纠错、分词处理中的一种或多种,得到问句中的多个关键词。
5.根据权利要求3所述的方法,其特征在于,所述计算所述关键词的TF-IDF值的方法包括:
计算所述关键词在知识库中出现的频率,得到词频TF;
将知识库中包含所述关键词问句的数量除以知识库中问句的总数量,得到的商取对数得到逆向文件频率IDF;
所述词频TF乘以所述逆向文件频率IDF得到所述关键词的TF-IDF值。
6.根据权利要求4所述的方法,其特征在于,所述从知识库中获取关键词,并对关键词进行训练得到词向量模型的方法包括:
提取所述知识库各问句中的关键词,得到关键词集合;
使用Word2Vec对所述关键词集合进行训练得到词向量模型。
7.根据权利要求1所述的方法,其特征在于,所述对当前问句进行向量化计算得到当前问句向量,利用词向量模型将当前问句向量中的0项词替换成与词向量模型中最相似的词的方法包括:
获取用户当前问句,对问当前问句进行预处理和文本处理提取多个关键词;
计算各所述关键词的TF-IDF值,得到当前问句向量;
使用所述词向量模型搜寻当前问句向量中的0项词,以及匹配所述词向量模型中与所述0项词词义最接近的相似词;
将所述相似词乘以Cosine相似度替换所述0项词;
所述0项词为在当前问句中出现而未在所述词向量模型中出现的关键词。
8.一种用户意图识别系统,应用于权利要求1所述的方法中,其特征在于,包括依次连接的知识库单元、意图训练单元、词向量模型单元、相似词替换单元和意图识别单元;
所述知识库单元用于整理客服问答语料得到知识库,所述知识库包括多个问句和与问句对应的意图类别;
所述意图训练单元用于对各问句向量进行分类模型训练,获取意图分类模型;
所述词向量模型单元用于从所述知识库中获取关键词,并对所述关键词进行训练构建词向量模型;
所述相似词替换单元用于对当前问句进行向量化计算得到当前问句向量,利用所述词向量模型将当前问句向量中的0项词替换成与所述词向量模型中最相似的词;
所述意图识别单元用于计算替换后的问句向量,将替换后的问句向量输入所述意图分类模型,得到当前问句的用户意图。
9.根据权利要求8所述的系统,其特征在于,所述意图训练单元包括语义向量化计算模块和意图分类模型构建模块,所述语义向量化计算模块的输入端与所述知识库单元的输出端连接,所述语义向量化计算模块和所述意图分类模型构建模块连接,所述意图分类模型构建模块与所述词向量模型单元的输出端连接;
所述语义向量化计算模块用于分别对每个问句进行向量化计算,得到每个问句的向量;
所述意图分类模型构建模块用于利用SVM对每个问句的向量及对应的意图类别进行分类模型训练,获取意图分类模型。
10.根据权利要求9所述的系统,其特征在于,所述相似词替换单元包括依次连接的当前问句获取模块、TF-IDF向量化模块、0项词定位匹配模块和相似词替换模块,所述相似词替换模块的输出端与所述意图识别单元的输入端连接;
所述当前问句获取模块用于获取用户当前问句,对问当前问句进行预处理和文本处理提取多个关键词;
所述TF-IDF向量化模块用于计算各所述关键词的TF-IDF值,得到当前问句向量;
所述0项词定位匹配模块用于使用所述词向量模型搜寻当前问句向量中的0项词,以及匹配所述词向量模型中与所述0项词词义最接近的相似词;
所述相似词替换模块用于将所述相似词乘以Cosine相似度替换所述0项词。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711364768.7A CN109933779A (zh) | 2017-12-18 | 2017-12-18 | 用户意图识别方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711364768.7A CN109933779A (zh) | 2017-12-18 | 2017-12-18 | 用户意图识别方法及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN109933779A true CN109933779A (zh) | 2019-06-25 |
Family
ID=66982574
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201711364768.7A Pending CN109933779A (zh) | 2017-12-18 | 2017-12-18 | 用户意图识别方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109933779A (zh) |
Cited By (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110837738A (zh) * | 2019-09-24 | 2020-02-25 | 平安科技(深圳)有限公司 | 相似问识别方法、装置、计算机设备及存储介质 |
CN110853649A (zh) * | 2019-11-05 | 2020-02-28 | 集奥聚合(北京)人工智能科技有限公司 | 基于智能语音技术的标签提取方法、系统、设备及介质 |
CN111128156A (zh) * | 2019-12-10 | 2020-05-08 | 上海雷盎云智能技术有限公司 | 基于模型训练的智能家居设备语音控制方法及装置 |
CN111143533A (zh) * | 2019-12-26 | 2020-05-12 | 苏宁金融科技(南京)有限公司 | 一种基于用户行为数据的客服方法及系统 |
CN111177186A (zh) * | 2019-12-20 | 2020-05-19 | 北京淇瑀信息科技有限公司 | 基于问题检索的单句意图识别方法、装置和系统 |
CN111191442A (zh) * | 2019-12-30 | 2020-05-22 | 杭州远传新业科技有限公司 | 相似问题生成方法、装置、设备及介质 |
CN111507085A (zh) * | 2019-11-25 | 2020-08-07 | 江苏艾佳家居用品有限公司 | 句型识别方法 |
CN111552805A (zh) * | 2020-04-16 | 2020-08-18 | 重庆大学 | 一种问答系统问句意图识别方法 |
CN112035598A (zh) * | 2020-11-03 | 2020-12-04 | 北京淇瑀信息科技有限公司 | 一种智能语义检索方法、系统和电子设备 |
WO2021008015A1 (zh) * | 2019-07-18 | 2021-01-21 | 平安科技(深圳)有限公司 | 意图识别方法、设备及计算机可读存储介质 |
CN112818108A (zh) * | 2021-02-24 | 2021-05-18 | 中国人民大学 | 基于形近字的文本语义曲解聊天机器人及其数据处理方法 |
CN112989839A (zh) * | 2019-12-18 | 2021-06-18 | 中国科学院声学研究所 | 一种基于关键词特征嵌入语言模型的意图识别方法及系统 |
CN113032253A (zh) * | 2021-03-18 | 2021-06-25 | 广州虎牙科技有限公司 | 测试数据特征提取方法、测试方法及相关装置 |
CN113223497A (zh) * | 2020-12-10 | 2021-08-06 | 上海雷盎云智能技术有限公司 | 智能语音识别处理方法及系统 |
CN113569578A (zh) * | 2021-08-13 | 2021-10-29 | 上海淇玥信息技术有限公司 | 一种用户意图识别方法、装置和计算机设备 |
CN117093698A (zh) * | 2023-10-19 | 2023-11-21 | 四川蜀天信息技术有限公司 | 基于知识库的对话生成方法、装置、电子设备及存储介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105389307A (zh) * | 2015-12-02 | 2016-03-09 | 上海智臻智能网络科技股份有限公司 | 语句意图类别识别方法及装置 |
CN105989125A (zh) * | 2015-02-16 | 2016-10-05 | 苏宁云商集团股份有限公司 | 对无结果词进行标签识别的搜索方法和系统 |
CN106294358A (zh) * | 2015-05-14 | 2017-01-04 | 北京大学 | 一种信息的检索方法及系统 |
WO2017107566A1 (zh) * | 2015-12-25 | 2017-06-29 | 广州视源电子科技股份有限公司 | 基于词向量相似度的检索方法和系统 |
WO2017181834A1 (zh) * | 2016-04-19 | 2017-10-26 | 中兴通讯股份有限公司 | 一种智能问答方法及装置 |
-
2017
- 2017-12-18 CN CN201711364768.7A patent/CN109933779A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105989125A (zh) * | 2015-02-16 | 2016-10-05 | 苏宁云商集团股份有限公司 | 对无结果词进行标签识别的搜索方法和系统 |
CN106294358A (zh) * | 2015-05-14 | 2017-01-04 | 北京大学 | 一种信息的检索方法及系统 |
CN105389307A (zh) * | 2015-12-02 | 2016-03-09 | 上海智臻智能网络科技股份有限公司 | 语句意图类别识别方法及装置 |
WO2017107566A1 (zh) * | 2015-12-25 | 2017-06-29 | 广州视源电子科技股份有限公司 | 基于词向量相似度的检索方法和系统 |
WO2017181834A1 (zh) * | 2016-04-19 | 2017-10-26 | 中兴通讯股份有限公司 | 一种智能问答方法及装置 |
Non-Patent Citations (2)
Title |
---|
叶正等: "基于问句相似度的中文FAQ问答系统", 《计算机工程与应用》 * |
康海燕等: "基于问句表征的web智能问答系统", 《北京信息科技大学学报(自然科学版)》 * |
Cited By (26)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2021008015A1 (zh) * | 2019-07-18 | 2021-01-21 | 平安科技(深圳)有限公司 | 意图识别方法、设备及计算机可读存储介质 |
CN110837738A (zh) * | 2019-09-24 | 2020-02-25 | 平安科技(深圳)有限公司 | 相似问识别方法、装置、计算机设备及存储介质 |
CN110837738B (zh) * | 2019-09-24 | 2023-06-30 | 平安科技(深圳)有限公司 | 相似问识别方法、装置、计算机设备及存储介质 |
CN110853649A (zh) * | 2019-11-05 | 2020-02-28 | 集奥聚合(北京)人工智能科技有限公司 | 基于智能语音技术的标签提取方法、系统、设备及介质 |
CN111507085B (zh) * | 2019-11-25 | 2023-07-07 | 江苏艾佳家居用品有限公司 | 句型识别方法 |
CN111507085A (zh) * | 2019-11-25 | 2020-08-07 | 江苏艾佳家居用品有限公司 | 句型识别方法 |
CN111128156A (zh) * | 2019-12-10 | 2020-05-08 | 上海雷盎云智能技术有限公司 | 基于模型训练的智能家居设备语音控制方法及装置 |
CN112989839A (zh) * | 2019-12-18 | 2021-06-18 | 中国科学院声学研究所 | 一种基于关键词特征嵌入语言模型的意图识别方法及系统 |
CN111177186B (zh) * | 2019-12-20 | 2024-04-23 | 北京淇瑀信息科技有限公司 | 基于问题检索的单句意图识别方法、装置和系统 |
CN111177186A (zh) * | 2019-12-20 | 2020-05-19 | 北京淇瑀信息科技有限公司 | 基于问题检索的单句意图识别方法、装置和系统 |
CN111143533B (zh) * | 2019-12-26 | 2023-06-30 | 苏宁金融科技(南京)有限公司 | 一种基于用户行为数据的客服方法及系统 |
CN111143533A (zh) * | 2019-12-26 | 2020-05-12 | 苏宁金融科技(南京)有限公司 | 一种基于用户行为数据的客服方法及系统 |
CN111191442A (zh) * | 2019-12-30 | 2020-05-22 | 杭州远传新业科技有限公司 | 相似问题生成方法、装置、设备及介质 |
CN111191442B (zh) * | 2019-12-30 | 2024-02-02 | 杭州远传新业科技股份有限公司 | 相似问题生成方法、装置、设备及介质 |
CN111552805B (zh) * | 2020-04-16 | 2021-07-09 | 重庆大学 | 一种问答系统问句意图识别方法 |
CN111552805A (zh) * | 2020-04-16 | 2020-08-18 | 重庆大学 | 一种问答系统问句意图识别方法 |
CN112035598A (zh) * | 2020-11-03 | 2020-12-04 | 北京淇瑀信息科技有限公司 | 一种智能语义检索方法、系统和电子设备 |
CN113223497A (zh) * | 2020-12-10 | 2021-08-06 | 上海雷盎云智能技术有限公司 | 智能语音识别处理方法及系统 |
CN112818108A (zh) * | 2021-02-24 | 2021-05-18 | 中国人民大学 | 基于形近字的文本语义曲解聊天机器人及其数据处理方法 |
CN112818108B (zh) * | 2021-02-24 | 2023-10-13 | 中国人民大学 | 基于形近字的文本语义曲解聊天机器人及其数据处理方法 |
CN113032253A (zh) * | 2021-03-18 | 2021-06-25 | 广州虎牙科技有限公司 | 测试数据特征提取方法、测试方法及相关装置 |
CN113032253B (zh) * | 2021-03-18 | 2024-04-19 | 广州虎牙科技有限公司 | 测试数据特征提取方法、测试方法及相关装置 |
CN113569578A (zh) * | 2021-08-13 | 2021-10-29 | 上海淇玥信息技术有限公司 | 一种用户意图识别方法、装置和计算机设备 |
CN113569578B (zh) * | 2021-08-13 | 2024-03-08 | 上海淇玥信息技术有限公司 | 一种用户意图识别方法、装置和计算机设备 |
CN117093698B (zh) * | 2023-10-19 | 2024-01-23 | 四川蜀天信息技术有限公司 | 基于知识库的对话生成方法、装置、电子设备及存储介质 |
CN117093698A (zh) * | 2023-10-19 | 2023-11-21 | 四川蜀天信息技术有限公司 | 基于知识库的对话生成方法、装置、电子设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109933779A (zh) | 用户意图识别方法及系统 | |
CN108536852B (zh) | 问答交互方法和装置、计算机设备及计算机可读存储介质 | |
CN103778214B (zh) | 一种基于用户评论的商品属性聚类方法 | |
CN109635117A (zh) | 一种基于知识图谱识别用户意图方法及装置 | |
CN107767195A (zh) | 描述信息的展示系统和展示、生成方法及电子设备 | |
CN105630768A (zh) | 一种基于层叠条件随机场的产品名识别方法及装置 | |
CN108304509B (zh) | 一种基于文本多向量表示相互学习的垃圾评论过滤方法 | |
CN109543012A (zh) | 一种基于Word2Vec和RNN的用户意图识别方法及装置 | |
CN105843796A (zh) | 一种微博情感倾向分析方法及装置 | |
CN109063147A (zh) | 基于文本相似度的在线课程论坛内容推荐方法及系统 | |
CN111797898A (zh) | 一种基于深度语义匹配的在线评论自动回复方法 | |
CN107133282B (zh) | 一种改进的基于双向传播的评价对象识别方法 | |
CN108845986A (zh) | 一种情感分析方法、设备及系统、计算机可读存储介质 | |
CN104778283B (zh) | 一种基于微博的用户职业分类方法及系统 | |
CN105740382A (zh) | 一种对短评论文本进行方面分类方法 | |
CN103377249A (zh) | 关键词投放方法及系统 | |
CN107944911A (zh) | 一种基于文本分析的推荐系统的推荐方法 | |
CN111831810B (zh) | 智能问答方法、装置、设备及存储介质 | |
CN106934006B (zh) | 基于多叉树模型的页面推荐方法及装置 | |
CN109978020A (zh) | 一种基于多维特征的社交网络账号马甲身份辨识方法 | |
CN107895303A (zh) | 一种基于ocean模型的个性化推荐的方法 | |
Lu et al. | A hybrid collaborative filtering algorithm based on KNN and gradient boosting | |
Yao et al. | Online deception detection refueled by real world data collection | |
CN103678548B (zh) | 基于组合模式的失效服务替代推荐方法 | |
Zhang | Application of data mining technology in the analysis of e-commerce emotional law |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20190625 |