CN116775849B - 一种线上问题处理系统及方法 - Google Patents

一种线上问题处理系统及方法 Download PDF

Info

Publication number
CN116775849B
CN116775849B CN202311062019.4A CN202311062019A CN116775849B CN 116775849 B CN116775849 B CN 116775849B CN 202311062019 A CN202311062019 A CN 202311062019A CN 116775849 B CN116775849 B CN 116775849B
Authority
CN
China
Prior art keywords
current query
sentence
query sentence
classification
word
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202311062019.4A
Other languages
English (en)
Other versions
CN116775849A (zh
Inventor
孙晓宇
黄博
刘方琦
张旭林
冯亚东
张翔
江培荣
何永霞
高飞
罗聪国
高小峰
张维攀
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chengdu Yunlitchi Technology Co ltd
Original Assignee
Chengdu Yunlitchi Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chengdu Yunlitchi Technology Co ltd filed Critical Chengdu Yunlitchi Technology Co ltd
Priority to CN202311062019.4A priority Critical patent/CN116775849B/zh
Publication of CN116775849A publication Critical patent/CN116775849A/zh
Application granted granted Critical
Publication of CN116775849B publication Critical patent/CN116775849B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种线上问题处理系统及方法,属于数据处理技术领域,其系统包括问题获取单元、信息分类单元和信息匹配单元;问题获取单元用于采集各个用户的当前询问语句,提取当前询问语句的关键词;信息分类单元用于根据当前询问语句的关键词,确定当前询问语句所属类别;信息匹配单元用于根据当前询问语句所属类别,匹配对应的回答。该线上问题处理系统通过依次构建映射函数和语句分类模型,进行精确分类,不再依赖询问语句的整体信息,从而消除了询问语句中非关键词的干扰,同时也易于用户获取最准确的答案,增加整体系统的回答时效性。

Description

一种线上问题处理系统及方法
技术领域
本发明属于数据处理技术领域,具体涉及一种线上问题处理系统及方法。
背景技术
随着互联网技术的发展,越来越多的用户都会在网络中搜索信息,例如,在网络平台中输入关键信息,网络平台可以对关键信息进行分析,并向用户反馈对应的答案。随着业务的扩大,以及用户使用量的增加,线上问题的反馈变得较为困难,且由于传统线上提问都是通过人工实时回答,容易出现问题收集存在遗漏或者不及时的问题。
发明内容
本发明为了解决上述问题,提出了一种线上问题处理系统及方法。
本发明的技术方案是:一种线上问题处理系统包括问题获取单元、信息分类单元和信息匹配单元;
问题获取单元用于采集各个用户的当前询问语句,提取当前询问语句的关键词;
信息分类单元用于根据当前询问语句的关键词,确定当前询问语句所属类别;
信息匹配单元用于根据当前询问语句所属类别,匹配对应的回答。
本发明的有益效果是:
(1)该线上问题处理系统通过问题获取单元提取当前询问语句的关键词,关键词可用于对询问语句进行准确分类,便于后续步骤根据询问语句所属类别快速匹配对应的回答,提高匹配效率,减少不必要等待时间;
(2)该线上问题处理系统通过依次构建映射函数和语句分类模型,进行精确分类,不再依赖询问语句的整体信息,从而消除了询问语句中非关键词的干扰,同时也易于用户获取最准确的答案,增加整体系统的回答时效性。
进一步地,问题获取单元提取当前询问语句的关键词包括以下步骤:
对用户的当前询问语句进行分词操作,得到若干个单词,生成单词集合;
将所有用户作为用户集合,将用户集合和单词集合作为二分图的点集,生成二分图;用户集合和单词集合互不相交;
构建二分图的步长约束函数;
根据二分图的步长约束函数,在二分图上进行随机游走,确定各个用户节点在每次随机游走中的迭代步长;
提取单词集合中各个单词的TF值和IDF值,分别生成词频特征向量和逆文档特征向量;
计算各个单词的词频特征向量与逆文档特征向量的向量积,将向量积小于迭代步长的单词作为关键词。
通过用户集合和单词集合生成二分图,并构建步长约束函数,对随机游走时的步长进行限定,还可以确定词频特征向量和逆文档特征向量的向量积小于迭代步长的单词,进而作为关键词。
进一步地,二分图的步长约束函数H的表达式为:;式中,m表示二分图中当前询问语句中单词节点数量,n表示二分图中用户节点数量,αn表示第n个用户节点的权重系数,βm表示第m个单词节点的权重系数,ρl表示二分图中第l条边的权值,X表示二分图中用户集合和单词集合之间的加权系数矩阵。
进一步地,用户节点在每次随机游走中的迭代步长s的计算公式为:;式中,H表示二分图的步长约束函数,z表示随机游走的次数,ε表示极小值,T表示每次随机游走的时长。
进一步地,信息分类单元确定当前询问语句所属类别包括以下步骤:
对当前询问语句的关键词进行哈希转换,得到每个关键词的哈希值;
根据当前询问语句中每个关键词的词频特征向量、逆文档特征向量和哈希值,构建当前询问语句的映射函数;
构建语句分类模型,将当前询问语句的映射函数输入至语句分类模型中,确定当前询问语句所属类别。
进一步地,当前询问语句的映射函数G的表达式为:;式中,||·||F表示弗罗贝尼乌斯范数函数,K表示当前询问语句中关键词数量,Yk表示当前询问语句中第k个关键词的词频特征向量,Zk表示当前询问语句中第k个关键词的逆文档特征向量,hk表示当前询问语句中第k个关键词的哈希值,T表示矩阵转置。
进一步地,语句分类模型包括依次连接的输入层、映射层和分类层;
输入层用于将当前询问语句的映射函数输入至语句分类模型中;
映射层用于包括依次连接的特征矩阵生成模块和特征值生成模块;特征矩阵生成模块用于根据当前询问语句的映射函数生成当前询问语句的分类特征矩阵;特征值生成模块用于将分类特征矩阵的矩阵特征值作为当前询问语句的分类特征值。
分类层用于根据当前询问语句的分类特征值确定当前询问语句所属类别。
进一步地,分类特征矩阵A的表达式为:,式中,G表示当前询问语句的映射函数。
进一步地,分类层确定当前询问语句所属类别的具体方法为:获取数据库中各个历史询问语句中关键词的哈希值,将各个历史询问语句中所有关键词的哈希值的均值作为各个历史询问语句的分类值,并将与分类值最接近的历史询问语句所属类别作为当前询问语句所属类别。
基于以上系统,本发明还提出一种线上问题处理方法,包括以下步骤:
采集各个用户的当前询问语句,提取各个用户的当前询问语句的关键词;
根据当前询问语句的关键词,确定当前询问语句所属类别;
根据当前询问语句所属类别,匹配对应的回答。
本发明的有益效果是:该线上问题处理方法可以快速匹配对应的回答,提高匹配效率,减少不必要等待时间,消除了询问语句中非关键词的干扰,同时也易于用户获取最准确的答案,增加整体系统的回答时效性。
附图说明
图1为线上问题处理系统的结构图;
图2为线上问题处理方法的流程图。
具体实施方式
下面结合附图对本发明的实施例作进一步的说明。
如图1所示,本发明提供了一种线上问题处理系统,包括问题获取单元、信息分类单元和信息匹配单元;
问题获取单元用于采集各个用户的当前询问语句,提取当前询问语句的关键词;
信息分类单元用于根据当前询问语句的关键词,确定当前询问语句所属类别;
信息匹配单元用于根据当前询问语句所属类别,匹配对应的回答。
数据库中存储了出现过的所有历史询问语句。
在数据库中,各个历史询问语句包含有对应的回答。在信息匹配单元中,将当前询问语句所属类别的回答作为最终答案,若用户对最终答案不满意,可再次输入询问语句,线上问题处理系统将二次输入的询问语句发送至终端,进行人工答复。
在本发明实施例中,问题获取单元提取当前询问语句的关键词包括以下步骤:
对用户的当前询问语句进行分词操作,得到若干个单词,生成单词集合;
将所有用户作为用户集合,将用户集合和单词集合作为二分图的点集,生成二分图;用户集合和单词集合互不相交;
构建二分图的步长约束函数;
根据二分图的步长约束函数,在二分图上进行随机游走,确定各个用户节点在每次随机游走中的迭代步长;
提取单词集合中各个单词的TF值和IDF值,分别生成词频特征向量和逆文档特征向量;IDF(逆文档频率)是一个词语普遍重要性的度量,它的大小与一个词的常见程度成反比,计算方法是语料库的文档总数除以语料库中包含该词语的文档数量,再将得到的商取对数。
计算各个单词的词频特征向量与逆文档特征向量的向量积,将向量积小于迭代步长的单词作为关键词。
通过用户集合和单词集合生成二分图,并构建步长约束函数,对随机游走时的步长进行限定,还可以确定词频特征向量和逆文档特征向量的向量积小于迭代步长的单词,进而作为关键词。
在本发明实施例中,二分图的步长约束函数H的表达式为:;式中,m表示二分图中当前询问语句中单词节点数量,n表示二分图中用户节点数量,αn表示第n个用户节点的权重系数,βm表示第m个单词节点的权重系数,ρl表示二分图中第l条边的权值,X表示二分图中用户集合和单词集合之间的加权系数矩阵。
用户节点的权重系数和单词节点的权重系数可以随机设定,且所有用户节点的权重系数之和为1,在一条当前询问语句中所有单词节点的权重系数之和为1。
在本发明实施例中,用户节点在每次随机游走中的迭代步长s的计算公式为:;式中,H表示二分图的步长约束函数,z表示随机游走的次数,ε表示极小值,T表示每次随机游走的时长。
在本发明实施例中,信息分类单元确定当前询问语句所属类别包括以下步骤:
对当前询问语句的关键词进行哈希转换,得到每个关键词的哈希值;哈希算法可以将任意长度的信息转换成一个固定长度的数据;可以采用字符串哈希函数生成哈希值,让同一个类的对象按照自己不同的特征尽量的有不同的哈希值。
根据当前询问语句中每个关键词的词频特征向量、逆文档特征向量和哈希值,构建当前询问语句的映射函数;
构建语句分类模型,将当前询问语句的映射函数输入至语句分类模型中,确定当前询问语句所属类别。
生成关键词的哈希值可以提高后续映射函数输入语句分类模型时的识别效率。语句分类模型采用三层,映射层生成的分类特征值可用于与历史询问语句进行大小值比较,将特征值最接近的历史询问语句所属类别作为当前询问语句的所属类别,语句分类模型充分考虑历史数据的影响,可最大程度丰富特征值,保证分类准确。
在本发明实施例中,当前询问语句的映射函数G的表达式为:;式中,||·||F表示弗罗贝尼乌斯范数函数,K表示当前询问语句中关键词数量,Yk表示当前询问语句中第k个关键词的词频特征向量,Zk表示当前询问语句中第k个关键词的逆文档特征向量,hk表示当前询问语句中第k个关键词的哈希值,T表示矩阵转置。
在本发明实施例中,语句分类模型包括依次连接的输入层、映射层和分类层;
输入层用于将当前询问语句的映射函数输入至语句分类模型中;
映射层用于包括依次连接的特征矩阵生成模块和特征值生成模块;特征矩阵生成模块用于根据当前询问语句的映射函数生成当前询问语句的分类特征矩阵;特征值生成模块用于将分类特征矩阵的矩阵特征值作为当前询问语句的分类特征值。
分类层用于根据当前询问语句的分类特征值确定当前询问语句所属类别。
在本发明实施例中,分类特征矩阵A的表达式为:,式中,G表示当前询问语句的映射函数。
在本发明实施例中,分类层确定当前询问语句所属类别的具体方法为:获取数据库中各个历史询问语句中关键词的哈希值,将各个历史询问语句中所有关键词的哈希值的均值作为各个历史询问语句的分类值,并将与分类值最接近的历史询问语句所属类别作为当前询问语句所属类别。
数据库中存储了历史询问语句,在数据库中,各个历史询问语句包含的信息有:关键词、关键词的哈希值以及对应的回答。所以将当前询问语句的分类特征值与历史询问语句的分类值进行匹配,其分类精度高。
基于以上系统,本发明还提出一种线上问题处理方法,如图2所示,包括以下步骤:
采集各个用户的当前询问语句,提取各个用户的当前询问语句的关键词;
根据当前询问语句的关键词,确定当前询问语句所属类别;
根据当前询问语句所属类别,匹配对应的回答。
本领域的普通技术人员将会意识到,这里所述的实施例是为了帮助读者理解本发明的原理,应被理解为本发明的保护范围并不局限于这样的特别陈述和实施例。本领域的普通技术人员可以根据本发明公开的这些技术启示做出各种不脱离本发明实质的其它各种具体变形和组合,这些变形和组合仍然在本发明的保护范围内。

Claims (8)

1.一种线上问题处理系统,其特征在于,包括问题获取单元、信息分类单元和信息匹配单元;
所述问题获取单元用于采集各个用户的当前询问语句,提取当前询问语句的关键词;
所述信息分类单元用于根据当前询问语句的关键词,确定当前询问语句所属类别;
所述信息匹配单元用于根据当前询问语句所属类别,匹配对应的回答;
所述问题获取单元提取当前询问语句的关键词包括以下步骤:
对用户的当前询问语句进行分词操作,得到若干个单词,生成单词集合;
将所有用户作为用户集合,将用户集合和单词集合作为二分图的点集,生成二分图;
构建二分图的步长约束函数;
根据二分图的步长约束函数,在二分图上进行随机游走,确定各个用户节点在每次随机游走中的迭代步长;
提取单词集合中各个单词的TF值和IDF值,分别生成词频特征向量和逆文档特征向量;
计算各个单词的词频特征向量与逆文档特征向量的向量积,将向量积小于迭代步长的单词作为关键词;
所述信息分类单元确定当前询问语句所属类别包括以下步骤:
对当前询问语句的关键词进行哈希转换,得到每个关键词的哈希值;
根据当前询问语句中每个关键词的词频特征向量、逆文档特征向量和哈希值,构建当前询问语句的映射函数;
构建语句分类模型,将当前询问语句的映射函数输入至语句分类模型中,确定当前询问语句所属类别。
2.根据权利要求1所述的线上问题处理系统,其特征在于,所述二分图的步长约束函数H的表达式为:
;式中,m表示二分图中当前询问语句中单词节点数量,n表示二分图中用户节点数量,αn表示第n个用户节点的权重系数,βm表示第m个单词节点的权重系数,ρl表示二分图中第l条边的权值,X表示二分图中用户集合和单词集合之间的加权系数矩阵。
3.根据权利要求1所述的线上问题处理系统,其特征在于,所述用户节点在每次随机游走中的迭代步长s的计算公式为:
;式中,H表示二分图的步长约束函数,z表示随机游走的次数,ε表示极小值,T表示每次随机游走的时长。
4.根据权利要求1所述的线上问题处理系统,其特征在于,所述当前询问语句的映射函数G的表达式为:
;式中,||·||F表示弗罗贝尼乌斯范数函数,K表示当前询问语句中关键词数量,Yk表示当前询问语句中第k个关键词的词频特征向量,Zk表示当前询问语句中第k个关键词的逆文档特征向量,hk表示当前询问语句中第k个关键词的哈希值,T表示矩阵转置。
5.根据权利要求1所述的线上问题处理系统,其特征在于,所述语句分类模型包括依次连接的输入层、映射层和分类层;
所述输入层用于将当前询问语句的映射函数输入至语句分类模型中;
所述映射层用于包括依次连接的特征矩阵生成模块和特征值生成模块;所述特征矩阵生成模块用于根据当前询问语句的映射函数生成当前询问语句的分类特征矩阵;所述特征值生成模块用于将分类特征矩阵的矩阵特征值作为当前询问语句的分类特征值;
所述分类层用于根据当前询问语句的分类特征值确定当前询问语句所属类别。
6.根据权利要求5所述的线上问题处理系统,其特征在于,所述分类特征矩阵A的表达式为:
,式中,G表示当前询问语句的映射函数。
7.根据权利要求5所述的线上问题处理系统,其特征在于,所述分类层确定当前询问语句所属类别的具体方法为:获取数据库中各个历史询问语句中关键词的哈希值,将各个历史询问语句中所有关键词的哈希值的均值作为各个历史询问语句的分类值,并将与分类值最接近的历史询问语句所属类别作为当前询问语句所属类别。
8.一种线上问题处理方法,其特征在于,包括以下步骤:
采集各个用户的当前询问语句,提取各个用户的当前询问语句的关键词;
根据当前询问语句的关键词,确定当前询问语句所属类别;
根据当前询问语句所属类别,匹配对应的回答;
所述线上问题处理方法基于线上问题处理系统实现,所述系统包括问题获取单元、信息分类单元和信息匹配单元;
所述问题获取单元用于采集各个用户的当前询问语句,提取当前询问语句的关键词;
所述信息分类单元用于根据当前询问语句的关键词,确定当前询问语句所属类别;
所述信息匹配单元用于根据当前询问语句所属类别,匹配对应的回答;
所述问题获取单元提取当前询问语句的关键词包括以下步骤:
对用户的当前询问语句进行分词操作,得到若干个单词,生成单词集合;
将所有用户作为用户集合,将用户集合和单词集合作为二分图的点集,生成二分图;
构建二分图的步长约束函数;
根据二分图的步长约束函数,在二分图上进行随机游走,确定各个用户节点在每次随机游走中的迭代步长;
提取单词集合中各个单词的TF值和IDF值,分别生成词频特征向量和逆文档特征向量;
计算各个单词的词频特征向量与逆文档特征向量的向量积,将向量积小于迭代步长的单词作为关键词;
所述信息分类单元确定当前询问语句所属类别包括以下步骤:
对当前询问语句的关键词进行哈希转换,得到每个关键词的哈希值;
根据当前询问语句中每个关键词的词频特征向量、逆文档特征向量和哈希值,构建当前询问语句的映射函数;
构建语句分类模型,将当前询问语句的映射函数输入至语句分类模型中,确定当前询问语句所属类别。
CN202311062019.4A 2023-08-23 2023-08-23 一种线上问题处理系统及方法 Active CN116775849B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311062019.4A CN116775849B (zh) 2023-08-23 2023-08-23 一种线上问题处理系统及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311062019.4A CN116775849B (zh) 2023-08-23 2023-08-23 一种线上问题处理系统及方法

Publications (2)

Publication Number Publication Date
CN116775849A CN116775849A (zh) 2023-09-19
CN116775849B true CN116775849B (zh) 2023-10-24

Family

ID=87991661

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311062019.4A Active CN116775849B (zh) 2023-08-23 2023-08-23 一种线上问题处理系统及方法

Country Status (1)

Country Link
CN (1) CN116775849B (zh)

Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103092973A (zh) * 2013-01-24 2013-05-08 浪潮(北京)电子信息产业有限公司 信息抽取方法和装置
CN103441924A (zh) * 2013-09-03 2013-12-11 盈世信息科技(北京)有限公司 一种基于短文本的垃圾邮件过滤方法及装置
CN104408153A (zh) * 2014-12-03 2015-03-11 中国科学院自动化研究所 一种基于多粒度主题模型的短文本哈希学习方法
CN106126828A (zh) * 2016-06-28 2016-11-16 北京大学 一种基于单向游走的高可扩展性SimRank计算方法
CN110083683A (zh) * 2019-04-22 2019-08-02 上海理工大学 基于随机游走的实体语义标注方法
CN110110130A (zh) * 2019-05-21 2019-08-09 山东财经大学 基于卷积特征与加权随机游走的个性化标签推荐方法及系统
CN110175224A (zh) * 2019-06-03 2019-08-27 安徽大学 基于语义链接异构信息网络嵌入的专利推荐方法及装置
CN110597267A (zh) * 2019-09-27 2019-12-20 长安大学 一种足式机器人的局部最优落足点选取方法
CN112100344A (zh) * 2020-08-18 2020-12-18 淮阴工学院 一种基于知识图谱的金融领域知识问答方法
CN113412492A (zh) * 2019-02-12 2021-09-17 微软技术许可有限责任公司 用于量子玻尔兹曼机的监督训练的量子算法
CN114065758A (zh) * 2021-11-22 2022-02-18 杭州师范大学 一种基于超图随机游走的文档关键词抽取方法
CN116311215A (zh) * 2023-05-22 2023-06-23 成都运荔枝科技有限公司 一种车牌识别方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20170161375A1 (en) * 2015-12-07 2017-06-08 Adlib Publishing Systems Inc. Clustering documents based on textual content

Patent Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103092973A (zh) * 2013-01-24 2013-05-08 浪潮(北京)电子信息产业有限公司 信息抽取方法和装置
CN103441924A (zh) * 2013-09-03 2013-12-11 盈世信息科技(北京)有限公司 一种基于短文本的垃圾邮件过滤方法及装置
CN104408153A (zh) * 2014-12-03 2015-03-11 中国科学院自动化研究所 一种基于多粒度主题模型的短文本哈希学习方法
CN106126828A (zh) * 2016-06-28 2016-11-16 北京大学 一种基于单向游走的高可扩展性SimRank计算方法
CN113412492A (zh) * 2019-02-12 2021-09-17 微软技术许可有限责任公司 用于量子玻尔兹曼机的监督训练的量子算法
CN110083683A (zh) * 2019-04-22 2019-08-02 上海理工大学 基于随机游走的实体语义标注方法
CN110110130A (zh) * 2019-05-21 2019-08-09 山东财经大学 基于卷积特征与加权随机游走的个性化标签推荐方法及系统
CN110175224A (zh) * 2019-06-03 2019-08-27 安徽大学 基于语义链接异构信息网络嵌入的专利推荐方法及装置
CN110597267A (zh) * 2019-09-27 2019-12-20 长安大学 一种足式机器人的局部最优落足点选取方法
CN112100344A (zh) * 2020-08-18 2020-12-18 淮阴工学院 一种基于知识图谱的金融领域知识问答方法
CN114065758A (zh) * 2021-11-22 2022-02-18 杭州师范大学 一种基于超图随机游走的文档关键词抽取方法
CN116311215A (zh) * 2023-05-22 2023-06-23 成都运荔枝科技有限公司 一种车牌识别方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
基于用户意图识别的查询推荐研究;罗成 等;《中文信息学报》;第28卷(第01期);64-72 *

Also Published As

Publication number Publication date
CN116775849A (zh) 2023-09-19

Similar Documents

Publication Publication Date Title
CN111930887B (zh) 基于联合训练方式的多文档多答案机器阅读理解系统
CN108920720A (zh) 基于深度哈希和gpu加速的大规模图像检索方法
CN106991127B (zh) 一种基于拓扑特征扩展的知识主题短文本层次分类方法
CN111767725B (zh) 一种基于情感极性分析模型的数据处理方法及装置
CN108519971B (zh) 一种基于平行语料库的跨语种新闻主题相似性对比方法
CN110175221B (zh) 利用词向量结合机器学习的垃圾短信识别方法
CN110580281A (zh) 一种基于语义相似度的相似案件匹配方法
CN107329954B (zh) 一种基于文档内容和相互关系的主题检测方法
CN110222192A (zh) 语料库建立方法及装置
CN110866102A (zh) 检索处理方法
CN116150335A (zh) 一种军事场景下文本语义检索方法
CN111581364B (zh) 一种面向医疗领域的中文智能问答短文本相似度计算方法
CN113821635A (zh) 一种用于金融领域的文本摘要的生成方法及系统
CN112860898B (zh) 一种短文本框聚类方法、系统、设备及存储介质
CN116028722B (zh) 一种基于词向量的岗位推荐方法、装置及计算机设备
CN116775849B (zh) 一种线上问题处理系统及方法
CN115203589A (zh) 基于Trans-dssm模型的向量搜索方法及系统
CN111061939B (zh) 基于深度学习的科研学术新闻关键字匹配推荐方法
Feng et al. Forest-based deep recommender
Zuo et al. A tag-aware recommendation algorithm based on deep learning and multi-objective optimization
Saikia Enhancing Expertise Identifcation in Community Question Answering Systems (CQA) Using a Hybrid Approach of TRIE and Semantic Matching Algorithms
CN115409135B (zh) 一种网络业务文档的分类管理方法
CN116738035B (zh) 一种基于窗口滑动的推荐重排方法
CN108763206B (zh) 一种对单文本关键字进行快速排序的方法
Sridevi et al. Doc-To-Tokens based Pre-Processing in Information Retrieval System

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant