CN112541069A - 一种结合关键词的文本匹配方法、系统、终端及存储介质 - Google Patents

一种结合关键词的文本匹配方法、系统、终端及存储介质 Download PDF

Info

Publication number
CN112541069A
CN112541069A CN202011549920.0A CN202011549920A CN112541069A CN 112541069 A CN112541069 A CN 112541069A CN 202011549920 A CN202011549920 A CN 202011549920A CN 112541069 A CN112541069 A CN 112541069A
Authority
CN
China
Prior art keywords
question
text
answer
matching
answer text
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011549920.0A
Other languages
English (en)
Inventor
马磊
袁峰
郭伟
侯钧译
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
SHANDONG SHANDA OUMA SOFTWARE CO Ltd
Original Assignee
SHANDONG SHANDA OUMA SOFTWARE CO Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by SHANDONG SHANDA OUMA SOFTWARE CO Ltd filed Critical SHANDONG SHANDA OUMA SOFTWARE CO Ltd
Priority to CN202011549920.0A priority Critical patent/CN112541069A/zh
Publication of CN112541069A publication Critical patent/CN112541069A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3344Query execution using natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/284Lexical analysis, e.g. tokenisation or collocates

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Mathematical Physics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供一种结合关键词的文本匹配方法、系统、终端及存储介质,包括:将问答文件标记特征参数后保存至问答文本库,所述特征参数包括关键词和词频;将用户输入的搜索文本按语义划分为多个分词,并计算所述搜索文本的分词搜索词频;利用余弦相似度算法计算所述搜索文本的分词和分词搜索词频与问答文本库中问答文件的关键词和词频的相似度;筛选出相似度最高的问答文本作为搜索结果输出。本发明通过预先构建问答文本库,并利用余弦相似度计算方法实现对用户搜索内容的快速匹配,同时还能够实现问答文本的自动推送。本发明针对文本匹配问题提供了简单易行的方法,开发成本低。

Description

一种结合关键词的文本匹配方法、系统、终端及存储介质
技术领域
本发明涉及问答推荐技术领域,具体涉及一种结合关键词的文本匹配方法、系统、终端及存储介质。
背景技术
着信息技术和互联网的发展,人们逐渐从信息匮乏的时代走入了信息过载(information overload)的时代。在这个时代,无论是信息消费者还是信息生产者都遇到了很大的挑战:作为信息消费者,如何从大量信息中找到自己感兴趣的信息是一件非常困难的事情;作为信息生产者,如何让自己生产的信息脱颖而出,受到广大用户的关注,也是一件非常困难的事情。推荐系统就是解决这一矛盾的重要工具。推荐系统的任务就是联系用户和信息,一方面帮助用户发现对自己有价值的信息,另一方面让信息能够展现在对它感兴趣的用户面前,从而实现信息消费者和信息生产者的双赢。
近年来,随着信息技术的普及以及网络技术的快速发展,教育信息化和考试信息化的水平得到极大提升,同时随着无纸化考试与线上考试报名深入普及和快速拓展,成为多数考试、报名的主选方式,咨询答疑相关的问题数量也随之提高,传统的电话答疑过程在面临不同考试、不同考生、不同情况下存在资源浪费、效率不高等问题。
目前推荐算法大多应用于喜好程度推荐程序,例如商品、音乐、电影的个性化推荐等,且现有的推荐算法大多比较复杂,开发难度大成本高。
发明内容
针对现有技术的上述不足,本发明提供一种结合关键词的文本匹配方法、系统、终端及存储介质,以解决上述技术问题。
第一方面,本发明提供一种结合关键词的文本匹配方法,包括:
将问答文件标记特征参数后保存至问答文本库,所述特征参数包括关键词和词频;
将用户输入的搜索文本按语义划分为多个分词,并计算所述搜索文本的分词搜索词频;
利用余弦相似度算法计算所述搜索文本的分词和分词搜索词频与问答文本库中问答文件的关键词和词频的相似度;
筛选出相似度最高的问答文本作为搜索结果输出。
进一步的,所述将问答文件标记特征参数后保存至问答文本库,包括:
将问题文本和解答文本标记编号、考试类型编号、用户匹配频率、匹配关键词、相似度匹配率及匹配数量后成对保存至所述问答文本库。
进一步的,所述方法还包括:
记录问答文本和解答文本的用户匹配次数,并根据所述用户匹配次数更新问答文本和解答文本的用户匹配频率;
根据用户匹配频率由大到小对问答文本库内的所有问答文本和解答文本对进行排序;
向用户推送排序靠前的问答文本和解答文本对。
进一步的,所述将用户输入的搜索文本按语义划分为多个分词,并计算所述搜索文本的分词搜索词频,包括:
对所述搜索文本按动词、名词标准分割为不同分词,
分割完毕后统计各分词出现频率,作为各分词的搜索词频。
进一步的,所述筛选出相似度最高的问答文本作为搜索结果输出,包括:
存储每一次匹配的相似度进行并按相似度大小进行问答文本排序,将相似度最高的问答文本返回。
第二方面,本发明提供一种结合关键词的文本匹配系统,包括:
文件保存单元,配置用于将问答文件标记特征参数后保存至问答文本库,所述特征参数包括关键词和词频;
分词执行单元,配置用于将用户输入的搜索文本按语义划分为多个分词,并计算所述搜索文本的分词搜索词频;
相似计算单元,配置用于利用余弦相似度算法计算所述搜索文本的分词和分词搜索词频与问答文本库中问答文件的关键词和词频的相似度;
结果输出单元,配置用于筛选出相似度最高的问答文本作为搜索结果输出。
进一步的,所述文件保存单元包括:
保存模块,配置用于将问题文本和解答文本标记编号、考试类型编号、用户匹配频率、匹配关键词、相似度匹配率及匹配数量后成对保存至所述问答文本库。
进一步的,所述系统还包括:
频率更新模块,配置用于记录问答文本和解答文本的用户匹配次数,并根据所述用户匹配次数更新问答文本和解答文本的用户匹配频率;
频率排序模块,配置用于根据用户匹配频率由大到小对问答文本库内的所有问答文本和解答文本对进行排序;
文本推送模块,配置用于向用户推送排序靠前的问答文本和解答文本对。
第三方面,提供一种终端,包括:
处理器、存储器,其中,
该存储器用于存储计算机程序,
该处理器用于从存储器中调用并运行该计算机程序,使得终端执行上述的终端的方法。
第四方面,提供了一种计算机存储介质,所述计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述各方面所述的方法。
本发明的有益效果在于,
本发明提供的结合关键词的文本匹配方法、系统、终端及存储介质,通过预先构建问答文本库,并利用余弦相似度计算方法实现对用户搜索内容的快速匹配,同时还能够实现问答文本的自动推送。本发明针对文本匹配问题提供了简单易行的方法,开发成本低。
此外,本发明设计原理可靠,结构简单,具有非常广泛的应用前景。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明一个实施例的方法的示意性流程图。
图2是本发明一个实施例的方法的另一示意性流程图。
图3是本发明一个实施例的系统的示意性框图。
图4为本发明实施例提供的一种终端的结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本发明中的技术方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
图1是本发明一个实施例的方法的示意性流程图。其中,图1执行主体可以为一种结合关键词的文本匹配系统。
如图1所示,该方法包括:
步骤110,将问答文件标记特征参数后保存至问答文本库,所述特征参数包括关键词和词频;
步骤120,将用户输入的搜索文本按语义划分为多个分词,并计算所述搜索文本的分词搜索词频;
步骤130,利用余弦相似度算法计算所述搜索文本的分词和分词搜索词频与问答文本库中问答文件的关键词和词频的相似度;
步骤140,筛选出相似度最高的问答文本作为搜索结果输出。
具体的,请参考图2,所述结合关键词的文本匹配方法包括:
S1、问答文本库的建设
问答文本库字段构成:编号、考试类型编号、问题类型编号、问题文本、解答文本、用户匹配频率、匹配关键词、相似度匹配率及匹配数量等。
(1)相似度匹配率是决定问题答疑匹配准确性的一个重要指标参数,它和匹配数量共同影响并决定用户单次问题匹配的回馈情况。经过实践,问题文本的相似度匹配率在0.6-0.8之间比较合适。
(2)匹配关键词是问题答疑匹配对可随时附加的关键词,系统可根据问题所带有关键词进行直接匹配,在文本相似度的基础上使得用户可根据关键词匹配到相应问题的解答情况。
S2、管理系统录入问答文本匹配库
系统管理人员可在文本匹配库中添加问题-答案对,用于客户端的自助机器人的自动问答,每一个问答对都将统计用户的点击率,点击率高的问答对将会作为热门问题优先对用户进行推送。
S3按语义分词并计算词频
对用户输入文本按词义进行分词,将一段文本按动词、名字等标准分割为不同词段,分割完毕后对此段进行出现频率计算,得到用户输入文本中不同词义的词语和相应词语出现的词频,处理完毕后再对系统内问答文本库进行通用处理,获取到匹配与被匹配的两部分词段与词频。
S4、利用余弦相似度算法计算所述搜索文本的分词和分词搜索词频与问答文本库中问答文件的关键词和词频的相似度。
首先将搜索文本的分词和分词搜索词频作为向量a,将问答文本库中目标问答文件的关键词和词频作为向量b。
余弦相似度通过测量两个向量的夹角的余弦值来度量它们之间的相似性。0度角的余弦值是1,而其他任何角度的余弦值都不大于1;并且其最小值是-1。从而两个向量之间的角度的余弦值确定两个向量是否大致指向相同的方向。两个向量有相同的指向时,余弦相似度的值为1;两个向量夹角为90°时,余弦相似度的值为0;两个向量指向完全相反的方向时,余弦相似度的值为-1。
以二维空间为例,假设有a和b两个向量,要计算它们的夹角θ。根据余弦定理可以用下面的公式求得:
Figure BDA0002856864040000071
假定a向量是[x1,y1],b向量是[x2,y2],那么可以将余弦定理改写成下面的形式:
Figure BDA0002856864040000072
两个向量间的余弦值可以通过使用欧几里得点积公式求出:
a·b=||a||||b||cosθ
给定两个属性向量,A和B,其余弦相似性θ由点积和向量长度给出,如下所示:
Figure BDA0002856864040000073
这里的Ai,Bi分别代表向量A和B的各分量即文本中的词频向量。使用这个公式,我们就可以得到,句子A与句子B的夹角的余弦:
Figure BDA0002856864040000074
余弦值越接近1,就表明夹角越接近0度,也就是两个向量越相似,这就叫"余弦相似度"。
S5、筛选出相似度最高的问答文本作为搜索结果输出。
在将用户输入文本与系统问答文本库完成余弦相似度匹配计算之后,将每一次匹配的相似度进行存储、排序,将相似度较高的问答文本进行返回,完成根据语义分析的文本匹配。
如图3所示,该系统300包括:
文件保存单元310,配置用于将问答文件标记特征参数后保存至问答文本库,所述特征参数包括关键词和词频;
分词执行单元320,配置用于将用户输入的搜索文本按语义划分为多个分词,并计算所述搜索文本的分词搜索词频;
相似计算单元330,配置用于利用余弦相似度算法计算所述搜索文本的分词和分词搜索词频与问答文本库中问答文件的关键词和词频的相似度;
结果输出单元340,配置用于筛选出相似度最高的问答文本作为搜索结果输出。
可选地,作为本发明一个实施例,所述文件保存单元包括:
保存模块,配置用于将问题文本和解答文本标记编号、考试类型编号、用户匹配频率、匹配关键词、相似度匹配率及匹配数量后成对保存至所述问答文本库。
可选地,作为本发明一个实施例,所述系统还包括:
频率更新模块,配置用于记录问答文本和解答文本的用户匹配次数,并根据所述用户匹配次数更新问答文本和解答文本的用户匹配频率;
频率排序模块,配置用于根据用户匹配频率由大到小对问答文本库内的所有问答文本和解答文本对进行排序;
文本推送模块,配置用于向用户推送排序靠前的问答文本和解答文本对。
图4为本发明实施例提供的一种终端400的结构示意图,该终端400可以用于执行本发明实施例提供的结合关键词的文本匹配方法。
其中,该终端400可以包括:处理器410、存储器420及通信单元430。这些组件通过一条或多条总线进行通信,本领域技术人员可以理解,图中示出的服务器的结构并不构成对本发明的限定,它既可以是总线形结构,也可以是星型结构,还可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
其中,该存储器420可以用于存储处理器410的执行指令,存储器420可以由任何类型的易失性或非易失性存储终端或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。当存储器420中的执行指令由处理器410执行时,使得终端400能够执行以下上述方法实施例中的部分或全部步骤。
处理器410为存储终端的控制中心,利用各种接口和线路连接整个电子终端的各个部分,通过运行或执行存储在存储器420内的软件程序和/或模块,以及调用存储在存储器内的数据,以执行电子终端的各种功能和/或处理数据。所述处理器可以由集成电路(Integrated Circuit,简称IC)组成,例如可以由单颗封装的IC所组成,也可以由连接多颗相同功能或不同功能的封装IC而组成。举例来说,处理器410可以仅包括中央处理器(Central Processing Unit,简称CPU)。在本发明实施方式中,CPU可以是单运算核心,也可以包括多运算核心。
通信单元430,用于建立通信信道,从而使所述存储终端可以与其它终端进行通信。接收其他终端发送的用户数据或者向其他终端发送用户数据。
本发明还提供一种计算机存储介质,其中,该计算机存储介质可存储有程序,该程序执行时可包括本发明提供的各实施例中的部分或全部步骤。所述的存储介质可为磁碟、光盘、只读存储记忆体(英文:read-only memory,简称:ROM)或随机存储记忆体(英文:random access memory,简称:RAM)等。
因此,本发明通过预先构建问答文本库,并利用余弦相似度计算方法实现对用户搜索内容的快速匹配,同时还能够实现问答文本的自动推送。本发明针对文本匹配问题提供了简单易行的方法,开发成本低,本实施例所能达到的技术效果可以参见上文中的描述,此处不再赘述。
本领域的技术人员可以清楚地了解到本发明实施例中的技术可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解,本发明实施例中的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中如U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质,包括若干指令用以使得一台计算机终端(可以是个人计算机,服务器,或者第二终端、网络终端等)执行本发明各个实施例所述方法的全部或部分步骤。
本说明书中各个实施例之间相同相似的部分互相参见即可。尤其,对于终端实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例中的说明即可。
在本发明所提供的几个实施例中,应该理解到,所揭露的系统和方法,可以通过其它的方式实现。例如,以上所描述的系统实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,系统或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
尽管通过参考附图并结合优选实施例的方式对本发明进行了详细描述,但本发明并不限于此。在不脱离本发明的精神和实质的前提下,本领域普通技术人员可以对本发明的实施例进行各种等效的修改或替换,而这些修改或替换都应在本发明的涵盖范围内/任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应所述以权利要求的保护范围为准。

Claims (10)

1.一种结合关键词的文本匹配方法,其特征在于,包括:
将问答文件标记特征参数后保存至问答文本库,所述特征参数包括关键词和词频;
将用户输入的搜索文本按语义划分为多个分词,并计算所述搜索文本的分词搜索词频;
利用余弦相似度算法计算所述搜索文本的分词和分词搜索词频与问答文本库中问答文件的关键词和词频的相似度;
筛选出相似度最高的问答文本作为搜索结果输出。
2.根据权利要求1所述的方法,其特征在于,所述将问答文件标记特征参数后保存至问答文本库,包括:
将问题文本和解答文本标记编号、考试类型编号、用户匹配频率、匹配关键词、相似度匹配率及匹配数量后成对保存至所述问答文本库。
3.根据权利要求2所述的方法,其特征在于,所述方法还包括:
记录问答文本和解答文本的用户匹配次数,并根据所述用户匹配次数更新问答文本和解答文本的用户匹配频率;
根据用户匹配频率由大到小对问答文本库内的所有问答文本和解答文本对进行排序;
向用户推送排序靠前的问答文本和解答文本对。
4.根据权利要求1所述的方法,其特征在于,所述将用户输入的搜索文本按语义划分为多个分词,并计算所述搜索文本的分词搜索词频,包括:
对所述搜索文本按动词、名词标准分割为不同分词,
分割完毕后统计各分词出现频率,作为各分词的搜索词频。
5.根据权利要求1所述的方法,其特征在于,所述筛选出相似度最高的问答文本作为搜索结果输出,包括:
存储每一次匹配的相似度进行并按相似度大小进行问答文本排序,将相似度最高的问答文本返回。
6.一种结合关键词的文本匹配系统,其特征在于,包括:
文件保存单元,配置用于将问答文件标记特征参数后保存至问答文本库,所述特征参数包括关键词和词频;
分词执行单元,配置用于将用户输入的搜索文本按语义划分为多个分词,并计算所述搜索文本的分词搜索词频;
相似计算单元,配置用于利用余弦相似度算法计算所述搜索文本的分词和分词搜索词频与问答文本库中问答文件的关键词和词频的相似度;
结果输出单元,配置用于筛选出相似度最高的问答文本作为搜索结果输出。
7.根据权利要求6所述的系统,其特征在于,所述文件保存单元包括:
保存模块,配置用于将问题文本和解答文本标记编号、考试类型编号、用户匹配频率、匹配关键词、相似度匹配率及匹配数量后成对保存至所述问答文本库。
8.根据权利要求7所述的系统,其特征在于,所述系统还包括:
频率更新模块,配置用于记录问答文本和解答文本的用户匹配次数,并根据所述用户匹配次数更新问答文本和解答文本的用户匹配频率;
频率排序模块,配置用于根据用户匹配频率由大到小对问答文本库内的所有问答文本和解答文本对进行排序;
文本推送模块,配置用于向用户推送排序靠前的问答文本和解答文本对。
9.一种终端,其特征在于,包括:
处理器;
用于存储处理器的执行指令的存储器;
其中,所述处理器被配置为执行权利要求1-5任一项所述的方法。
10.一种存储有计算机程序的计算机可读存储介质,其特征在于,该程序被处理器执行时实现如权利要求1-5中任一项所述的方法。
CN202011549920.0A 2020-12-24 2020-12-24 一种结合关键词的文本匹配方法、系统、终端及存储介质 Pending CN112541069A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011549920.0A CN112541069A (zh) 2020-12-24 2020-12-24 一种结合关键词的文本匹配方法、系统、终端及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011549920.0A CN112541069A (zh) 2020-12-24 2020-12-24 一种结合关键词的文本匹配方法、系统、终端及存储介质

Publications (1)

Publication Number Publication Date
CN112541069A true CN112541069A (zh) 2021-03-23

Family

ID=75017392

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011549920.0A Pending CN112541069A (zh) 2020-12-24 2020-12-24 一种结合关键词的文本匹配方法、系统、终端及存储介质

Country Status (1)

Country Link
CN (1) CN112541069A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115203379A (zh) * 2022-09-15 2022-10-18 太平金融科技服务(上海)有限公司深圳分公司 检索方法、装置、计算机设备、存储介质和程序产品

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108536708A (zh) * 2017-03-03 2018-09-14 腾讯科技(深圳)有限公司 一种自动问答处理方法及自动问答系统
CN109063000A (zh) * 2018-07-06 2018-12-21 深圳前海微众银行股份有限公司 问句推荐方法、客服系统以及计算机可读存储介质
CN109147934A (zh) * 2018-07-04 2019-01-04 平安科技(深圳)有限公司 问诊数据推荐方法、装置、计算机设备和存储介质
CN109918560A (zh) * 2019-01-09 2019-06-21 平安科技(深圳)有限公司 一种基于搜索引擎的问答方法和装置
CN110717340A (zh) * 2019-09-29 2020-01-21 百度在线网络技术(北京)有限公司 推荐方法、装置、电子设备及存储介质
CN111125334A (zh) * 2019-12-20 2020-05-08 神思电子技术股份有限公司 一种基于预训练的搜索问答系统

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108536708A (zh) * 2017-03-03 2018-09-14 腾讯科技(深圳)有限公司 一种自动问答处理方法及自动问答系统
CN109147934A (zh) * 2018-07-04 2019-01-04 平安科技(深圳)有限公司 问诊数据推荐方法、装置、计算机设备和存储介质
CN109063000A (zh) * 2018-07-06 2018-12-21 深圳前海微众银行股份有限公司 问句推荐方法、客服系统以及计算机可读存储介质
CN109918560A (zh) * 2019-01-09 2019-06-21 平安科技(深圳)有限公司 一种基于搜索引擎的问答方法和装置
CN110717340A (zh) * 2019-09-29 2020-01-21 百度在线网络技术(北京)有限公司 推荐方法、装置、电子设备及存储介质
CN111125334A (zh) * 2019-12-20 2020-05-08 神思电子技术股份有限公司 一种基于预训练的搜索问答系统

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115203379A (zh) * 2022-09-15 2022-10-18 太平金融科技服务(上海)有限公司深圳分公司 检索方法、装置、计算机设备、存储介质和程序产品

Similar Documents

Publication Publication Date Title
CN109101620B (zh) 相似度计算方法、聚类方法、装置、存储介质及电子设备
CN111797214A (zh) 基于faq数据库的问题筛选方法、装置、计算机设备及介质
Rafiei et al. A novel method for expert finding in online communities based on concept map and PageRank
CN109299280B (zh) 短文本聚类分析方法、装置和终端设备
CN109325146B (zh) 一种视频推荐方法、装置、存储介质和服务器
WO2021135455A1 (zh) 语义召回方法、装置、计算机设备及存储介质
CN108509479B (zh) 实体推荐方法及装置、终端及可读存储介质
CN103577452A (zh) 用于丰富网站内容的方法和装置、网站服务器
CN110209809B (zh) 文本聚类方法和装置、存储介质及电子装置
CN111522886B (zh) 一种信息推荐方法、终端及存储介质
CN112329460A (zh) 文本的主题聚类方法、装置、设备及存储介质
John et al. Graph-based cluster analysis to identify similar questions: A design science approach
CN109857873A (zh) 推荐实体的方法和装置、电子设备、计算机可读介质
CN113204953A (zh) 基于语义识别的文本匹配方法、设备及设备可读存储介质
CN113821527A (zh) 哈希码的生成方法、装置、计算机设备及存储介质
CN111813993A (zh) 视频内容的拓展方法、装置、终端设备及存储介质
CN113961823B (zh) 新闻推荐方法、系统、存储介质及设备
CN110209780B (zh) 一种问题模板生成方法、装置、服务器及存储介质
Wei et al. Online education recommendation model based on user behavior data analysis
CN109344232A (zh) 一种舆情信息检索方法及终端设备
CN116402166B (zh) 一种预测模型的训练方法、装置、电子设备及存储介质
CN113590811A (zh) 文本摘要生成方法、装置、电子设备及存储介质
CN113468421A (zh) 基于向量匹配技术的产品推荐方法、装置、设备及介质
CN112541069A (zh) 一种结合关键词的文本匹配方法、系统、终端及存储介质
CN111460808A (zh) 同义文本识别及内容推荐方法、装置及电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20210323

RJ01 Rejection of invention patent application after publication