CN111324721A - 一种智能问答知识库的构建方法 - Google Patents
一种智能问答知识库的构建方法 Download PDFInfo
- Publication number
- CN111324721A CN111324721A CN202010183059.4A CN202010183059A CN111324721A CN 111324721 A CN111324721 A CN 111324721A CN 202010183059 A CN202010183059 A CN 202010183059A CN 111324721 A CN111324721 A CN 111324721A
- Authority
- CN
- China
- Prior art keywords
- word
- knowledge base
- answering
- text information
- intelligent question
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 33
- 239000013598 vector Substances 0.000 claims abstract description 33
- 238000007781 pre-processing Methods 0.000 claims abstract description 9
- 238000000605 extraction Methods 0.000 claims abstract description 5
- 230000011218 segmentation Effects 0.000 claims description 10
- 238000001914 filtration Methods 0.000 claims description 7
- 238000013528 artificial neural network Methods 0.000 claims description 6
- 238000004364 calculation method Methods 0.000 claims description 6
- 238000012163 sequencing technique Methods 0.000 claims description 4
- 238000012549 training Methods 0.000 claims description 3
- 238000002372 labelling Methods 0.000 claims description 2
- 238000004458 analytical method Methods 0.000 abstract description 6
- 230000009286 beneficial effect Effects 0.000 abstract description 4
- 238000005516 engineering process Methods 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 230000009471 action Effects 0.000 description 3
- 238000013145 classification model Methods 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 238000003058 natural language processing Methods 0.000 description 2
- 230000004913 activation Effects 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000013526 transfer learning Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3329—Natural language query formulation or dialogue systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- Human Computer Interaction (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Animal Behavior & Ethology (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请公开了一种智能问答知识库的构建方法,包括,对文本信息进行预处理,然后进行关键词提取,构建所述关键词的词向量。根据关键词的词向量在知识库中执行检索,并提取得到答案,将所述文本信息与所述答案存入智能问答知识库。本申请基于对用户提出的问题进行问题分析、信息检索,设计并实现了智能问答知识库的构建方法。通过对问题进行语义分析、关键词提取,明确用户的目的,使得系统能够正确理解所提的问题,并推理答案返回提问人员,提高智能问答系统的准确性。同时,系统记录并统计用户提问的问题及答案,以便对智能问答库不断升级改进,有助于提升问答效率,改进问答服务质量,从源头减少问题的数目,提高用户效率、快速进行自助问答。
Description
技术领域
本申请涉及智能问答技术领域,尤其涉及一种智能问答知识库的构建方法。
背景技术
近年来,随着科技的飞速发展,自然语言处理、迁移学习、深度学习、智能问答等技术不断革新,智能问答领域也有了一定的研究成果,开发出许多成型的产品。
智能问答系统是将积累的无序语料信息,进行有序和科学的整理,并建立基于知识的分类模型。这些分类模型可以指导新增加的语料咨询和服务信息,节约人力资源,提高信息处理的自动性,降低网站运行成本。
目前常见的智能问答系统多采用单一的自助问答方式,准确率低。
发明内容
本申请提供了一种智能问答知识库的构建方法,以解决智能问答系统准确率低的技术问题。
为了解决上述技术问题,本申请实施例公开了如下技术方案:
本申请实施例公开了一种智能问答知识库的构建方法,包括:
对文本信息进行预处理,然后进行关键词提取,构建所述关键词的词向量;
根据关键词信息在知识库中执行检索,并提取得到答案,将所述文本信息与所述答案存入智能问答知识库。
可选的,对文本信息进行预处理,包括:
利用神经网络进行分词处理,将分词知识隐式方法存入神经网内部,通过自学习和训练修改内部权值,以达到正确的分词结果;
识别名词、动词、形容词的词性,标注这些词的词性,确定其在上下文中的作用;
将所述文本信息中的停用词过滤掉,去除停用词。
可选的,进行关键词提取,包括:
计算所述文本信息中的词的词频,计算公式为:词频=某个词在所述文本信息中的出现次数/所述文本信息总次数;
计算逆文档频率,计算公式为:逆文档频率=log(语料库的文档总数/包含该词的文档数+1);
计算词频-逆文档频率,计算公式为:词频-逆文档频率=词频*逆文档频率;
将全部词按照词频-逆文档频率的值从大到小排序,取前X个词作为所述文本信息的关键词。
可选的,将所述文本信息中的停用词过滤掉,去除停用词,包括:对照停用词表,将词频统计中的停用词去掉;
去掉后的停用词位置以空格的形式代替,保证每个索引词在原来的位置不发生变化。
可选的,根据关键词的词向量在知识库中执行检索并提取得到答案,包括:根据关键词的词向量在知识库中执行检索,得到答案语句;
对所述词向量与所述答案语句进行匹配,并计算所述词向量与所述答案语句的相似度;
将所述答案语句按照相似度进行排序,选择相似度高的前N个答案语句作为答案;
将所述答案反馈给用户,并将所述文本信息和所述答案顺序存入智能问答知识库。
可选的,在对文本信息进行预处理前,还包括:采集用户提问的自然语言信息,并将所述自然语言信息识别为文本信息。
与现有技术相比,本申请的有益效果为:
本申请公开了一种智能问答知识库的构建方法,本申请基于问题分析、信息检索技术设计并实现了智能问答知识库的构建方法。通过对问题进行语义分析、关键词提取,明确用户的目的,使得系统能够正确理解所提的问题,并推理答案返回提问人员,提高智能问答系统的准确性。同时,系统记录并统计用户提问的问题及答案,以便对智能问答库不断升级改进,有助于提升问答效率,改进问答服务质量,从源头减少问题的数目,提高用户搜索效率、快速进行自助问答。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本申请。
附图说明
为了更清楚地说明本申请的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例提供的一种智能问答知识库的构建方法流程示意图;
图2为本申请实施例提供的文本信息进行预处理的流程示意图;
图3为本申请实施例提供步骤S300的流程示意图。
具体实施方式
为了使本技术领域的人员更好地理解本申请中的技术方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。
如图1所示,本申请实施例提供了一种智能问答知识库的构建方法,包括:
S100:采集用户提问的自然语言信息,并将所述自然语言信息识别为文本信息。
为了方便用户使用自然语言提出问题,增强用户的体验度,通过声学模型和语言模型,利用麦克风本身的性能和设计,采集用户提问的自然语言信息并将其识别为文本信息。为提高所获取语音的准确率,可将多个麦克风组成一个环形。
S200:对文本信息进行预处理,然后进行关键词提取,构建所述关键词的词向量。
具体的,如图2所示,对文本信息进行预处理,包括:
S201:利用神经网络进行分词处理,将分词知识隐式方法存入神经网内部,通过自学习和训练修改内部权值,以达到正确的分词结果。
此步骤的关键点在于权重链表的组织和网络推理机制的建立。这个过程是一个生成分词动态网的过程,首先以确定的待处理语句的汉子串为基础,来确定网络处理单元;然后,根据链接权重表激活输入/输出单元之间的链接,该过程可以采用某种激活方式,取一个汉子作为关键字,确定其链表,不断匹配即可。
S202:识别名词、动词、形容词的词性,标注这些词的词性,确定其在上下文中的作用。
S203:将所述文本信息中的停用词过滤掉,去除停用词。包括:对照停用词表,将词频统计中的停用词去掉。
去掉后的停用词位置以空格的形式代替,保证每个索引词在原来的位置不发生变化。
具体方法如下:采用中文判断算法,通过最大正向匹配算法,与现有停用词表进行停用词判断;通过连续重复词进行判读,采用正向检测,如果有两个重复词,就开始进入重复检测模式,直到满足最小重复词个数;采用停用词表中的常用停用词来判断停用词是否为特征的连续字符串;上述方法中凡符合过滤需求的则进行过滤处理。上述的停用词过滤方法,其中:所述的中文判断算法通过底层编码落在中文编码范围内来判断,所述的中文编码范围为,第一节字,行码0x81至0xFE第二节字,列码0x40至0x7E,0xA1至0xFE。
所述的进行关键词提取,包括:
计算所述文本信息中的词的词频,计算公式为:词频=某个词在所述文本信息中的出现次数/所述文本信息总次数。
计算逆文档频率,计算公式为:逆文档频率=log(语料库的文档总数/包含该词的文档数+1)。
计算词频-逆文档频率,计算公式为:词频-逆文档频率=词频*逆文档频率。
将全部词按照词频-逆文档频率的值从大到小排序,取前X个词作为所述文本信息的关键词。
构建所述关键词的词向量为将关键词转换为对应向量矩阵。
词向量的作用就是将自然语言中的字词转为计算机可以理解的稠密向量。在词向量出现之前,自然语言处理经常把字词转为离散的单独符号。如下所示:
杭州[0,0,0,0,0,0,0,1,0,……,0,0,0,0,0,0,0]
上海[0,0,0,0,1,0,0,0,0,……,0,0,0,0,0,0,0]
宁波[0,0,0,1,0,0,0,0,0,……,0,0,0,0,0,0,0]
北京[0,0,0,0,0,0,0,0,0,……,1,0,0,0,0,0,0]
比如上面的这个例子,在语料库中,杭州、上海、宁波、北京各对应一个向量,向量中只有一个值为1,其余都为0。但是使用离散的单独符号有以下问题。一方面,城市编码是随机的,向量之间相互独立,看不出城市之间可能存在的关联关系。其次,向量维度的大小取决于语料库中字词的多少。如果将世界所有城市名称对应的向量合为一个矩阵的话,那这个矩阵过于稀疏,并且会造成维度灾难。
使用词向量可以有效解决这个问题。词向量可以将离散的单独符号转化为低维度的连续值,也就是稠密向量,并且其中意思相近的词将被映射到向量空间中相近的位置。
如果将城市向量通过PCA降维后可视化展示出来,那就是杭州宁波聚集在一起,北京上海聚集在一起,且北京到上海的距离与杭州到宁波距离相似。也就是说模型学习到了城市的地理位置,也学习到了城市地位的关系。
S300:根据关键词的词向量在知识库中执行检索,并提取得到答案,将所述文本信息与所述答案存入智能问答知识库。具体如图3所示,包括:
S301:根据关键词的词向量在知识库中执行检索,得到答案语句。系统将答案语句存入数据库中,形成答案库。
S302:对所述词向量与所述答案语句进行匹配,并计算所述词向量与所述答案语句的相似度。
S303:将所述答案语句按照相似度进行排序,选择相似度高的前N个答案语句作为答案。
S304:将所述答案反馈给用户,并将所述文本信息和所述答案顺序存入智能问答知识库。
综上所述,本申请公开了一种智能问答知识库的构建方法,本申请基于问题分析、信息检索技术设计并实现了智能问答知识库的构建方法。通过对问题进行语义分析、关键词提取,明确用户的目的,使得系统能够正确理解所提的问题,并推理答案返回提问人员,提高智能问答系统的准确性。同时,系统记录并统计用户提问的问题及答案,以便对智能问答库不断升级改进,有助于提升问答效率,改进问答服务质量,从源头减少问题的数目,提高用户搜索效率、快速进行自助问答。
由于以上实施方式均是在其他方式之上引用结合进行说明,不同实施例之间均具有相同的部分,本说明书中各个实施例之间相同、相似的部分互相参见即可。在此不再详细阐述。
需要说明的是,在本说明书中,诸如“第一”和“第二”等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或暗示这些实体或操作之间存在任何这种实际的关系或顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的电路结构、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种电路结构、物品或者设备所固有的要素。在没有更多限制的情况下,有语句“包括一个……”限定的要素,并不排除在包括所述要素的电路结构、物品或者设备中还存在另外的相同要素。
本领域技术人员在考虑说明书及实践这里发明的公开后,将容易想到本申请的其他实施方案。本申请旨在涵盖本发明的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本申请的一般性原理并包括本申请未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本申请的真正范围和精神由权利要求的内容指出。
以上所述的本申请实施方式并不构成对本申请保护范围的限定。
Claims (6)
1.一种智能问答知识库的构建方法,其特征在于,包括:
对文本信息进行预处理,然后进行关键词提取,构建所述关键词的词向量;
根据关键词的词向量在知识库中执行检索,并提取得到答案,将所述文本信息与所述答案存入智能问答知识库。
2.根据权利要求1所述的智能问答知识库的构建方法,其特征在于,对文本信息进行预处理,包括:
利用神经网络进行分词处理,将分词知识隐式方法存入神经网内部,通过自学习和训练修改内部权值,以达到正确的分词结果;
识别名词、动词、形容词的词性,标注这些词的词性,确定其在上下文中的作用;
将所述文本信息中的停用词过滤掉,去除停用词。
3.根据权利要求2所述的智能问答知识库的构建方法,其特征在于,进行关键词提取,包括:
计算所述文本信息中的词的词频,计算公式为:词频=某个词在所述文本信息中的出现次数/所述文本信息总次数;
计算逆文档频率,计算公式为:逆文档频率=log(语料库的文档总数/包含该词的文档数+1);
计算词频-逆文档频率,计算公式为:词频-逆文档频率=词频*逆文档频率;
将全部词按照词频-逆文档频率的值从大到小排序,取前X个词作为所述文本信息的关键词。
4.根据权利要求2所述的智能问答知识库的构建方法,其特征在于,将所述文本信息中的停用词过滤掉,去除停用词包括:
对照停用词表,将词频统计中的停用词去掉;
去掉后的停用词位置以空格的形式代替,保证每个索引词在原来的位置不发生变化。
5.根据权利要求1所述的智能问答知识库的构建方法,其特征在于,根据关键词的词向量在知识库中执行检索并提取得到答案,包括:
根据关键词的词向量在知识库中执行检索,得到答案语句;
对所述词向量与所述答案语句进行匹配,并计算所述词向量与所述答案语句的相似度;
将所述答案语句按照相似度进行排序,选择相似度高的N个答案语句作为答案;
将所述答案反馈给用户,并将所述文本信息和所述答案顺序存入智能问答知识库。
6.根据权利要求1所述的智能问答知识库的构建方法,其特征在于,在对文本信息进行预处理前,还包括:
采集用户提问的自然语言信息,并将所述自然语言信息识别为文本信息。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010183059.4A CN111324721A (zh) | 2020-03-16 | 2020-03-16 | 一种智能问答知识库的构建方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010183059.4A CN111324721A (zh) | 2020-03-16 | 2020-03-16 | 一种智能问答知识库的构建方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111324721A true CN111324721A (zh) | 2020-06-23 |
Family
ID=71173311
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010183059.4A Pending CN111324721A (zh) | 2020-03-16 | 2020-03-16 | 一种智能问答知识库的构建方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111324721A (zh) |
Cited By (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111984777A (zh) * | 2020-09-01 | 2020-11-24 | 中国平安财产保险股份有限公司 | 基于自然语言处理的生产系统上报问题处理方法及装置 |
CN112380848A (zh) * | 2020-11-19 | 2021-02-19 | 平安科技(深圳)有限公司 | 文本生成方法、装置、设备及存储介质 |
CN112613612A (zh) * | 2020-12-29 | 2021-04-06 | 合肥工业大学 | 一种基于专利库的绿色设计知识库的构建方法及其装置 |
CN112650838A (zh) * | 2020-12-31 | 2021-04-13 | 南京视察者智能科技有限公司 | 一种基于历史案件大数据的智能问答方法及系统 |
CN113157885A (zh) * | 2021-04-13 | 2021-07-23 | 华南理工大学 | 一种面向人工智能领域知识的高效智能问答系统 |
CN113486165A (zh) * | 2021-07-08 | 2021-10-08 | 山东新一代信息产业技术研究院有限公司 | 一种用于云化机器人的faq自动问答方法、设备及介质 |
CN113780561A (zh) * | 2021-09-07 | 2021-12-10 | 国网北京市电力公司 | 电网调控运行知识库的构建方法及装置 |
CN115129424A (zh) * | 2022-07-07 | 2022-09-30 | 江苏红网技术股份有限公司 | 一种数据资产管理平台及其方法 |
CN115713065A (zh) * | 2022-11-08 | 2023-02-24 | 贝壳找房(北京)科技有限公司 | 一种生成问题的方法、电子设备及计算机可读存储介质 |
CN116955573A (zh) * | 2023-09-19 | 2023-10-27 | 北京奇虎科技有限公司 | 问题搜索方法、装置、设备及存储介质 |
CN117235287A (zh) * | 2023-11-13 | 2023-12-15 | 悦享星光(北京)科技有限公司 | 一种人工智能问答知识库的建立方法及系统 |
CN118350468A (zh) * | 2024-06-14 | 2024-07-16 | 杭州字节方舟科技有限公司 | 一种基于自然语言处理的ai对话方法 |
CN118606574A (zh) * | 2024-08-12 | 2024-09-06 | 杭州领信数科信息技术有限公司 | 基于大模型的知识应答方法、系统、电子设备及存储介质 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105843897A (zh) * | 2016-03-23 | 2016-08-10 | 青岛海尔软件有限公司 | 一种面向垂直领域的智能问答系统 |
WO2017084267A1 (zh) * | 2015-11-18 | 2017-05-26 | 乐视控股(北京)有限公司 | 一种关键词提取方法和装置 |
CN108197109A (zh) * | 2017-12-29 | 2018-06-22 | 北京百分点信息科技有限公司 | 一种基于自然语言处理的多语言分析方法和装置 |
-
2020
- 2020-03-16 CN CN202010183059.4A patent/CN111324721A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2017084267A1 (zh) * | 2015-11-18 | 2017-05-26 | 乐视控股(北京)有限公司 | 一种关键词提取方法和装置 |
CN105843897A (zh) * | 2016-03-23 | 2016-08-10 | 青岛海尔软件有限公司 | 一种面向垂直领域的智能问答系统 |
CN108197109A (zh) * | 2017-12-29 | 2018-06-22 | 北京百分点信息科技有限公司 | 一种基于自然语言处理的多语言分析方法和装置 |
Non-Patent Citations (2)
Title |
---|
李湘识: ""基于检索和答案生成混合的问答系统设计与实现"", 《中国优秀硕士学位论文全文数据库》 * |
赵晓彤: ""保险领域知识问答系统的研究与实现"", 《中国优秀硕士学位论文全文数据库》 * |
Cited By (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111984777A (zh) * | 2020-09-01 | 2020-11-24 | 中国平安财产保险股份有限公司 | 基于自然语言处理的生产系统上报问题处理方法及装置 |
CN112380848A (zh) * | 2020-11-19 | 2021-02-19 | 平安科技(深圳)有限公司 | 文本生成方法、装置、设备及存储介质 |
CN112380848B (zh) * | 2020-11-19 | 2022-04-26 | 平安科技(深圳)有限公司 | 文本生成方法、装置、设备及存储介质 |
CN112613612A (zh) * | 2020-12-29 | 2021-04-06 | 合肥工业大学 | 一种基于专利库的绿色设计知识库的构建方法及其装置 |
CN112613612B (zh) * | 2020-12-29 | 2022-08-02 | 合肥工业大学 | 一种基于专利库的绿色设计知识库的构建方法及其装置 |
CN112650838A (zh) * | 2020-12-31 | 2021-04-13 | 南京视察者智能科技有限公司 | 一种基于历史案件大数据的智能问答方法及系统 |
CN112650838B (zh) * | 2020-12-31 | 2023-07-14 | 南京视察者智能科技有限公司 | 一种基于历史案件大数据的智能问答方法及系统 |
CN113157885B (zh) * | 2021-04-13 | 2023-07-18 | 华南理工大学 | 一种面向人工智能领域知识的高效智能问答系统 |
CN113157885A (zh) * | 2021-04-13 | 2021-07-23 | 华南理工大学 | 一种面向人工智能领域知识的高效智能问答系统 |
CN113486165A (zh) * | 2021-07-08 | 2021-10-08 | 山东新一代信息产业技术研究院有限公司 | 一种用于云化机器人的faq自动问答方法、设备及介质 |
CN113780561A (zh) * | 2021-09-07 | 2021-12-10 | 国网北京市电力公司 | 电网调控运行知识库的构建方法及装置 |
CN115129424A (zh) * | 2022-07-07 | 2022-09-30 | 江苏红网技术股份有限公司 | 一种数据资产管理平台及其方法 |
CN115713065A (zh) * | 2022-11-08 | 2023-02-24 | 贝壳找房(北京)科技有限公司 | 一种生成问题的方法、电子设备及计算机可读存储介质 |
CN115713065B (zh) * | 2022-11-08 | 2023-09-15 | 贝壳找房(北京)科技有限公司 | 一种生成问题的方法、电子设备及计算机可读存储介质 |
CN116955573A (zh) * | 2023-09-19 | 2023-10-27 | 北京奇虎科技有限公司 | 问题搜索方法、装置、设备及存储介质 |
CN116955573B (zh) * | 2023-09-19 | 2024-03-29 | 北京奇虎科技有限公司 | 问题搜索方法、装置、设备及存储介质 |
CN117235287A (zh) * | 2023-11-13 | 2023-12-15 | 悦享星光(北京)科技有限公司 | 一种人工智能问答知识库的建立方法及系统 |
CN117235287B (zh) * | 2023-11-13 | 2024-01-30 | 悦享星光(北京)科技有限公司 | 一种人工智能问答知识库的建立方法及系统 |
CN118350468A (zh) * | 2024-06-14 | 2024-07-16 | 杭州字节方舟科技有限公司 | 一种基于自然语言处理的ai对话方法 |
CN118350468B (zh) * | 2024-06-14 | 2024-08-20 | 杭州字节方舟科技有限公司 | 一种基于自然语言处理的ai对话方法 |
CN118606574A (zh) * | 2024-08-12 | 2024-09-06 | 杭州领信数科信息技术有限公司 | 基于大模型的知识应答方法、系统、电子设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111324721A (zh) | 一种智能问答知识库的构建方法 | |
CN111125334B (zh) | 一种基于预训练的搜索问答系统 | |
CN110337645B (zh) | 可适配的处理组件 | |
US20180341871A1 (en) | Utilizing deep learning with an information retrieval mechanism to provide question answering in restricted domains | |
CN110674271B (zh) | 一种问答处理方法及装置 | |
CN111143521B (zh) | 基于知识图谱的法条检索方法、系统、装置及存储介质 | |
KR20190059084A (ko) | 자연어 질의응답 시스템 및 그 학습 방법 | |
CN108536807B (zh) | 一种信息处理方法及装置 | |
CN111291188A (zh) | 一种智能信息抽取方法及系统 | |
Kavitha et al. | Chatbot for healthcare system using Artificial Intelligence | |
CN114153994A (zh) | 医保信息问答方法及装置 | |
CN110781681A (zh) | 一种基于翻译模型的初等数学应用题自动求解方法及系统 | |
CN111368555B (zh) | 一种数据识别方法、装置、存储介质和电子设备 | |
CN111143507A (zh) | 一种基于复合式问题的阅读理解方法 | |
CN111666376A (zh) | 一种基于段落边界扫描预测与词移距离聚类匹配的答案生成方法及装置 | |
CN113761192B (zh) | 文本处理方法、文本处理装置及文本处理设备 | |
CN118296118A (zh) | 建筑标准知识问答模型构建方法、计算机程序产品、存储介质及电子设备 | |
CN117278675A (zh) | 一种基于意图分类的外呼方法、装置、设备及介质 | |
CN116069948B (zh) | 内容风控知识库构建方法、装置、设备及存储介质 | |
CN116842168A (zh) | 跨领域问题处理方法、装置、电子设备及存储介质 | |
CN111401070B (zh) | 词义相似度确定方法及装置、电子设备及存储介质 | |
CN115270746A (zh) | 问题样本生成方法和装置、电子设备及存储介质 | |
Su et al. | Automatic ontology population using deep learning for triple extraction | |
CN114117057A (zh) | 产品反馈信息的关键词提取方法及终端设备 | |
Chen | Tracking latent domain structures: An integration of Pathfinder and Latent Semantic Analysis |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20200623 |