CN107729468B - 基于深度学习的答案抽取方法及系统 - Google Patents

基于深度学习的答案抽取方法及系统 Download PDF

Info

Publication number
CN107729468B
CN107729468B CN201710948835.3A CN201710948835A CN107729468B CN 107729468 B CN107729468 B CN 107729468B CN 201710948835 A CN201710948835 A CN 201710948835A CN 107729468 B CN107729468 B CN 107729468B
Authority
CN
China
Prior art keywords
target
knowledge
answered
keywords
words
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201710948835.3A
Other languages
English (en)
Other versions
CN107729468A (zh
Inventor
路松峰
万飞
黄炎
徐科
王同洋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huazhong University of Science and Technology
Original Assignee
Huazhong University of Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huazhong University of Science and Technology filed Critical Huazhong University of Science and Technology
Priority to CN201710948835.3A priority Critical patent/CN107729468B/zh
Publication of CN107729468A publication Critical patent/CN107729468A/zh
Application granted granted Critical
Publication of CN107729468B publication Critical patent/CN107729468B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3344Query execution using natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/211Syntactic parsing, e.g. based on context-free grammar [CFG] or unification grammars
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/284Lexical analysis, e.g. tokenisation or collocates

Abstract

本发明公开了一种基于深度学习的答案抽取方法及系统,其中,方法的实现包括:根据待回答问题中的关键词搜集与待回答问题的答案相关的知识碎片;基于待回答问题的类型,对知识碎片进行词性标注分析,将包含符合待回答问题的类型的知识碎片作为候选答案;利用已训练的word2vec模型,计算关键词与候选答案中的知识碎片所包含的词语的相似度,找出满足相似度要求的词语作为目标候选答案;将目标候选答案中的词语反代入到待回答问题中得到若干个目标语句,并通过判断各目标语句的语义信息,对各目标语句进行排序,将排序最靠前的目标语句作为目标答案。通过本发明能够找到相似度较高的多个词语的答案,从而提高了系统的精确度。

Description

基于深度学习的答案抽取方法及系统
技术领域
本发明属于人工智能与深度学习技术领域,更具体地,涉及一种基于深度学习的答案抽取方法及系统。
背景技术
问答机器人是指以自然语言理解技术为核心,使得计算机能够理解用户提出的问题,实现人与计算机之间的有效沟通,并且提供强大的搜索能力,准确回答用户的问题。其中,目前在计算机客服系统中普遍采用的智能问答系统就是一种自动问答系统,它是一种通过自然语言技术,能够理解用户的问题,并且提供准确答案的人工智能系统。
现有问答系统大多都是先以句子为单位进行分词及标注词性。利用问句类型表得到预期答案类型,利用句型分析得到答案的可能形式。最后将片段中不含预期答案类型的句子排除得到答案候选集。这类方法存在的问题是抽取方法只能识别特定词语的答案而不能识别相似词语的答案,从而导致识别准确性较低。
发明内容
针对现有技术的以上缺陷或改进需求,本发明提供了一种基于深度学习的答案抽取方法及系统,由此解决现有答案抽取方法中存在的只能识别特定词语的答案而不能识别相似词语的答案,而导致的识别准确性较低的技术问题。
为实现上述目的,按照本发明的一个方面,提供了一种基于深度学习的答案抽取方法,包括:
根据待回答问题中的关键词搜集与所述待回答问题的答案相关的知识碎片;
基于所述待回答问题的类型,对所述知识碎片进行词性标注分析,将包含符合所述待回答问题的类型的知识碎片作为候选答案;
利用已训练的word2vec模型,计算所述关键词与所述候选答案中的知识碎片所包含的词语的相似度,找出满足相似度要求的词语作为目标候选答案;
将所述目标候选答案中的词语反代入到所述待回答问题中得到若干个目标语句,对各目标语句进行语义依存分析,并通过判断各目标语句的语义信息,对各目标语句进行排序,将排序最靠前的目标语句作为目标答案。
优选地,所述方法还包括:
根据所述关键词的重要程度对所述知识碎片进行打分,其中,所述关键词的重要程度越高,则所述知识碎片的分数越高,且所述关键词位于所述知识碎片所属标题中的重要程度高于位于所述知识碎片中的重要程度;
判断所述知识碎片的分数是否高于分数阈值,若高于所述分数阈值,则将所述知识碎片作为候选答案,并执行所述利用已训练的word2vec模型,计算所述关键词与所述候选答案中的知识碎片所包含的词语的相似度,找出满足相似度要求的词语作为目标候选答案;
若所述知识碎片的分数不高于所述分数阈值,则执行所述基于所述待回答问题的类型,对所述知识碎片进行词性标注分析,将包含符合所述待回答问题的类型的知识碎片作为候选答案。
优选地,所述方法还包括:
采用结巴分词,将训练语料进行分词;
将分好词的训练语料进行训练得到word2vec模型,其中,输入为由所有分词组成的输入文件,输出为词向量,每个单词的向量维度是M,训练的窗口大小为N,采样阈值为L。
按照本发明的另一方面,提供了一种基于深度学习的答案抽取系统,包括:
搜集模块,用于根据待回答问题中的关键词搜集与所述待回答问题的答案相关的知识碎片;
词性分析模块,用于基于所述待回答问题的类型,对所述知识碎片进行词性标注分析,将包含符合所述待回答问题的类型的知识碎片作为候选答案;
相似度计算模块,用于利用已训练的word2vec模型,计算所述关键词与所述候选答案中的知识碎片所包含的词语的相似度,找出满足相似度要求的词语作为目标候选答案;
目标答案确定模块,用于将所述目标候选答案中的词语反代入到所述待回答问题中得到若干个目标语句,对各目标语句进行语义依存分析,并通过判断各目标语句的语义信息,对各目标语句进行排序,将排序最靠前的目标语句作为目标答案。
优选地,所述系统还包括:
评分模块,用于根据所述关键词的重要程度对所述知识碎片进行打分,其中,所述关键词的重要程度越高,则所述知识碎片的分数越高,且所述关键词位于所述知识碎片所属标题中的重要程度高于位于所述知识碎片中的重要程度;
判断模块,用于判断所述知识碎片的分数是否高于分数阈值;
判断执行模块,用于在所述知识碎片的分数高于所述分数阈值时,将所述知识碎片作为候选答案,并执行所述相似度计算模块的操作;在所述知识碎片的分数不高于所述分数阈值时,则执行所述词性分析模块的操作。
优选地,所述系统还包括:
训练模块,用于采用结巴分词,将训练语料进行分词;将分好词的训练语料进行训练得到word2vec模型,其中,输入为由所有分词组成的输入文件,输出为词向量,每个单词的向量维度是M,训练的窗口大小为N,采样阈值为L。
总体而言,通过本发明所构思的以上技术方案与现有技术相比,能够取得下列有益效果:
(1)通过利用问题中的关键词从本地文本库或互联网上获取支撑问题的证据碎片,该方法极大地扩充了问题证据的广泛性,从而能有效地找到相关问题对应的答案;
(2)为评价不同证据碎片对问题的支撑程度,通过计算问题中的关键词在标题和碎片中的词频建立了一套证据评分机制,通过词性分析和依存句法分析,筛选出证据中包含问题类型的句子,该方法通过一种评分机制及对词性的分析,有效地提高了针对问题分类所采取的证据筛选和过滤的功能;
(3)利用深度学习技术,基于语料库,训练一种word2vec模型,计算问题中关键词与候选中词语的相似度,找到与问题中关键词相似的词语并排序,该方法通过采用深度学习的技术,通过神经网络模型,计算问题关键词与候选答案中词语的相似性,筛选出与问题关键词相似度较高的词语,从而提高了答案的获取效率。
附图说明
图1是本发明实施例公开的一种基于深度学习的答案抽取方法的流程示意图;
图2是本发明实施例公开的另一种基于深度学习的答案抽取方法的流程示意图;
图3是本发明实施例公开的一种基于深度学习的word2vec模型训练流程示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。此外,下面所描述的本发明各个实施方式中所涉及到的技术特征只要彼此之间未构成冲突就可以相互组合。
本发明针对用户提出的问题,在经过对问题的分类和关键词提取之后,利用关键词从文本库或基于网络搜索涉及问题的答案的碎片。利用知识抽取技术,根据给定本体从无语义标注的信息中识别并抽取与本体匹配的事实知识。利用深度学习技术,基于语料库,训练一种word2vec词向量模型,计算问题中关键词与从知识碎片中抽取到的关键词之间的相似度,从而找到与问题中关键词相似的词,再讲筛选得到的词代入问题中,并对句子进行句法分析,从而找到最符合问题的答案。
如图1所示是本发明实施例公开的一种基于深度学习的答案抽取方法的流程示意图;在图1所示的方法中,包括以下步骤:
S1:根据待回答问题中的关键词搜集与待回答问题的答案相关的知识碎片;
其中,根据问题中的关键词,可以基于solr搜索服务器,从本地文本库寻找支撑问题的证据。若本地数据库存储有该问题的证据,则直接返回支撑问题的证据。否则,需要利用搜索引擎从互联网上抓取与该问题相关的片段,并抽取出其中的正文作为该问题的支撑证据。
S2:基于待回答问题的类型,对知识碎片进行词性标注分析,将包含符合待回答问题的类型的知识碎片作为候选答案;
其中,如图2所示,在步骤S2之前,所述方法还包括:
根据关键词的重要程度对知识碎片进行打分,其中,关键词的重要程度越高,则知识碎片的分数越高,且关键词位于知识碎片所属标题中的重要程度高于位于知识碎片中的重要程度。
例如,若出现在标题中,则分数加2,若出现在证据碎片中,则分数加1,得到各个知识碎片的评分。
判断知识碎片的分数是否高于分数阈值,若高于分数阈值,则将知识碎片作为候选答案,并执行步骤S3;
若知识碎片的分数不高于分数阈值,则执行步骤S2。
S3:利用已训练的word2vec模型,计算关键词与候选答案中的知识碎片所包含的词语的相似度,找出满足相似度要求的词语作为目标候选答案;
其中,对模型的训练包括:
采用结巴分词,将训练语料进行分词,可以空格或tab隔开;
将分好词的训练语料进行训练得到word2vec模型,其中,输入为由所有分词组成的输入文件,输出为词向量,每个单词的向量维度是M,训练的窗口大小为N,采样阈值为L。
例如,在训练时输入命令为:
./word2vec-train corpus.txt-output vectors.bin-cbow 0-size 200-window5-negative 0-hs 1-sample 1e-3-threads 12-binary 1
上述命令表示的含义为:输入文件是corpus.txt,输出文件是vectors.bin,不使用cbow模型,默认为Skip-Gram模型。每个单词的向量维度是200,训练的窗口大小为5就是考虑一个词前五个和后五个词语(实际代码中还有一个随机选窗口的过程,窗口大小<=5)。不使用NEG方法,使用HS 方法。-sampe指的是采样的阈值,如果一个词语在训练样本中出现的频率越大,那么就越会被采样。-binary为1指的是结果二进制存储,为0是普通存储(普通存储的时候是可以打开看到词语和对应的向量的)。
训练好模型之后,得到vectors.bin这个模型文件。vectors.bin这个文件就是文档中词语和其对应的向量,这个向量的维度即是训练时设置的参数大小。利用训练得到的模型,计算与问题关键词相似的词语。
如图3所示,将词w(t)所在的上下文中的词w(t-2),w(t-1),w(t+1),w(t+2) 作为输入,而词w(t)本身作为输出,即达到通过一个上下文,能猜出这个词和它的意思的目的。通过在一个大的语料库训练,得到一个从输入层到隐含层的权重模型。第t个词的上下文词是w(t-2),w(t-1),w(t+1),w(t+2),那么w(t-2),w(t-1),w(t+1),w(t+2)作为输入,它们所在的词汇表中的位置的值置为1。然后,输出是t,把它所在的词汇表中的位置的值置为1。训练完成后,就得到了每个词到隐含层的每个维度的权重,就是每个词的词向量。
S4:将目标候选答案中的词语反代入到待回答问题中得到若干个目标语句,对各目标语句进行语义依存分析,并通过判断各目标语句的语义信息,对各目标语句进行排序,将排序最靠前的目标语句作为目标答案。
通过步骤S4可以跨越句子表层句法结构的束缚,直接获取深层的语义信息,通过判断语义信息,对答案进行排序,排序最靠前的即为最准确答案。
在本发明的另一个方面,提供了一种基于深度学习的答案抽取系统,其特征在于,包括:
搜集模块,用于根据待回答问题中的关键词搜集与所述待回答问题的答案相关的知识碎片;
词性分析模块,用于基于所述待回答问题的类型,对所述知识碎片进行词性标注分析,将包含符合所述待回答问题的类型的知识碎片作为候选答案;
相似度计算模块,用于利用已训练的word2vec模型,计算所述关键词与所述候选答案中的知识碎片所包含的词语的相似度,找出满足相似度要求的词语作为目标候选答案;
目标答案确定模块,用于将所述目标候选答案中的词语反代入到所述待回答问题中得到若干个目标语句,对各目标语句进行语义依存分析,并通过判断各目标语句的语义信息,对各目标语句进行排序,将排序最靠前的目标语句作为目标答案。
本领域的技术人员容易理解,以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

Claims (6)

1.一种基于深度学习的答案抽取方法,其特征在于,包括:
根据待回答问题中的关键词搜集与所述待回答问题的答案相关的知识碎片;
基于所述待回答问题的类型,对所述知识碎片进行词性标注分析,将包含符合所述待回答问题的类型的知识碎片作为候选答案;
利用已训练的word2vec模型,计算所述关键词与所述候选答案中的知识碎片所包含的词语的相似度,找出满足相似度要求的词语作为目标候选答案;
将所述目标候选答案中的词语反代入到所述待回答问题中得到若干个目标语句,对各目标语句进行语义依存分析,以获得各目标语句的语义信息,并通过判断各目标语句的语义信息,对各目标语句进行排序,将排序最靠前的目标语句作为目标答案。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
根据所述关键词的重要程度对所述知识碎片进行打分,其中,所述关键词的重要程度越高,则所述知识碎片的分数越高,且所述关键词位于所述知识碎片所属标题中的重要程度高于位于所述知识碎片中的重要程度;
判断所述知识碎片的分数是否高于分数阈值,若高于所述分数阈值,则将所述知识碎片作为候选答案,并执行所述利用已训练的word2vec模型,计算所述关键词与所述候选答案中的知识碎片所包含的词语的相似度,找出满足相似度要求的词语作为目标候选答案;
若所述知识碎片的分数不高于所述分数阈值,则执行所述基于所述待回答问题的类型,对所述知识碎片进行词性标注分析,将包含符合所述待回答问题的类型的知识碎片作为候选答案。
3.根据权利要求1或2所述的方法,其特征在于,所述方法还包括:
采用结巴分词,将训练语料进行分词;
将分好词的训练语料进行训练得到word2vec模型,其中,输入为由所有分词组成的输入文件,输出为词向量,每个单词的向量维度是M,训练的窗口大小为N,采样阈值为L。
4.一种基于深度学习的答案抽取系统,其特征在于,包括:
搜集模块,用于根据待回答问题中的关键词搜集与所述待回答问题的答案相关的知识碎片;
词性分析模块,用于基于所述待回答问题的类型,对所述知识碎片进行词性标注分析,将包含符合所述待回答问题的类型的知识碎片作为候选答案;
相似度计算模块,用于利用已训练的word2vec模型,计算所述关键词与所述候选答案中的知识碎片所包含的词语的相似度,找出满足相似度要求的词语作为目标候选答案;
目标答案确定模块,用于将所述目标候选答案中的词语反代入到所述待回答问题中得到若干个目标语句,对各目标语句进行语义依存分析,以获得各目标语句的语义信息,并通过判断各目标语句的语义信息,对各目标语句进行排序,将排序最靠前的目标语句作为目标答案。
5.根据权利要求4所述的系统,其特征在于,所述系统还包括:
评分模块,用于根据所述关键词的重要程度对所述知识碎片进行打分,其中,所述关键词的重要程度越高,则所述知识碎片的分数越高,且所述关键词位于所述知识碎片所属标题中的重要程度高于位于所述知识碎片中的重要程度;
判断模块,用于判断所述知识碎片的分数是否高于分数阈值;
判断执行模块,用于在所述知识碎片的分数高于所述分数阈值时,将所述知识碎片作为候选答案,并执行所述相似度计算模块的操作;在所述知识碎片的分数不高于所述分数阈值时,则执行所述词性分析模块的操作。
6.根据权利要求4或5所述的系统,其特征在于,所述系统还包括:
训练模块,用于采用结巴分词,将训练语料进行分词;将分好词的训练语料进行训练得到word2vec模型,其中,输入为由所有分词组成的输入文件,输出为词向量,每个单词的向量维度是M,训练的窗口大小为N,采样阈值为L。
CN201710948835.3A 2017-10-12 2017-10-12 基于深度学习的答案抽取方法及系统 Expired - Fee Related CN107729468B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710948835.3A CN107729468B (zh) 2017-10-12 2017-10-12 基于深度学习的答案抽取方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710948835.3A CN107729468B (zh) 2017-10-12 2017-10-12 基于深度学习的答案抽取方法及系统

Publications (2)

Publication Number Publication Date
CN107729468A CN107729468A (zh) 2018-02-23
CN107729468B true CN107729468B (zh) 2019-12-17

Family

ID=61211032

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710948835.3A Expired - Fee Related CN107729468B (zh) 2017-10-12 2017-10-12 基于深度学习的答案抽取方法及系统

Country Status (1)

Country Link
CN (1) CN107729468B (zh)

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108681564B (zh) * 2018-04-28 2021-06-29 北京京东尚科信息技术有限公司 关键词和答案的确定方法、装置和计算机可读存储介质
CN108804529A (zh) * 2018-05-02 2018-11-13 深圳智能思创科技有限公司 一种基于Web的问答系统实现方法
CN108717441B (zh) * 2018-05-16 2023-01-17 腾讯科技(深圳)有限公司 问题模板所对应的谓词的确定方法及装置
CN108932289B (zh) * 2018-05-23 2021-10-15 北京华健蓝海医疗科技有限责任公司 一种基于信息抽取和深度学习的问题回答处理方法及系统
CN109062977A (zh) * 2018-06-29 2018-12-21 厦门快商通信息技术有限公司 一种基于语义相似度的自动问答文本匹配方法、自动问答方法和系统
CN110209782B (zh) * 2018-09-25 2023-08-25 腾讯科技(深圳)有限公司 问答模型及应答语句的生成方法、装置、介质和电子设备
CN109492221B (zh) * 2018-10-31 2023-06-30 广东小天才科技有限公司 一种基于语义分析的信息回复方法及可穿戴设备
CN109918560B (zh) * 2019-01-09 2024-03-12 平安科技(深圳)有限公司 一种基于搜索引擎的问答方法和装置
CN111309878B (zh) * 2020-01-19 2023-08-22 支付宝(杭州)信息技术有限公司 检索式问答方法、模型训练方法、服务器及存储介质
CN111680135B (zh) * 2020-04-20 2023-08-25 重庆兆光科技股份有限公司 一种基于隐式知识的阅读理解方法
CN112749266B (zh) * 2021-01-19 2023-03-21 海尔数字科技(青岛)有限公司 一种工业问答方法、装置、系统、设备及存储介质
CN113076466A (zh) * 2021-02-26 2021-07-06 广东电网有限责任公司广州供电局 一种最佳答案和兴趣感知推荐方法
CN113742469B (zh) * 2021-09-03 2023-12-15 科讯嘉联信息技术有限公司 基于Pipeline处理和ES储存问答系统构建方法
CN116739003A (zh) * 2023-06-01 2023-09-12 中国南方电网有限责任公司 电网管理智能问答实现方法、装置、电子设备及存储介质
CN116886656B (zh) * 2023-09-06 2023-12-08 北京小糖科技有限责任公司 面向聊天室的舞蹈知识推送方法及其装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106503123A (zh) * 2016-10-20 2017-03-15 宁波江东大金佰汇信息技术有限公司 一种基于计算机云数据的深度学习智能应答系统
CN106649786A (zh) * 2016-12-28 2017-05-10 北京百度网讯科技有限公司 基于深度问答的答案检索方法及装置
CN106844741A (zh) * 2017-02-13 2017-06-13 哈尔滨工业大学 一种面向特定领域的问题解答方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160232441A1 (en) * 2015-02-05 2016-08-11 International Business Machines Corporation Scoring type coercion for question answering

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106503123A (zh) * 2016-10-20 2017-03-15 宁波江东大金佰汇信息技术有限公司 一种基于计算机云数据的深度学习智能应答系统
CN106649786A (zh) * 2016-12-28 2017-05-10 北京百度网讯科技有限公司 基于深度问答的答案检索方法及装置
CN106844741A (zh) * 2017-02-13 2017-06-13 哈尔滨工业大学 一种面向特定领域的问题解答方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
融合词向量的多特征问句相似度计算方法研究;曹莉丽等;《现代计算机(专业版)》;20170615(第17期);第55-59页 *
面向健康问答社区的语义检索技术研究与分析;范桥青等;《电子技术与软件工程》;20170115(第02期);第202-204页 *
面向游戏客服场景的自动问答系统研究与实现;王丽月等;《计算机工程与应用》;20160527(第17期);第152-159页 *

Also Published As

Publication number Publication date
CN107729468A (zh) 2018-02-23

Similar Documents

Publication Publication Date Title
CN107729468B (zh) 基于深度学习的答案抽取方法及系统
CN110196901B (zh) 对话系统的构建方法、装置、计算机设备和存储介质
CN110765257B (zh) 一种知识图谱驱动型的法律智能咨询系统
CN109189942B (zh) 一种专利数据知识图谱的构建方法及装置
CN106649818B (zh) 应用搜索意图的识别方法、装置、应用搜索方法和服务器
CN106570708B (zh) 一种智能客服知识库的管理方法及系统
CN108304372B (zh) 实体提取方法和装置、计算机设备和存储介质
CN107480143B (zh) 基于上下文相关性的对话话题分割方法和系统
US20150074112A1 (en) Multimedia Question Answering System and Method
CN111105209B (zh) 适用于人岗匹配推荐系统的职位简历匹配方法及装置
CN110188197B (zh) 一种用于标注平台的主动学习方法及装置
CN111783518A (zh) 训练样本生成方法、装置、电子设备及可读存储介质
CN111104526A (zh) 一种基于关键词语义的金融标签提取方法及系统
CN113505200B (zh) 一种结合文档关键信息的句子级中文事件检测的方法
CN112463944B (zh) 一种基于多模型融合的检索式智能问答方法及装置
CN110377695B (zh) 一种舆情主题数据聚类方法、装置及存储介质
CN112131876A (zh) 一种基于相似度确定标准问题的方法及系统
CN110717041A (zh) 一种案件检索方法及系统
CN112256845A (zh) 意图识别方法、装置、电子设备和计算机可读存储介质
CN110781204A (zh) 目标对象的标识信息确定方法、装置、设备及存储介质
CN116244445B (zh) 航空文本数据标注方法及其标注系统
CN115713072A (zh) 一种基于提示学习和上下文感知的关系类别推断系统及方法
CN111930937A (zh) 基于bert的智慧政务文本多分类方法及系统
CN110362828B (zh) 网络资讯风险识别方法及系统
CN114282513A (zh) 文本语义相似度的匹配方法、系统、智能终端及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20191217

Termination date: 20201012